Workflow
Eleven Music
icon
搜索文档
红杉中国领投 Genspark 估值 10 亿美金,又一华人语音 AI ARR 超 5000 万美金
投资实习所· 2025-10-26 18:19
Genspark融资与运营表现 - 公司正在进行新一轮融资,Forbes报道融资金额可能超过2亿美元,估值在10亿美元以上,潜在投资人包括日本的LG Technology Ventures和SBI Investment [1] - The Information报道红杉中国领投此轮融资,金额约2亿美元,估值约10亿美元,这或表明地缘政治影响可能不及预期严重 [1] - 公司产品Genspark Agent推出9天后年度经常性收入突破1000万美元,截至9月30日ARR已超过5000万美元,过去三个月收入环比增长约20% [1] - 公司第一个月的付费留存率在88%到92%之间,今年第二季度净现金消耗低于100万美元 [1] Genspark产品策略与发布 - 公司产品节奏迅速,过去两个月内推出了六款主要产品:Genspark Photo Genius、内置免费AI的AI浏览器、Clip Genius、AI Designer、AI Developer和AI Meeting Notes [2] - 产品策略是将市场上热门的垂直领域功能化后,以功能产品形态集成到Genspark平台中 [2] - 公司最新推出了首个定制Super Agent和Super Agent Store,用户可通过自然语言描述需求,系统自动配置AI架构、选择模型并微调,在几分钟内生成功能齐全的专业级AI Agent [2] - Agent Store类似于应用商店,用于分享和发现定制化AI Agent,公司据称正在准备推出一款面向企业级的产品 [5] 语音与音乐AI行业动态 - 音乐AI公司Suno的ARR已接近1.5亿美元 [5] - OpenAI据称正在开发可根据文本和音频提示生成音乐的新工具,可能与茱莉亚学院学生合作提供训练数据,但推出时间和形式尚未明确 [5] - 语音AI公司ElevenLabs的ARR到今年底可能突破3亿美元,其上个月估值达到66亿美元时公开的ARR数据为2亿美元 [6] - ElevenLabs的增长主要来自企业市场,企业收入在过去一年增长200%以上,企业和自助服务客户收入比例接近50/50,客户包括Cisco、Epic Games、Adobe和NVIDIA等大公司 [6] - ElevenLabs近期推出了用于对话式AI的Agent平台、富有表现力的Eleven v3文本转语音模型,以及用于AI生成录音室级音乐的Eleven Music产品 [6] - 在类似ElevenLabs的领域,近期有两个产品增长迅速,其核心创始人都是华人,其中一个规模较小,另一个ARR已超过5000万美元,过去两年收入增长了10倍,且核心面向大型企业级B端市场 [7]
AI音乐的“野蛮”时代,要结束了
36氪· 2025-10-21 20:34
AI音乐行业融资与估值 - AI音乐创业公司Suno正在谈判筹集超过1亿美元资金,估值将超过20亿美元,较之前翻了两番 [1] - Suno目前每年产生的经常性收入超过1亿美元 [1] - AI语音巨头ElevenLabs获得英伟达的战略投资 [1] 主要公司技术进展 - Suno发布史上最强大模型V5,带来音质飞跃并提供前所未有的创作控制 [6] - Suno推出首个数字音频工作站Suno Studio,包含生成与现有音频轨道相匹配音乐元素的功能 [6] - Udio推出新型可视化编辑工作站Sessions,允许移动、扩展或替换歌曲不同部分 [4] - ElevenLabs推出极简路线的AI音乐产品Eleven Music,主界面只有一个输入框,操作完全对话式 [10] - 国内趣丸科技推出国内首个对话式音乐创作Agent"Tunee"并开启全球公测 [8] 技术范式变革 - Suno Studio颠覆传统数字音频工作站逻辑,用户仅需"框选-输入-播放",AI自动根据调性、BPM、情绪补全乐段 [8] - 新技术让用户哼唱旋律即可变成真正乐器演奏,将技术门槛降为零 [8] - AI音乐从一次性生成转变为可循环修改与重组的过程 [6] - Suno和Udio的更新让AI音乐真正融入工作流,把创作核心拉回到创意决策和审美把控 [8] 版权诉讼升级 - Anthropic与作家群体达成15亿美元版权诉讼和解协议,刷新AI领域版权纠纷纪录 [15] - 三大唱片及独立音乐人升级对Suno与Udio的侵权诉讼 [3] - 诉讼指控Suno蓄意规避YouTube技术保护措施,非法下载并复制受版权保护音乐作品用于模型训练 [17] - Suno早期投资人言论几乎直接证实公司在版权问题上的有意规避 [19] - Udio被指控蓄意破解技术保护措施,平台生成音乐存在与经典歌曲高度相似的旋律片段 [19] 行业合作与监管 - Spotify宣布与三大唱片、Merlin、Believe合作开发负责任且艺术家优先的AI音乐产品 [1] - Eleven Music已与独立音乐组织Merlin和版权商Kobalt达成授权协议 [12] - 环球音乐和华纳音乐与包括Suno在内的AI音乐公司达成了许可协议 [23] - Spotify过去一年删除超过7500万首"垃圾曲目" [23] - Spotify推出三项新政策强化对AI内容的监管,包括要求提供AI使用披露信息 [25] 行业生态重构 - AI正在重新分配音乐领域的权力,重塑从内容创作到艺人经纪的每个环节 [28] - 音乐生产方式与底层逻辑被彻底改写,职业经理人需要为艺人守护新型权利如声音肖像权、AI训练使用权等 [28] - 集体管理组织面临变革压力,需要积极维权、精简运营、拓展业务边界 [30] - 技术改变艺术生产方式,音乐不再是少数人的游戏,权力天平向善于拥抱技术的玩家倾斜 [30]
AI颠覆文娱?互联网大平台率先受益,“体验式”、“体育”资产价值凸显
智通财经网· 2025-09-23 06:58
生成式AI加速渗透娱乐传媒行业 - 生成式AI正在快速改变娱乐传媒行业 成为现实而非未来概念 [1] - Netflix、Spotify、Meta和谷歌等大型科技媒体公司通过AI驱动的个性化推荐、内容成本优化和广告变现效率提升 展现出明确的中期增长前景 [1] - AI在内容创作领域应用日益深化 从OpenAI支持的AI动画电影到Netflix利用AI技术降低视效成本 预示着生产效率革命 [1] 内容创作成本与效率变革 - AI正从根本上改变内容创作的成本结构和生产模式 主要体现在创新和提效两个层面 [5] - 大型媒体公司有望将整体节目制作费用降低约10% 其中原创剧本内容的制作成本(通常占总开支一半)有望实现10-30%的效率提升 [5] - AMC Networks与AI公司Runway合作实现"增量生产节省" Netflix利用AI技术为阿根廷剧集《El Eternaut》制作特效 将高成本效果应用于小成本剧集 [5] - OpenAI支持的首部AI制作动画长片《Critterz》目标预算不足3000万美元 制作周期仅为9个月 远低于传统动画电影上亿美元预算和数年制作时间 [7] - 亚马逊的Alexa基金投资Showrunner平台 用户可通过文本提示生成动画剧集 [7] - 音乐制作成本持续大幅下降 AI工具如ElevenLabs的Eleven Music可直接从文本生成包含人声和乐器的完整歌曲 [7] - Spotify平台曲目数量远超1亿首 Deezer报告显示每日新曲目中近30%完全由AI生成 其中70%播放行为被判定为骗取版税的欺诈行为 [7] 体验式与体育资产价值凸显 - 在AI导致数字内容极大丰富的时代 无法被轻易复制和生成的资产愈发珍贵 [9] - 当AI为消费者提供定制化个人数字体验时 人们对真实世界中共享、鲜活的公共体验需求将会增加 [10] - 拥有主题公园和度假村的迪士尼以及全球最大现场音乐娱乐公司Live Nation等体验式资产公司将受益 [4][10] - 全球性顶级体育赛事IP因其稀缺性、直播性和不可预测性 在"注意力经济"中的价值将进一步提升 [10] - 技术进步打破体育内容地域限制 为一级方程式赛车集团和拥有UFC的TKO Group Holdings等全球体育资产持有者创造有利条件 [10] 版权保护与劳资关系挑战 - 版权纠纷和劳资关系紧张成为AI在娱乐行业广泛应用前必须解决的关键难题 [11] - 传统媒体公司首要任务是保护知识产权 华纳兄弟、迪士尼和环球影业已对AI公司Midjourney提起诉讼 指控未经授权使用经典IP角色训练AI模型 [11] - AI公司Anthropic与图书出版商达成1.5亿美元和解案 为行业敲响法律风险警钟 [11] - Netflix发布首份《AI使用指南》 要求合作方在使用AI时必须申报 并进行严格的法律和道德审查 [11] - AI在2023年好莱坞大罢工中已是核心议题 随着2026年新一轮劳资合同谈判临近 AI对编剧、演员等创意岗位的影响和权益保障将成为各方博弈焦点 [11]
AI颠覆文娱?大摩:互联网大平台率先受益,“体验式”、“体育”资产价值凸显
美股IPO· 2025-09-23 06:31
AI对娱乐传媒行业的成本与效率影响 - 大型媒体公司利用AI优化内容推荐、降低制作成本和提升广告效率,预计可将节目制作费用降低约10% [1] - AI在内容创作领域的应用深化,从AI动画电影到利用AI技术降低视效成本,预示着生产效率的革命 [2] - 原创剧本内容的制作成本(通常占总开支一半)有望实现10-30%的效率提升 [7] - AMC Networks与AI公司Runway合作,利用其工具实现了增量生产节省 [7] - Netflix利用AI技术为阿根廷剧集《El Eternaut》制作特效,将高昂效果应用于小成本剧集 [8] - AI动画长片《Critterz》目标预算不足3000万美元,制作周期仅为9个月,远低于传统动画电影上亿美元预算和数年制作时间 [10] - 亚马逊的Alexa基金投资了Showrunner平台,用户可通过文本提示生成动画剧集 [10] - AI工具如ElevenLabs的Eleven Music可以直接从文本生成包含人声和乐器的完整歌曲,导致音乐制作成本持续大幅下降 [10] AI驱动的独特资产价值重估 - 无法被AI复制的体验式资产,如主题公园和现场娱乐,以及稀缺的顶级体育赛事版权,其价值将进一步凸显 [1] - 当AI提供定制化个人数字体验时,人们对真实世界中共享、鲜活的公共体验的需求将会增加 [12] - 全球性的顶级体育赛事IP因其稀缺性、直播性和不可预测性,在注意力经济中的价值将进一步提升 [12] - 技术进步正在打破体育内容的地域限制,为全球体育资产持有者创造了有利条件 [12] - 拥有主题公园和度假村的迪士尼以及全球最大的现场音乐娱乐公司Live Nation将受益于体验式资产趋势 [4][12] - 一级方程式赛车集团和拥有UFC的TKO Group Holdings等全球体育资产持有者将更具吸引力 [4][12] AI引发的行业挑战与应对 - 传统影视公司和音乐厂牌面临双重任务:必须捍卫其知识产权价值,并利用AI提升内容创作效率和全球分发能力 [6] - 保护知识产权是传统媒体公司的首要任务,华纳兄弟、迪士尼和环球影业已对AI公司Midjourney提起诉讼,指控其未经授权使用经典IP角色训练模型 [13] - AI公司Anthropic近期与图书出版商达成的1.5亿美元和解案,为行业敲响了法律风险警钟 [13] - Netflix发布了首份面向制作伙伴的《AI使用指南》,要求合作方在内容制作中使用AI时必须申报,并进行严格的法律和道德审查 [13] - AI在2023年好莱坞大罢工中已是核心议题,随着2026年新一轮劳资合同谈判的临近,AI对创意岗位的影响和权益保障将成为博弈焦点 [13] AI导致的内容生态变化 - AI生成内容导致内容量激增,Spotify平台上的曲目数量已远超1亿首 [10] - 音乐平台Deezer报告称,其每日收到的新曲目中近30%是完全由AI生成的,其中70%的播放行为被判定为旨在骗取版税的欺诈行为 [10]
七款AI写歌工具横评:从年会BGM到模仿周杰伦,谁能唱出未来?
锦秋集· 2025-08-19 23:55
AI音乐生成行业现状 - 自2023年底Suno推出首个"文本生成完整歌曲"产品以来,Udio、Stable Audio等平台相继上线,推动AI音乐创作领域快速迭代 [3] - 行业呈现功能定位分化趋势,国际大模型公司、生成式AI创企与中国科技企业均在布局,包括Suno(估值33亿美元B轮)、Udio(融资1000万美元种子轮)、字节跳动"海绵音乐"、腾讯"TME Studio"等 [6][7] - 主流产品支持多语言多风格生成,版权模式分为订阅用户享有版权、用户与平台共享版权等类型,二次编辑功能差异显著 [7][8] 核心测评维度与方法论 - 测评聚焦7款产品在5类场景的表现:年会BGM、冥想音乐、恐怖片配乐、R&B改编、歌手风格模仿,考察生成速度、成本、歌词匹配、中文发音等量化指标 [4][9] - 测试采用默认设置还原普通用户真实体验,对部分平台受限prompt使用GPT-4o进行语义等效重写以保证公平性 [10] - 高级功能评估侧重段落编辑、Loop化、MIDI导出等对普通用户体验的提升效果 [4] 产品能力矩阵与场景适配性 背景音乐生成 - Suno和ElevenLabs在商业年会场景表现最佳,但缺乏Loop化输出功能 [13] - ElevenLabs、Udio与Suno在冥想音乐场景适配度高,多数平台尚不支持自然环境音参数控制 [17] - 悬疑恐怖片配乐场景中Suno沉浸感最强,Udio节奏更强烈适合短视频,TME Studio/海绵音乐偏娱乐向 [18] 流行歌曲创作 - R&B改编任务中Suno结构意识突出,Mureka唱功最佳,海绵音乐中文咬字准确 [28] - 周杰伦风格模仿测试显示技术瓶颈明显,无产品能完整复刻其作曲逻辑与文化语境 [32] - Mureka人声表现力测评最优,海绵音乐呈现抖音网红唱法特征 [35] 技术分化与未来趋势 - 产品分化明显:Suno定位全能型,ElevenLabs侧重结构可视化,Mureka专注歌词/人声,海绵音乐强化中文流行,TME Studio主打辅助工具集 [37] - 未来将沿两条路径发展:工具化模块服务专业创作者,低门槛生成满足大众配乐需求 [40] - 技术演进方向包括分工协作模式、风格版权合规、嵌入式场景落地、跨模态prompt语言等 [41][42][43][44] 商业化应用潜力 - 当前AI音乐最成熟落地场景为配乐生成与流行歌曲创作,风格模仿仍存技术瓶颈 [33] - 非专业用户可通过低门槛路径生成结构完整作品,中文场景中Mureka/海绵音乐优势显著 [38] - 专业场景中Udio/Suno等提供区段编辑与参考音频上传功能,TME Studio支持MIR识别等辅助分析 [39]
腾讯研究院AI速递 20250807
腾讯研究院· 2025-08-07 00:01
生成式AI - Anthropic发布Claude Opus 4 1,提升Agent代理任务、真实世界编码和推理能力,在SWE-bench Verified基准测试中达到74 5%,相比Opus 4提升2个百分点,大幅领先GPT-4 1(54 6%)[1] - OpenAI开源gpt-oss-120b和gpt-oss-20b两款推理模型,性能与o4-mini相当,分别采用117B和21B总参数,原生支持128k上下文长度,gpt-oss-120b可在单个H100 GPU上运行[2] - 谷歌DeepMind发布Genie 3,能一句话生成动态可交互世界,以每秒20-24帧速度实时生成720p画面,支持实时交互且生成内容连贯性可维持数分钟[3] - 谷歌Gemini新增"Storybook"功能,用户简单描述情节即可自动生成10页完整图文故事书,支持多种艺术风格和个性化定制[4] AI竞赛与性能 - 首届Kaggle AI国际象棋竞赛中,Grok 4表现最佳,显示"GM级别"战术策略与速度,与Gemini 2 5 Pro一起挺进半决赛[5] - ElevenLabs发布AI音乐模型Eleven Music,能生成从流行嘻哈到管弦乐各种风格,用户可通过文本prompt精确控制音乐底层乐器、调式、和弦和节奏[6] 人形机器人 - 傅利叶发布第三代人形机器人GR-3,采用柔和淡黄配色和柔性材质,嵌入微表情系统,能通过眼球转动、眨眼和神态表情传达情绪,覆盖导览问答、儿童互动等陪伴交互场景[7] 人机交互技术 - Meta开发的非侵入性表面肌电图(sEMG)技术通过记录放大肌肉神经信号实现实时手势解码和计算机交互,在连续手势控制任务中每秒能够互动0 66次,离散手势识别准确度达89-95%[8] AI智能体发展 - LangChain CEO认为未来会从聊天模式转向"环境化/常驻"智能体,环境化智能体可主动监听事件流并异步行动,多智能体系统是趋势[9] 创业模式 - Gamma以30人团队服务近5000万用户,ARR超5000万美元,采用"球员兼教练"管理模式,招募具有主动性、强学习意愿的"通才"而非"专才"[10][11]