Stable Audio - 财报，业绩电话会，研报，新闻

Stable Audio

搜索文档

WARNER MUSIC GROUP AND STABILITY AI JOIN FORCES TO BUILD THE NEXT GENERATION OF RESPONSIBLE AI TOOLS FOR MUSIC CREATION

Prnewswire· 2025-11-20 00:00

合作公告核心 - 华纳音乐集团与Stability AI宣布合作，共同推进负责任AI在音乐创作中的应用 [1] - 合作结合华纳音乐在原则性创新方面的长期倡导与Stability AI在商业安全生成式音频领域的专业知识和领导力 [1] 合作目标与重点 - 合作将专注于开发专业级工具，使艺术家、词曲作者和制作人能够使用经过道德训练的模型进行实验、作曲和制作 [1] - 合作旨在释放新的创意表达形式，同时保护创作者权利并开辟新的收入途径 [1] - 两家公司将直接与艺术家合作，了解他们如何与新兴技术互动，从而塑造能增强其创作过程而不影响质量或艺术控制权的下一代工具 [1] 公司高层观点 - 华纳音乐集团首席数字官表示，此次合作是朝着开发负责任、对艺术家友好的AI工具迈出的重要一步，为受益于艺术家和词曲作者的道德音乐生态系统奠定基础 [2] - Stability AI首席执行官表示，华纳音乐是全球音乐和娱乐领域的领导者，此次合作深化了以艺术家为中心的理念，将通过生成式AI为艺术家开启新的创意可能性 [2] 合作方背景与优势 - Stability AI是商业安全生成式音频领域的行业领导者，其Stable Audio系列模型专为专业人士构建，并完全基于授权数据训练 [2] - 华纳音乐集团在全球70多个国家运营，旗下拥有众多知名唱片品牌，其音乐出版部门华纳查普尔音乐拥有超过100万首版权曲库 [3] - Stability AI的Stable Diffusion模型自发布以来已被下载超过3.5亿次，并被《财富》和《时代》杂志认可为AI创新者和最具影响力公司之一 [4][5] 公司近期动态 - 2024年6月，Stability AI进入新的增长阶段，任命了包括肖恩·帕克为执行主席、普雷姆·阿卡拉朱为首席执行官、詹姆斯·卡梅隆为董事会成员在内的知名领导团队 [5]

我们大胆做了个决定，大会所有音乐bgm由AI生成，这部分预算可以省了！｜Jinqiu Scan

锦秋集· 2025-11-03 16:13

大会主题与目标 - 首届CEO年度大会以“Experience with AI”为主题，探讨科技、资本与创造力在AI时代的融合[1] - 大会目标不仅是对话AI，更是构建一个让AI被理解、使用和体验的真实场域[1] AI音乐工具选型与评估 - 2025年8月对7款AI音乐生成产品进行横评，包括Suno、ElevenLabs、Udio、字节跳动“海绵音乐”、腾讯音乐娱乐集团“TME Studio”等[4] - 评估结果显示ElevenLabs、Udio与Suno是当时产出结果较好的三款产品[5] - 最终选择Suno作为大会音乐生成工具，因其被认为成功率最高[6] AI音乐制作流程与实践 - 制作流程分为嘉宾上场串场音乐和暖场音乐储备两大需求[7][8] - 由于团队不擅长音乐，首先使用ChatGPT生成精确的音乐制作Prompt[10] - 以宇树科技CEO上场音乐为例，Prompt要求兼具科技感与思辨氛围，包含细微机械呼吸声与柔和低频，节奏平稳且空间感强[11] - 暖场音乐根据议程设计分为三类风格：节奏感强的“热烈的”、温润电子氛围的“平静的”、以及弦乐渐入的“收束的”[21] - 每个暖场环节制作了10-20首音乐作为储备[20] AI音乐生成能力评估 - AI当前能做到风格模仿和结构生成，能根据“未来感”、“工业感”等关键词快速生成符合语义的音乐片段[26] - AI的局限性在于缺乏对语义的深层理解，无法把握音乐在特定场景中承担的“情绪转场”作用[26] - 音乐创作门槛降低，但情绪设计的门槛升高，需要理解场景节奏和品牌声音气质[26] 挑战与优化方向 - 主要挑战在于Prompt表达的精准度，模糊词汇如“未来感”会导致输出千篇一律[27][28] - 今年主要依赖单一模型（Suno）通过反复生成筛选最优版本[30] - 明年优化方向包括结合Suno、Udio、Mureka等多模型负责不同音乐风格或段落[30] - 未来展望包括尝试音乐与舞台效果的同步生成，以及基于现场实时情绪反馈的AI音乐生成[30]

别被骗了，好莱坞抵制AI只是烟雾弹，背后金主竟是他们自己

36氪· 2025-10-14 21:32

行业对AI技术的矛盾立场 - 好莱坞行业公开发起对OpenAI Sora 2视频生成模型的抵制活动，主要经纪公司WME、UTA和CAA均表示反对，认为其剥削创作者并威胁知识产权 [1][3][5] - 行业内部存在显著矛盾，抵制AI的同时，关键人物如CAA联合创始人迈克尔·奥维茨通过其风险投资公司Crossbeam Venture Partners投资了AI娱乐工作室Promise [6][8] - 多位好莱坞知名人士，包括导演和演员，私下积极投资AI公司，覆盖内容生成、数据分析和平台生态等多个领域，显示出对AI技术潜力的认可 [12][13] AI技术的最新进展与行业冲击 - OpenAI推出的Sora 2多模态AI视频生成模型在物理精准度、真实感和可控性上达到新高度，允许用户扫描面部并生成带有明星脸或知名IP的短片，对版权和肖像权体系构成挑战 [1][3] - AI技术已扩展到音频生成领域，例如Stability AI的Stable Audio可生成商业级音乐和音效，为影视配乐提供新工具 [17][31] 好莱坞明星的AI投资版图 - 詹姆斯·卡梅隆加入AI巨头Stability AI董事会，旨在将AI整合到视觉特效工作流程中，以降低大制作电影成本并提高效率 [15][17][45] - 阿什顿·库彻的风险投资公司Sound Ventures在五周内筹集2.43亿美元，专门投资AI创业公司，包括OpenAI、Anthropic和Stability AI等头部企业 [19][41] - 莱昂纳多·迪卡普里奥投资AI公司Qloo，该公司作为文化品味推荐引擎，通过数据分析预测消费者偏好，客户包括Netflix和环球音乐等行业巨头 [20][22][35] - 杰瑞德·莱托投资AI视频创业公司Pika和Captions，前者估值在半年内翻10倍，显示出AI赛道的高回报潜力 [24][26][43] - 西尔维斯特·史泰龙投资Largo.ai，这家公司提供AI驱动分析解决方案，帮助制片方评估项目和预测市场表现，降低投资风险 [28][30][33] - 罗素兄弟计划投入4亿美元打造AI工具，旨在降低大制作门槛，而娜塔莎·雷昂参与开发AI视频工具Moonvalley，强调使用授权数据的“干净”模式 [31][47] AI投资的驱动因素与战略考量 - AI行业的高速增长是吸引投资的关键动力，全球AI市场规模预计到2025年底突破1.3万亿美元，到2033年达到3.49万亿美元 [39] - 投资者寻求高回报，早期布局可分享技术红利，例如Pika的快速估值增长和Sound Ventures通过私募股权估值差获取收益 [41][43] - 内容创作者相信AI能服务创作，例如卡梅隆旨在提高工作效率，达伦·阿伦诺夫斯基认为技术突破能推动故事讲述方式的创新 [45] - 投资平台型AI公司（如OpenAI）是一种战略布局，旨在从技术使用者转变为规则制定者，影响未来技术方向、伦理和商业模式 [38][45][47] AI应用引发的行业争议 - AI技术的替代性引发职业替代担忧，例如阿什顿·库彻曾言论称可用AI低成本生成镜头，虽后道歉但触动行业敏感神经 [49] - 伦理争议持续，如用AI“复活”已故演员罗宾·威廉姆斯的行为遭到其女儿塞尔达·威廉姆斯的强烈抨击 [51]

Artificial Intelligence

Sora 2

Stable Diffusion

Stable Audio

Artificial Intelligence

Sora 2

Stable Diffusion

Stable Audio

七款AI写歌工具横评：从年会BGM到模仿周杰伦，谁能唱出未来？

锦秋集· 2025-08-19 23:55

AI音乐生成行业现状 - 自2023年底Suno推出首个"文本生成完整歌曲"产品以来，Udio、Stable Audio等平台相继上线，推动AI音乐创作领域快速迭代 [3] - 行业呈现功能定位分化趋势，国际大模型公司、生成式AI创企与中国科技企业均在布局，包括Suno（估值33亿美元B轮）、Udio（融资1000万美元种子轮）、字节跳动"海绵音乐"、腾讯"TME Studio"等 [6][7] - 主流产品支持多语言多风格生成，版权模式分为订阅用户享有版权、用户与平台共享版权等类型，二次编辑功能差异显著 [7][8] 核心测评维度与方法论 - 测评聚焦7款产品在5类场景的表现：年会BGM、冥想音乐、恐怖片配乐、R&B改编、歌手风格模仿，考察生成速度、成本、歌词匹配、中文发音等量化指标 [4][9] - 测试采用默认设置还原普通用户真实体验，对部分平台受限prompt使用GPT-4o进行语义等效重写以保证公平性 [10] - 高级功能评估侧重段落编辑、Loop化、MIDI导出等对普通用户体验的提升效果 [4] 产品能力矩阵与场景适配性背景音乐生成 - Suno和ElevenLabs在商业年会场景表现最佳，但缺乏Loop化输出功能 [13] - ElevenLabs、Udio与Suno在冥想音乐场景适配度高，多数平台尚不支持自然环境音参数控制 [17] - 悬疑恐怖片配乐场景中Suno沉浸感最强，Udio节奏更强烈适合短视频，TME Studio/海绵音乐偏娱乐向 [18] 流行歌曲创作 - R&B改编任务中Suno结构意识突出，Mureka唱功最佳，海绵音乐中文咬字准确 [28] - 周杰伦风格模仿测试显示技术瓶颈明显，无产品能完整复刻其作曲逻辑与文化语境 [32] - Mureka人声表现力测评最优，海绵音乐呈现抖音网红唱法特征 [35] 技术分化与未来趋势 - 产品分化明显：Suno定位全能型，ElevenLabs侧重结构可视化，Mureka专注歌词/人声，海绵音乐强化中文流行，TME Studio主打辅助工具集 [37] - 未来将沿两条路径发展：工具化模块服务专业创作者，低门槛生成满足大众配乐需求 [40] - 技术演进方向包括分工协作模式、风格版权合规、嵌入式场景落地、跨模态prompt语言等 [41][42][43][44] 商业化应用潜力 - 当前AI音乐最成熟落地场景为配乐生成与流行歌曲创作，风格模仿仍存技术瓶颈 [33] - 非专业用户可通过低门槛路径生成结构完整作品，中文场景中Mureka/海绵音乐优势显著 [38] - 专业场景中Udio/Suno等提供区段编辑与参考音频上传功能，TME Studio支持MIR识别等辅助分析 [39]