Workflow
Stable Audio
icon
搜索文档
我们大胆做了个决定,大会所有音乐bgm由AI生成,这部分预算可以省了!|Jinqiu Scan
锦秋集· 2025-11-03 16:13
大会主题与目标 - 首届CEO年度大会以“Experience with AI”为主题,探讨科技、资本与创造力在AI时代的融合[1] - 大会目标不仅是对话AI,更是构建一个让AI被理解、使用和体验的真实场域[1] AI音乐工具选型与评估 - 2025年8月对7款AI音乐生成产品进行横评,包括Suno、ElevenLabs、Udio、字节跳动“海绵音乐”、腾讯音乐娱乐集团“TME Studio”等[4] - 评估结果显示ElevenLabs、Udio与Suno是当时产出结果较好的三款产品[5] - 最终选择Suno作为大会音乐生成工具,因其被认为成功率最高[6] AI音乐制作流程与实践 - 制作流程分为嘉宾上场串场音乐和暖场音乐储备两大需求[7][8] - 由于团队不擅长音乐,首先使用ChatGPT生成精确的音乐制作Prompt[10] - 以宇树科技CEO上场音乐为例,Prompt要求兼具科技感与思辨氛围,包含细微机械呼吸声与柔和低频,节奏平稳且空间感强[11] - 暖场音乐根据议程设计分为三类风格:节奏感强的“热烈的”、温润电子氛围的“平静的”、以及弦乐渐入的“收束的”[21] - 每个暖场环节制作了10-20首音乐作为储备[20] AI音乐生成能力评估 - AI当前能做到风格模仿和结构生成,能根据“未来感”、“工业感”等关键词快速生成符合语义的音乐片段[26] - AI的局限性在于缺乏对语义的深层理解,无法把握音乐在特定场景中承担的“情绪转场”作用[26] - 音乐创作门槛降低,但情绪设计的门槛升高,需要理解场景节奏和品牌声音气质[26] 挑战与优化方向 - 主要挑战在于Prompt表达的精准度,模糊词汇如“未来感”会导致输出千篇一律[27][28] - 今年主要依赖单一模型(Suno)通过反复生成筛选最优版本[30] - 明年优化方向包括结合Suno、Udio、Mureka等多模型负责不同音乐风格或段落[30] - 未来展望包括尝试音乐与舞台效果的同步生成,以及基于现场实时情绪反馈的AI音乐生成[30]
别被骗了,好莱坞抵制AI只是烟雾弹,背后金主竟是他们自己
36氪· 2025-10-14 21:32
行业对AI技术的矛盾立场 - 好莱坞行业公开发起对OpenAI Sora 2视频生成模型的抵制活动,主要经纪公司WME、UTA和CAA均表示反对,认为其剥削创作者并威胁知识产权 [1][3][5] - 行业内部存在显著矛盾,抵制AI的同时,关键人物如CAA联合创始人迈克尔·奥维茨通过其风险投资公司Crossbeam Venture Partners投资了AI娱乐工作室Promise [6][8] - 多位好莱坞知名人士,包括导演和演员,私下积极投资AI公司,覆盖内容生成、数据分析和平台生态等多个领域,显示出对AI技术潜力的认可 [12][13] AI技术的最新进展与行业冲击 - OpenAI推出的Sora 2多模态AI视频生成模型在物理精准度、真实感和可控性上达到新高度,允许用户扫描面部并生成带有明星脸或知名IP的短片,对版权和肖像权体系构成挑战 [1][3] - AI技术已扩展到音频生成领域,例如Stability AI的Stable Audio可生成商业级音乐和音效,为影视配乐提供新工具 [17][31] 好莱坞明星的AI投资版图 - 詹姆斯·卡梅隆加入AI巨头Stability AI董事会,旨在将AI整合到视觉特效工作流程中,以降低大制作电影成本并提高效率 [15][17][45] - 阿什顿·库彻的风险投资公司Sound Ventures在五周内筹集2.43亿美元,专门投资AI创业公司,包括OpenAI、Anthropic和Stability AI等头部企业 [19][41] - 莱昂纳多·迪卡普里奥投资AI公司Qloo,该公司作为文化品味推荐引擎,通过数据分析预测消费者偏好,客户包括Netflix和环球音乐等行业巨头 [20][22][35] - 杰瑞德·莱托投资AI视频创业公司Pika和Captions,前者估值在半年内翻10倍,显示出AI赛道的高回报潜力 [24][26][43] - 西尔维斯特·史泰龙投资Largo.ai,这家公司提供AI驱动分析解决方案,帮助制片方评估项目和预测市场表现,降低投资风险 [28][30][33] - 罗素兄弟计划投入4亿美元打造AI工具,旨在降低大制作门槛,而娜塔莎·雷昂参与开发AI视频工具Moonvalley,强调使用授权数据的“干净”模式 [31][47] AI投资的驱动因素与战略考量 - AI行业的高速增长是吸引投资的关键动力,全球AI市场规模预计到2025年底突破1.3万亿美元,到2033年达到3.49万亿美元 [39] - 投资者寻求高回报,早期布局可分享技术红利,例如Pika的快速估值增长和Sound Ventures通过私募股权估值差获取收益 [41][43] - 内容创作者相信AI能服务创作,例如卡梅隆旨在提高工作效率,达伦·阿伦诺夫斯基认为技术突破能推动故事讲述方式的创新 [45] - 投资平台型AI公司(如OpenAI)是一种战略布局,旨在从技术使用者转变为规则制定者,影响未来技术方向、伦理和商业模式 [38][45][47] AI应用引发的行业争议 - AI技术的替代性引发职业替代担忧,例如阿什顿·库彻曾言论称可用AI低成本生成镜头,虽后道歉但触动行业敏感神经 [49] - 伦理争议持续,如用AI“复活”已故演员罗宾·威廉姆斯的行为遭到其女儿塞尔达·威廉姆斯的强烈抨击 [51]
七款AI写歌工具横评:从年会BGM到模仿周杰伦,谁能唱出未来?
锦秋集· 2025-08-19 23:55
AI音乐生成行业现状 - 自2023年底Suno推出首个"文本生成完整歌曲"产品以来,Udio、Stable Audio等平台相继上线,推动AI音乐创作领域快速迭代 [3] - 行业呈现功能定位分化趋势,国际大模型公司、生成式AI创企与中国科技企业均在布局,包括Suno(估值33亿美元B轮)、Udio(融资1000万美元种子轮)、字节跳动"海绵音乐"、腾讯"TME Studio"等 [6][7] - 主流产品支持多语言多风格生成,版权模式分为订阅用户享有版权、用户与平台共享版权等类型,二次编辑功能差异显著 [7][8] 核心测评维度与方法论 - 测评聚焦7款产品在5类场景的表现:年会BGM、冥想音乐、恐怖片配乐、R&B改编、歌手风格模仿,考察生成速度、成本、歌词匹配、中文发音等量化指标 [4][9] - 测试采用默认设置还原普通用户真实体验,对部分平台受限prompt使用GPT-4o进行语义等效重写以保证公平性 [10] - 高级功能评估侧重段落编辑、Loop化、MIDI导出等对普通用户体验的提升效果 [4] 产品能力矩阵与场景适配性 背景音乐生成 - Suno和ElevenLabs在商业年会场景表现最佳,但缺乏Loop化输出功能 [13] - ElevenLabs、Udio与Suno在冥想音乐场景适配度高,多数平台尚不支持自然环境音参数控制 [17] - 悬疑恐怖片配乐场景中Suno沉浸感最强,Udio节奏更强烈适合短视频,TME Studio/海绵音乐偏娱乐向 [18] 流行歌曲创作 - R&B改编任务中Suno结构意识突出,Mureka唱功最佳,海绵音乐中文咬字准确 [28] - 周杰伦风格模仿测试显示技术瓶颈明显,无产品能完整复刻其作曲逻辑与文化语境 [32] - Mureka人声表现力测评最优,海绵音乐呈现抖音网红唱法特征 [35] 技术分化与未来趋势 - 产品分化明显:Suno定位全能型,ElevenLabs侧重结构可视化,Mureka专注歌词/人声,海绵音乐强化中文流行,TME Studio主打辅助工具集 [37] - 未来将沿两条路径发展:工具化模块服务专业创作者,低门槛生成满足大众配乐需求 [40] - 技术演进方向包括分工协作模式、风格版权合规、嵌入式场景落地、跨模态prompt语言等 [41][42][43][44] 商业化应用潜力 - 当前AI音乐最成熟落地场景为配乐生成与流行歌曲创作,风格模仿仍存技术瓶颈 [33] - 非专业用户可通过低门槛路径生成结构完整作品,中文场景中Mureka/海绵音乐优势显著 [38] - 专业场景中Udio/Suno等提供区段编辑与参考音频上传功能,TME Studio支持MIR识别等辅助分析 [39]