Workflow
AI Music
icon
搜索文档
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
36氪· 2025-10-27 10:41
OpenAI进军AI音乐市场 - OpenAI正在筹备AI音乐生成项目,并与茱莉亚学院合作进行乐谱标注以训练模型[4] - 新音乐模型未来可能整合进Sora 2视频生成模型,为用户视频自动生成背景音乐或添加乐器伴奏[4] - OpenAI探索AI音乐的To B市场,广告行业是清晰赛道,可用于构思歌词、创作广告歌曲或风格模仿[4] AI音乐市场竞争格局 - 当前AI音乐生成市场竞争分散,前十大平台合计仅占约24%市场份额,头部效应不明显[6] - 主要初创公司包括Suno(主打人人可创作音乐)和Udio(偏向专业用户),市场定位不同[6] - 科技巨头纷纷布局:谷歌推出Lyria模型,字节跳动、阿里、腾讯等国内公司也在慢慢布局[6] Suno AI的商业模式与财务表现 - Suno AI凭借订阅模式实现年经常性收入(ARR)1.5亿美元,同比增长近四倍[8] - 公司毛利率超过60%,在AI领域属于罕见的高利润水平[8] - 音频模型相比大语言模型更"轻"且成本更低,但市场潜在规模和用户付费意愿不差[8] OpenAI的音乐技术积累与战略动机 - OpenAI早在2019年就推出音乐生成模型MuseNet,2020年推出带人声的Jukebox模型[7] - 公司近期频繁推出新产品(如Atlas浏览器、Sora 2),音乐是产品矩阵的新维度[8] - 战略动机是在AGI路径受阻后,推出更多能落地赚钱的产品来抵消庞大算力开支[7] 行业影响与潜在问题 - OpenAI进入将彻底引爆AI音乐赛道竞争,加速创新并为消费者提供更多选择[6] - AI音乐生成技术引发音乐人版权担忧,Suno与Udio的崛起已侵害不少音乐人权益[2] - 事件引发对AI应用公司壁垒的思考:通用模型公司进入特定领域后初创公司优势何在[8]
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
量子位· 2025-10-26 12:01
OpenAI进军AI音乐的战略动向 - OpenAI已与茱莉亚学院合作进行乐谱标注,旨在利用先进模型创作高质量音乐内容[6][7] - 新产品未来可能整合进Sora 2视频生成模型,实现视频BGM自动生成及人声轨道伴奏添加[7] - OpenAI正探索AI音乐的To B市场,广告行业是最清晰赛道,可用于构思歌词、创作广告歌曲及视频风格模仿[8][9] AI音乐行业竞争格局 - 当前AI音乐生成赛道头部效应不明显,前十大平台合计市场份额约24%[12] - 主要初创公司包括估值20亿美元的Suno(主打人人可创作音乐)和Udio(偏向专业用户)[12][13] - 科技巨头已纷纷布局:谷歌推出Lyria模型,字节跳动、阿里、腾讯等国内公司也在逐步进入市场[16][17] AI音乐商业模式与技术特性 - Suno凭借订阅模式实现年经常性收入1.5亿美元,同比增长近四倍,毛利率超过60%[29][30] - 音频模型相比大语言模型更轻量且成本更低,但市场潜在规模和用户付费意愿不逊于语言模型[32][33] - OpenAI此次举动是商业驱动,旨在通过可落地产品抵消算力开支,而非单纯技术探索[26][34] 历史技术积累与行业影响 - OpenAI早在2019年就推出音乐模型MuseNet(支持10种乐器),2020年推出带人声的Jukebox模型[22][24] - 巨头入场将加速行业创新步伐,消费者可获得更多选择并从中受益[19][20] - 该事件引发对AI应用公司壁垒的思考:通用模型公司进入垂直领域后初创公司的生存空间[35][36]
AI音乐的“野蛮”时代,要结束了
36氪· 2025-10-21 20:34
AI音乐行业融资与估值 - AI音乐创业公司Suno正在谈判筹集超过1亿美元资金,估值将超过20亿美元,较之前翻了两番 [1] - Suno目前每年产生的经常性收入超过1亿美元 [1] - AI语音巨头ElevenLabs获得英伟达的战略投资 [1] 主要公司技术进展 - Suno发布史上最强大模型V5,带来音质飞跃并提供前所未有的创作控制 [6] - Suno推出首个数字音频工作站Suno Studio,包含生成与现有音频轨道相匹配音乐元素的功能 [6] - Udio推出新型可视化编辑工作站Sessions,允许移动、扩展或替换歌曲不同部分 [4] - ElevenLabs推出极简路线的AI音乐产品Eleven Music,主界面只有一个输入框,操作完全对话式 [10] - 国内趣丸科技推出国内首个对话式音乐创作Agent"Tunee"并开启全球公测 [8] 技术范式变革 - Suno Studio颠覆传统数字音频工作站逻辑,用户仅需"框选-输入-播放",AI自动根据调性、BPM、情绪补全乐段 [8] - 新技术让用户哼唱旋律即可变成真正乐器演奏,将技术门槛降为零 [8] - AI音乐从一次性生成转变为可循环修改与重组的过程 [6] - Suno和Udio的更新让AI音乐真正融入工作流,把创作核心拉回到创意决策和审美把控 [8] 版权诉讼升级 - Anthropic与作家群体达成15亿美元版权诉讼和解协议,刷新AI领域版权纠纷纪录 [15] - 三大唱片及独立音乐人升级对Suno与Udio的侵权诉讼 [3] - 诉讼指控Suno蓄意规避YouTube技术保护措施,非法下载并复制受版权保护音乐作品用于模型训练 [17] - Suno早期投资人言论几乎直接证实公司在版权问题上的有意规避 [19] - Udio被指控蓄意破解技术保护措施,平台生成音乐存在与经典歌曲高度相似的旋律片段 [19] 行业合作与监管 - Spotify宣布与三大唱片、Merlin、Believe合作开发负责任且艺术家优先的AI音乐产品 [1] - Eleven Music已与独立音乐组织Merlin和版权商Kobalt达成授权协议 [12] - 环球音乐和华纳音乐与包括Suno在内的AI音乐公司达成了许可协议 [23] - Spotify过去一年删除超过7500万首"垃圾曲目" [23] - Spotify推出三项新政策强化对AI内容的监管,包括要求提供AI使用披露信息 [25] 行业生态重构 - AI正在重新分配音乐领域的权力,重塑从内容创作到艺人经纪的每个环节 [28] - 音乐生产方式与底层逻辑被彻底改写,职业经理人需要为艺人守护新型权利如声音肖像权、AI训练使用权等 [28] - 集体管理组织面临变革压力,需要积极维权、精简运营、拓展业务边界 [30] - 技术改变艺术生产方式,音乐不再是少数人的游戏,权力天平向善于拥抱技术的玩家倾斜 [30]
程序员用AI写歌还赚钱了,用AI 批量生产“爆款”,这个副业“杀疯了”?
36氪· 2025-10-17 13:49
AI音乐创作的市场表现与用户接受度 - 2024年1月,由AI生成的《奥奇坎竟是我自己》在B站获得近640万播放量,被评价为对人工剪辑的“碾压”[1] - 2024年3月,AI创作的《七天爱人》在网易云音乐播放量迅速突破200万次,评论超4600条,并跻身主流榜单,其版权以数万元价格售出,实现了商业突破[1] - 截至2023年,AI已生成超过一亿首乐曲,业界预计AI音乐市场收益将在2026年达到70亿美元,到2030年将占据50%的音乐市场份额[4] - 有Spotify月听众超百万的乐队被曝其音乐由Suno等AI工具制作,显示AI音乐已达到以假乱真的水平[2] 创作者对AI工具的态度演变与应用模式 - 创作者态度从2023年的担忧排斥,转变为2024年将AI作为助手和灵感来源,再到当前务实讨论“如何用好AI”[4] - 专业创作者将自身定位为“总监”,AI技术可解决80%的工作,人类负责10%的错漏修正和10%的画龙点睛[5] - AI的核心价值是“补位”:帮助普通人实现创作,无需学习乐理;为专业创作者提升效率,而非取代[5] - 创作模式是通过定义“美”、不断反馈迭代、个性化记忆和设置创作边界来引导模型[5] AI音乐的技术发展现状与挑战 - 当前AI音频已可取代中低端和标准化需求的传统音频制作,但在情感叙事、高端真人感、互动和实时性上仍有优化空间[5] - Suno公司采用Transformer架构,其竞争优势在于音频表征创新,例如如何对音频进行“分词”[6] - 生成速度是关键指标,用户体验显示10秒的延迟比8秒差,会影响用户好感度[6] - 音乐生成是主观的,模型需具备“好品味”,当前技术方向类似基于人类反馈的强化学习,但未来方法可能不同[9] 未来工具平台的发展方向 - 未来将出现“AI创作操作系统”或全能平台,特征包括统一的工作空间(文本、图像、音频、视频无缝切换)和具备全局理解与任务协作能力的Agent[6] - 工具链的核心是Agent构成的自动化工作流,需集成优质AI能力,优化工具流与工作流以降低成本和简化流程[7] - GPU开销是主要成本项,厂商预期将持续投入更多GPU进行高质量研究和技​术迭代[7] 人类创作者的核心壁垒与未来趋势 - 人类创作者的壁垒在于“道”,即如何理解世界、解构问题以及表达独一份的生活感悟,而非“术”的技法[9] - 未来趋势是“品味比技能更重要”,能从海量AI内容中筛选出好作品、具备良好判断力的人将更受认可[9] - 当前AI工具能为普通人生成“60分水平”的合格作品,但难以实现创新性词曲创造和复杂多曲风节拍设计[9] - 有观点期望AI能从底层真正“理解”音乐,从而创造全新音乐形式,而非仅基于版权音乐进行修改训练[10]
程序员用AI写歌还赚钱了!用AI 批量生产“爆款”,这个副业“杀疯了”?
AI前线· 2025-10-17 11:39
AI音乐创作的发展现状 - AI参与创作的作品频繁出圈,例如原神玩家使用Suno作曲的《奥奇坎竟是我自己》在B站获得近640万播放量[2] - 程序员Yapie使用DeepSeek和Make Best Music工具创作的《七天爱人》上线网易云音乐后播放量迅速突破200万次,评论超4600条,并跻身主流榜单[3] - 该歌曲版权卖出数万元,实现了商业突破,为大众AI音乐变现带来启发[3] - 截至2023年,AI已生成超过一亿首乐曲,预计AI音乐市场收益将在2026年达到70亿美元,到2030年将占据50%的音乐市场份额[9] 创作者对AI态度的转变 - 创作者对AI的态度从2023年的担心被替代、充满不屑排斥,转变为2024年将AI作为助手和灵感来源,如今已不再争论"用不用"而是讨论"怎么用好AI"[8] - 网友Chaosprint表示,早期AI音乐音质较"糊",但现在扩散模型推动音质改善,人声合成和转换变得更为实用[6][7] - 当前AI创作工具已能生成"60分水平"的合格作品,保证有个人特色并满足基础创作需求[16] AI在音乐创作中的角色定位 - AI是执行者,人类负责定义问题与目标,通过不断反馈迭代、个性化记忆和设置创作边界来引导模型[10] - 技术能解决80%的工作,人类解决10%的错漏和10%的画龙点睛[10] - AI当前的核心价值是"补位":帮助普通人实现创作无需学习乐理,对专业创作者则是提升效率而非取代[10] - AI让创作大量内容变得容易,未来音乐创作趋势是"品味比技能更重要",能从海量内容中筛选好作品的人将更受认可[16] AI音乐技术进展与挑战 - 早期AI创作规则简单输出粗糙,如今大模型基于文本就能深刻理解情感与语义关系并生成完整音乐作品[11] - Suno采用Transformer架构,其竞争优势在于音频表征创新而非模型架构创新[11] - 生成速度是重要指标,10秒延迟比8秒差,会影响用户体验[12] - AI音乐在情感叙事、高端真人感、互动和实时方面还有优化空间,难以实现创新性词曲创造和复杂多曲风节拍设计[11][16] 未来发展方向 - 未来将出现"AI创作操作系统"或全能平台,特征包括统一创作者工作空间和全局理解与任务协作[12][15] - 工具提供方需要集成优质AI能力,优化工具流与工作流,降低成本,让创作流程简单高效[12] - GPU开销是很大支出项,厂商们希望GPU价格下降但大概率会使用更多GPU以持续进行高质量研究和技术迭代[13] - 人类创作者的壁垒在于"道"而非"术",包括如何理解世界、解构问题以及表达独特的生活感悟[15]
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 21:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
ZPedia|中国AI再出王炸!全球首个音乐推理大模型MurekaO1上线,硅谷彻底碎了?
Z Finance· 2025-03-26 17:14
中国AI音乐产业突破 - 2025年第一季度中国AI产业实现"三连跳"技术突破,包括DeepSeek开源大模型、Manus智能体协作范式、Mureka音乐生成平台 [1] - Mureka为全球首个开放API及模型微调功能的AI音乐生成平台,支持开发者集成和普通用户无门槛创作 [1] - AI生成音乐行业年复合增长率达16.3%,Mureka瞄准全球540亿美元音乐产业市场 [1] - Mureka构建了覆盖创作、生产、商业化的完整生态链,领先于仅优化单曲生成的Suno [1] Mureka核心技术能力 - 发布Mureka V6和O1两款革命性音乐大模型,V6采用ICL技术提升声场表现,O1引入COT技术实现思维链创作 [3] - 支持10种语言的歌词与音乐生成,涵盖多种风格流派 [3] - 具备场景化BGM生产功能,输入描述性Prompt即可生成契合场景的音乐 [4] - 提供音轨分离下载功能,支持人声、伴奏等多轨输出 [5] - 行业领先的音色克隆技术,可精准模拟歌手音色 [6] - 具备跨语言改编功能,保留原曲旋律生成不同语言版本 [7] 产品性能表现 - 在古典、流行、摇滚、电子等多种音乐风格中表现优异,人声自然无AI痕迹 [8] - 高级模式支持精细创作控制,可进行风格模仿和自定义歌词 [9] - 在专业评测中,Mureka O1在乐器多样性、配器设计、音质清晰度等方面优于Suno V4 [11] - 客观测试显示Mureka O1唱词错误率9.12%,显著低于Suno V4的36.6% [13] - 乐段一致性达84.01%,内容可用价值评分8.029,均领先竞品 [13] 应用场景拓展 - 普通用户可通过语义联想实现"文字转旋律"的直觉创作 [14] - 职业音乐人可利用风格迁移引擎探索传统与现代融合,1小时内批量生成高质量DEMO [16] - 音色还原技术可"复活"已故歌手音色,实现跨时空合唱 [16] - 企业可通过关键词生成多样化广告神曲,开发者可集成API实现实时BGM生成 [16] 技术突破与创新 - 采用MusiCoT技术实现"生成-批判-优化"思维链机制,专业音乐人认可度达73% [22] - 全民音色库技术实现98.7%频谱还原度,10秒语音样本即可克隆音色 [22] - BGM版权解决方案使场景化指令生成音乐100%规避版权争议 [22] - 基于CLAP架构实现无需人工标注的高效扩展,提升生成音乐可解释性 [23] 行业影响与全球化布局 - Mureka的API接口、模型协议、音色库正成为AI时代音乐产业新基建 [2] - 预测未来三年90%的TikTok神曲可能由AI生成,中国平台或主导音乐革命 [25] - 中国AI通过"开放创新+垂直应用"模式推动技术民主化进程 [25] - 中国公司以实际成果证明技术无国界,重新定义全球创新版图 [26]
Z Potentials|郭靖,千万美金ARR的AI音乐破局者,ACE Studio如何让15位格莱美得主抛弃$500时薪歌手?
Z Potentials· 2025-02-26 11:12
从乐队主唱到AI音乐创业者 - 创始人郭靖(Joe)大学时期组建乐队并创作原创歌曲,但因音乐制作工具过于复杂导致作品无法发布[2] - 2015-2016年Gap Year期间自学编程、机器学习等技术,在硅谷Draper University接触Elon Musk等投资者[3] - 2017年首次创业做Chatbot项目失败后,意识到音乐创作困难源于工具而非人,2019年创立ACE Studio[4] - 公司核心理念是"去工具化",认为技术应服务于人的创造力和情感表达[6][15] 产品演进与商业模式 - 最初推出ACE虚拟歌姬APP,2022年底因监管下架后转型为专业生产力工具ACE Studio[4] - 产品核心功能是"Text to Singing Voice",解决专业音乐人获取歌声的行业痛点[2][18] - 定价策略采用199-264美元年卡模式,经A/B测试验证符合用户消费习惯[26] - 收入从2023年10月的5万美元/月增长至2024年2月的80万美元/月[5][21] 技术架构与产品差异化 - 自主研发5B参数可控模型,支持多语言(英/西/日/中文)和多种音乐类型[19][27] - 与Suno的差异化在于更专注专业创作者(ToP),提供完整音乐创作平台而非单纯生成[28] - 技术栈结合歌声合成与Text-to-music功能,采用ControlNet控制音轨生成[27] - 计划构建类似Canva的模板生态,形成网络效应和社区壁垒[32] 出海战略与增长方法论 - 2024年1月通过NAMM音乐展接触15位格莱美得主,打开海外专业市场[21] - 加入HF0孵化器后系统化KOL触达SOP,将回复率提升至10%[23] - 出海成功关键在于"先搞了再说"的极致执行力,包括快速申请HF0和参展[24] - 海外市场TAM远超国内,Spotify 2000万用户vs网易云60万[21] 行业洞察与未来规划 - 对标Capcut在视频行业的成功,认为音乐创作工具可将用户规模扩大10-100倍[25] - 长期愿景是"Reinvent how people create music",通过Human-in-the-Loop方式降低创作门槛[30] - 计划构建平台化产品,支持第三方模型插件集成,类似Comfy UI/Krea[31] - 期待LLMs在音乐理解和乐理方面的突破,将强化模型Fine-tuning能力[34]