AI Music
搜索文档
我宣布,这就是现在人声最真实的AI音乐模型。
数字生命卡兹克· 2026-01-30 10:13
文章核心观点 - 深度体验并评测了MiniMax公司最新发布的AI音乐生成模型Music 2.5,认为其在人声真实感、多语言(特别是中文)处理能力、以及风格多样性方面表现卓越,代表了AI音乐生成领域的显著进步 [4][6][15] 产品性能与体验 - **人声真实感极强**:模型生成的人声具有强烈的“人味”,能表现出如“炸音嘶吼”般的爆发力、磨砂感和颗粒感,以及自然的换气、口齿摩擦等细节,在一众AI音乐模型中表现突出 [6] - **中文处理能力突出**:模型的中文能力“无须多言”,在生成说唱(Rap)等复杂段落时咬字清晰,基本无需像使用其他模型时那样将复杂汉字替换为拼音或同音字来规避识别错误 [6][8] - **支持多语言及方言**:模型不仅能处理中文,还能生成维语歌曲(除少数连读问题外基本准确),并且支持粤语、吴语等方言 [8][9][11] - **风格与编曲能力多样**:模型能够成功生成并模仿多种音乐风格,包括但不限于R&B加Dream Pop、音乐剧、Techno电音、雷鬼等,为用户带来了丰富的创作体验 [13][14][15] 工具与使用技巧 - **搭配第三方工具提升效率**:结合使用粉丝开发的音乐分析工具(www.aimusic-tools.com),可以上传音频反推其曲风提示词,实现“1+1大于二”的效果,方便用户探索和复制各种音乐风格 [11][12][13] - **理解歌曲结构**:在MiniMax平台创作时,需要将歌词填入其提供的14种段落结构(如前奏-主歌-副歌-尾奏等)中,这是控制歌曲成形的核心 [17][20] - **提示词使用灵活**:既可以使用结构化提示词(如“风格关键词;BPM & 调式 & 节拍”)与模型沟通,也可以直接使用上述第三方工具提取的曲风提示词 [21] 商业模式与定价 - **定价具有竞争力**:付费套餐为36元人民币可获得10万积分,每生成一首歌消耗300积分,折算下来约0.1元人民币一首歌 [21] - **初始用户有福利**:新用户初始拥有10000积分,对于普通玩家而言,额外购买36元每月的10万积分套餐已基本足够使用 [21] 产品不足与未来期待 - **功能相对单一**:尽管模型能力强大,但平台功能较少,缺乏如段落编辑、上传音乐进行Remix、音轨分离等高级功能 [23] - **期待开放MCP功能**:用户希望未来能开放MCP(模型控制协议)功能,以便将写歌流程封装成可调用的技能(Skills),实现更深度的自动化集成 [23]
小心,人类音乐正在被做空
36氪· 2026-01-23 10:25
Bandcamp禁止AI音乐的核心商业逻辑 - 公司发布声明,严禁发售完全或大部分由AI生成的音乐,这并非出于艺术情怀或技术抵触,而是一场基于资产保值的理性商业防御 [1] - 公司的商业模式是服务于独立音乐人的“直销市场”,其核心竞争力在于建立音乐人与粉丝之间的高粘性情感连接,AI音乐的无差别稀释将威胁其商业地基 [4] - 公司此举实质上是代表真人创作者,向算法时代发起的一次议价权宣示,旨在防止平台内独立音乐资产价值被AI系统性做空 [4][8] AI音乐对流媒体行业版税体系的冲击 - 流媒体行业通用的“按播放量占比计费”版税分配机制,使成本不对等的人类创作与AI生成歌曲获得同等的版税单价,存在“异工同酬”的漏洞 [5] - 2024年美国司法部起诉的“迈克尔·史密斯”案揭示,当事人利用AI生成数十万首歌曲并伪装上传,通过机器人刷量获得数十亿次播放,从平台版税池中合法提取了超过约合7000万人民币(约1000万美元)的收益 [7] - 这1000万美元收益基于总池分配逻辑,是从所有真人创作者的应得收益中切分的,当AI以近乎零成本向版税池注入无限内容时,真人音乐人每次播放的价值被客观稀释 [7] AI音乐的法律确权与收益倒挂问题 - 美国版权局指南指出,完全由AI生成的作品因缺乏人类作者身份,不具备版权保护资格 [8] - 但在流媒体分发逻辑中,这些法律上属于公有领域的无版权内容,却在获取与人类版权作品同等的收益,形成了确权与收益的倒挂 [8] AI音乐对行业收入的潜在影响 - 根据CISAC和PMP Strategy的研究,到2028年,近25%的创作者收入将面临损失风险,届时损失金额可能高达40亿欧元(约325.6亿元人民币) [10] 流媒体平台对标准化/AI内容的扶持策略 - 平台为追求效率和利润率,有动力降低对头部版权内容的依赖,构建可控的低成本内容库,“类AI”的标准化内容具有高性价比 [11] - 国内案例显示,汽水音乐上一位名为“大头针”的歌手,在无露脸、无传统宣发的情况下,凭借风格统一的作品积累了120万粉丝和数以亿计的播放量,代表了功能性音乐的胜利 [11][13] - 这种“去人格化”内容策略赋予平台更强议价能力,降低对头部明星高昂预付版税的依赖,例如Spotify上AI助眠歌单和榜单渗透加剧,被戏称为“AI Slopify” [14] 用户知情权缺失与市场信任危机 - Deezer与Ipsos的调研报告显示,高达97%的受访者在盲测中无法分辨AI生成的音乐和人类创作的音乐 [17][19] - 然而,73%的用户认为区分AI和人类音乐“至关重要”,且认为平台有义务明确告知;52%的用户在得知自己没听出区别后感到“不舒服” [17][20] - 消费者排斥的是非知情状态下的被动消费,这种“信息欺诈”感表明“真实性”仍是音乐消费的核心价值 [22] - 在Deezer推进强制标识、美国立法打击声音克隆的背景下,Bandcamp的禁令实质上是为用户提供“真实性背书” [22]
汽水音乐狙击网易云音乐:以“AI野路子”的名义
36氪· 2026-01-12 10:35
汽水音乐的崛起与市场格局变化 - 汽水音乐月活跃用户达到1.2亿,同比增幅超过90%,直逼网易云音乐的1.47亿,位列行业第四 [2] - 其增长源于深度绑定抖音生态,通过短视频BGM导流和算法推荐获取用户 [4] - 与传统音乐平台依赖版权和社区的模式不同,汽水音乐采用免费听歌加广告变现的模式,并与抖音账号打通,实现站内购物等商业闭环 [15] AI音乐供给的爆发与影响 - 2025年下半年,AI生成音乐开始批量涌入热榜,例如AI歌手“大头针”翻唱的歌曲席卷BGM榜单,三个月内在汽水音乐吸粉110万,发布超过200首歌曲 [4][7] - AI音乐生成工具Suno V5版本推出的“Persona”功能解决了音色不可控的痛点,使“AI歌手”概念得以成立 [8] - AI擅长生成高频、高情绪密度的音乐片段,精准契合短视频在15秒内提供强烈情绪价值的需求,并通过抖音的流量和算法推荐迅速成为爆款 [9] 对传统音乐行业竞争逻辑的冲击 - 传统在线音乐“版权为王”的逻辑基于好音乐稀缺的前提,而AI的批量生产使版权的稀缺性贬值 [13][14][15] - 传统平台的核心收入依赖会员订阅,需持续购买昂贵独家内容,而汽水音乐的模式使其无需依赖稀缺内容,更注重流量 [15] - 汽水音乐与酷狗音乐、QQ音乐的重叠徘徊用户数分别达到2149万和2158万,同比分别大幅提升63.9%和72.9%,冲击已经发生 [22] 字节跳动的战略与行业应对 - 汽水音乐的崛起是字节跳动“无限供给加算法分发”逻辑在音乐领域的成功应用,AI将音乐生产成本趋近于零,补齐了字节在音乐赛道的供给短板 [23][26] - 腾讯音乐和网易云音乐虽在跟进AI音乐,但态度谨慎,设置了收益限制、付费门槛或签约激励等条件 [17][18] - 汽水音乐没有历史包袱,对AI音乐采取极速审核、相对宽容及明确变现路径的“纵容”态度,与版权方(如华纳、环球音乐)强调以艺术家为中心的AI辅助创作路径形成对比 [20][24] AI音乐催生的新生产与分发模式 - 音乐发行模式从传统的“人找歌”(包装歌手再推歌)转变为字节体系下的“歌找人”,算法根据视频内容标签将带特定BGM的视频推送给精准人群 [10] - 在新模式下,歌手的身份变得无关紧要,符合内容情景才是核心,这使得没有知名度的AI歌手得以生长 [11][12] - 字节跳动无需自研AI音乐模型,借助Suno等第三方工具的成熟,即可通过生态优势收割战果,绕过版权战争并改写竞争规则 [23][25]
Suno Defies Lawsuits, Nabs $250M at $2.45B Valuation for AI Music
Ventureburn· 2025-11-20 06:39
融资与估值 - 公司完成2.5亿美元C轮融资,由Menlo Ventures领投,NVentures、Hallwood Media、Lightspeed和Matrix等机构参与[1] - 此轮融资后公司估值达到24.5亿美元,较今年5月的5亿美元估值大幅增长[2] - Nvidia的风险投资部门NVentures参与本轮融资,显示出对生成式音频领域的强烈信心[9] 业务与产品发展 - 公司推出Suno Studio,将其定位为首个生成式音频工作站,融合多轨编辑与AI音轨创建功能,旨在为用户提供更多控制权、更清晰的混音和更高质量的人声[4] - 公司发布v5模型,是其最先进的模型,声称能提供更清晰的提示和更精确的结果[4] - 公司在推出Studio之前收购了首个基于浏览器的数字音频工作站WavTool,并将其技术整合至自身生态系统中,以构建更深层次的工作流程[5] - 新融资将用于推出更多专业工具,提升普通创作者的体验,扩展社交功能并支持更直观的协作[10] 用户与市场影响 - 公司声称拥有数百万用户,日活跃度很高,并认为这反映了人们在歌曲创作方式上发生了明显的文化转变[3] - 平台创作者涵盖从首次使用者到专业人士,用户使用场景包括尝试想法、制作完整曲目、与朋友分享歌曲以及作为艺术家发布作品[6] - 公司表示已有近1亿人使用其工具,视此为重要文化时刻的证据,并相信AI将改变人们对创造力的定义[11] 法律环境与行业前景 - 公司面临索尼、环球音乐集团和华纳音乐集团的诉讼,这些集团指控公司在未经同意的情况下抓取受版权保护的音乐进行训练,但公司对此予以否认[6] - 公司同时在丹麦面临Koda、在德国面临GEMA的挑战,表明围绕AI训练的法律问题尚未解决[7] - 风险投资机构认为公司反映了深刻的市场变化,相信数百万新创作者将进入音乐领域,AI将在此过程中扮演重要角色,并看好其全栈系统带来的先发优势[8] - 投资者将当前法律挑战视为短期阻力,并认为达成授权协议可能是最终结果,类似于流媒体早期的发展路径[7]
From Courtroom to Creative Lab: How Universal Music and Udio Rewrote the Rules of AI Music
Medium· 2025-11-08 21:16
事件概述 - 2024年6月24日,代表环球音乐集团、索尼和华纳唱片等巨头的美国唱片业协会对AI音乐公司Udio提起诉讼,指控其存在大规模版权侵权行为[1] - 诉讼涉及1670首歌曲,每首歌曲潜在赔偿金额高达15万美元,Udio面临的总潜在赔偿责任约为2.5亿美元[1] - 作为对比,Udio此前仅获得1000万美元的种子轮融资[2] - 16个月后,即2025年10月29日,双方宣布达成和解并建立合作伙伴关系,而非诉讼结果[4] 行业影响与框架建立 - 此次和解不仅是案件了结,更是音乐行业与AI公司之间首个全面的合作框架,为AI公司应如何与受版权保护的音乐内容互动设立了先例[5] - 双方将合作构建一个获得授权的AI音乐平台,并计划于2026年推出[4]
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
36氪· 2025-10-27 10:41
OpenAI进军AI音乐市场 - OpenAI正在筹备AI音乐生成项目,并与茱莉亚学院合作进行乐谱标注以训练模型[4] - 新音乐模型未来可能整合进Sora 2视频生成模型,为用户视频自动生成背景音乐或添加乐器伴奏[4] - OpenAI探索AI音乐的To B市场,广告行业是清晰赛道,可用于构思歌词、创作广告歌曲或风格模仿[4] AI音乐市场竞争格局 - 当前AI音乐生成市场竞争分散,前十大平台合计仅占约24%市场份额,头部效应不明显[6] - 主要初创公司包括Suno(主打人人可创作音乐)和Udio(偏向专业用户),市场定位不同[6] - 科技巨头纷纷布局:谷歌推出Lyria模型,字节跳动、阿里、腾讯等国内公司也在慢慢布局[6] Suno AI的商业模式与财务表现 - Suno AI凭借订阅模式实现年经常性收入(ARR)1.5亿美元,同比增长近四倍[8] - 公司毛利率超过60%,在AI领域属于罕见的高利润水平[8] - 音频模型相比大语言模型更"轻"且成本更低,但市场潜在规模和用户付费意愿不差[8] OpenAI的音乐技术积累与战略动机 - OpenAI早在2019年就推出音乐生成模型MuseNet,2020年推出带人声的Jukebox模型[7] - 公司近期频繁推出新产品(如Atlas浏览器、Sora 2),音乐是产品矩阵的新维度[8] - 战略动机是在AGI路径受阻后,推出更多能落地赚钱的产品来抵消庞大算力开支[7] 行业影响与潜在问题 - OpenAI进入将彻底引爆AI音乐赛道竞争,加速创新并为消费者提供更多选择[6] - AI音乐生成技术引发音乐人版权担忧,Suno与Udio的崛起已侵害不少音乐人权益[2] - 事件引发对AI应用公司壁垒的思考:通用模型公司进入特定领域后初创公司优势何在[8]
OpenAI被曝瞄准AI音乐赛道商业化,Suno首当其冲
量子位· 2025-10-26 12:01
OpenAI进军AI音乐的战略动向 - OpenAI已与茱莉亚学院合作进行乐谱标注,旨在利用先进模型创作高质量音乐内容[6][7] - 新产品未来可能整合进Sora 2视频生成模型,实现视频BGM自动生成及人声轨道伴奏添加[7] - OpenAI正探索AI音乐的To B市场,广告行业是最清晰赛道,可用于构思歌词、创作广告歌曲及视频风格模仿[8][9] AI音乐行业竞争格局 - 当前AI音乐生成赛道头部效应不明显,前十大平台合计市场份额约24%[12] - 主要初创公司包括估值20亿美元的Suno(主打人人可创作音乐)和Udio(偏向专业用户)[12][13] - 科技巨头已纷纷布局:谷歌推出Lyria模型,字节跳动、阿里、腾讯等国内公司也在逐步进入市场[16][17] AI音乐商业模式与技术特性 - Suno凭借订阅模式实现年经常性收入1.5亿美元,同比增长近四倍,毛利率超过60%[29][30] - 音频模型相比大语言模型更轻量且成本更低,但市场潜在规模和用户付费意愿不逊于语言模型[32][33] - OpenAI此次举动是商业驱动,旨在通过可落地产品抵消算力开支,而非单纯技术探索[26][34] 历史技术积累与行业影响 - OpenAI早在2019年就推出音乐模型MuseNet(支持10种乐器),2020年推出带人声的Jukebox模型[22][24] - 巨头入场将加速行业创新步伐,消费者可获得更多选择并从中受益[19][20] - 该事件引发对AI应用公司壁垒的思考:通用模型公司进入垂直领域后初创公司的生存空间[35][36]
程序员用AI写歌还赚钱了!用AI 批量生产“爆款”,这个副业“杀疯了”?
AI前线· 2025-10-17 11:39
AI音乐创作的发展现状 - AI参与创作的作品频繁出圈,例如原神玩家使用Suno作曲的《奥奇坎竟是我自己》在B站获得近640万播放量[2] - 程序员Yapie使用DeepSeek和Make Best Music工具创作的《七天爱人》上线网易云音乐后播放量迅速突破200万次,评论超4600条,并跻身主流榜单[3] - 该歌曲版权卖出数万元,实现了商业突破,为大众AI音乐变现带来启发[3] - 截至2023年,AI已生成超过一亿首乐曲,预计AI音乐市场收益将在2026年达到70亿美元,到2030年将占据50%的音乐市场份额[9] 创作者对AI态度的转变 - 创作者对AI的态度从2023年的担心被替代、充满不屑排斥,转变为2024年将AI作为助手和灵感来源,如今已不再争论"用不用"而是讨论"怎么用好AI"[8] - 网友Chaosprint表示,早期AI音乐音质较"糊",但现在扩散模型推动音质改善,人声合成和转换变得更为实用[6][7] - 当前AI创作工具已能生成"60分水平"的合格作品,保证有个人特色并满足基础创作需求[16] AI在音乐创作中的角色定位 - AI是执行者,人类负责定义问题与目标,通过不断反馈迭代、个性化记忆和设置创作边界来引导模型[10] - 技术能解决80%的工作,人类解决10%的错漏和10%的画龙点睛[10] - AI当前的核心价值是"补位":帮助普通人实现创作无需学习乐理,对专业创作者则是提升效率而非取代[10] - AI让创作大量内容变得容易,未来音乐创作趋势是"品味比技能更重要",能从海量内容中筛选好作品的人将更受认可[16] AI音乐技术进展与挑战 - 早期AI创作规则简单输出粗糙,如今大模型基于文本就能深刻理解情感与语义关系并生成完整音乐作品[11] - Suno采用Transformer架构,其竞争优势在于音频表征创新而非模型架构创新[11] - 生成速度是重要指标,10秒延迟比8秒差,会影响用户体验[12] - AI音乐在情感叙事、高端真人感、互动和实时方面还有优化空间,难以实现创新性词曲创造和复杂多曲风节拍设计[11][16] 未来发展方向 - 未来将出现"AI创作操作系统"或全能平台,特征包括统一创作者工作空间和全局理解与任务协作[12][15] - 工具提供方需要集成优质AI能力,优化工具流与工作流,降低成本,让创作流程简单高效[12] - GPU开销是很大支出项,厂商们希望GPU价格下降但大概率会使用更多GPU以持续进行高质量研究和技术迭代[13] - 人类创作者的壁垒在于"道"而非"术",包括如何理解世界、解构问题以及表达独特的生活感悟[15]