Suno V5
搜索文档
对标Spotify!Mureka V8发布,昆仑天工打响AI音乐平台化第一枪
创业邦· 2026-02-02 18:13
文章核心观点 - 昆仑万维旗下昆仑天工发布Mureka V8音乐大模型,其音乐生成质量在专业盲测中多项核心指标超越竞品Suno V5,标志着AI音乐从“可生成”迈向“可发布”的“ChatGPT时刻”[2][3][5] - 公司的战略目标不仅是打造优质工具,更旨在海外市场构建一个基于AI原生内容的“生产-消费”平台,即AI版的“Spotify”,以重塑音乐平台生态[2][11] - 此次成功是昆仑万维“算力+大模型+应用”全产业链布局的体现,其AI业务已实现毛利转正,标志着公司“All in AGI与AIGC”战略进入收获期,并在全球AI应用下半场竞争中占据有利位置[18][20] 产品技术突破:Mureka V8的性能与意义 - **技术原理突破**:Mureka V8基于MusiCoT(音乐思维链)技术,使AI能像人类作曲家一样理解音乐的整体结构(如主歌、副歌)与表达意图,在生成前建立作曲全局观[4][5] - **听感质变与专业评测**:在专业盲测中,Mureka V8在音乐结构、人声表达、整体音质质感等多项核心指标上超越了行业竞品Suno V5[5][7] - **音乐结构完整**:能生成具备清晰主副歌对比、时长达到标准的完整作品,告别了以往AI音乐只能生成30秒片段或拉长后逻辑错乱的问题,具备承载情感和叙事的能力[8] - **人声表达真实**:模拟出歌手演唱时的气息、咬字等微观状态,实现了“去塑料感”,使人声与伴奏融合,产生情感共鸣[8] - **音质达到发布标准**:混音与声场表现接近录音棚出品,配器层次丰富,频段均衡,生成音乐无需后期工程即可直接上架[10] - **行业意义**:标志着国产模型从追求“像音乐”转向深度理解音乐本体论,致力于产出符合行业标准的音乐,解决了AI音乐旋律不耐听、人声失真、用户无法深度介入等痛点[10] 商业战略:从工具到AI版“Spotify”平台 - **战略定位**:不满足于做比Suno更好的工具,旨在掌握产品场景和市场的解释权,主战场选在海外,目标是构建AI版的“Spotify”[11][12][13] - **平台构建四大支柱**: - **以模型为地基**:依靠Mureka V8的高质量内容生成能力,作为平台建设的入场券[14] - **以社区构建交互壁垒**:通过再创作功能促进用户互动与二创,形成社区粘性,并提供作品发布与交流空间[14] - **以专业工具沉淀PGC内容**:通过AI Studio(向音乐人/制作人内测)降低创作门槛、提升专业上限,确保平台精品内容生成[14] - **以API开放服务连接生态**:向游戏、视频、社交等场景开放API,与合作伙伴建立商业化与分成机制,拓展分发渠道与流量入口[16] - **合作与生态**:已与太合音乐集团达成战略合作,并通过开放API服务音乐人、发行方和APP开发者,做最懂开发者需求的开放平台[15][20] 公司背景与竞争优势 - **全产业链布局**:依托昆仑万维自2020年布局的算力集群、自研“天工大模型”底座,形成“算力+大模型+应用”的垂直整合,构建了技术护城河并优化了成本结构[18] - **商业化进展**:2025年11月,Mureka在扣减营销费用后,毛利首次转正,证明其AI业务已具备造血能力,高投入期有望转向收获期[18] - **迭代速度与用户规模**:在不到2年时间内完成8个版本迭代,目前服务全球近千万用户;从2024年2月SkyMusic 1.0内测开始,迭代迅速,例如2个月实现中英文版本交付,从双语扩张到十几种语言等[19][20] - **集团战略与赛道判断**:自2022年确立“All in AGI与AIGC”战略,布局AI多赛道;公司预测未来1-3年,AI原生平台最先爆发的可能是AI音乐与AI短剧[19] - **行业竞争阶段**:认为AI产业竞争已进入应用端“下半场”,核心是比拼商业化速度和执行力,以及在已开拓场景中的市场份额渗透率[20]
周亚辉想做AI版Spotify:日活冲到1个亿,就不怕大厂“偷袭”
36氪· 2026-01-29 08:25
公司战略与愿景 - 昆仑天工将AI音乐定义为新品类,并锚定海外市场,目标是成为AI版的“Spotify”[1] - 公司基于Mureka的AI音乐平台将采取完全免费策略,旨在通过广告分成等模式,类比免费短剧平台,实现巨大商业价值[3] - 公司坚信技术领先是最深护城河,模型达到SOTA(最高水平)可带来约半年的领跑窗口期,并计划利用此窗口期全力冲击1亿DAU(日活)和3亿至5亿MAU(月活)的流量规模目标[4] - 公司长期目标是在3到5年内,使音乐产品在海外实现DAU过亿,MAU达到3亿至5亿[21] 技术进展与产品能力 - Mureka V8模型生成的歌曲已能让大部分普通听众觉得好听,产品具备被C端大规模接受并产生高留存的能力[8] - 在2026年初发布的视频大模型中已出现拐点,能连贯生成30到60秒剧集片段,大幅提高生产效率和“抽卡”成功率[8] - Mureka V8在旋律生成和制作各方面已达到工业化标准,可以为专业音乐人提供服务[9] - 在盲选测试中,AI制作的音乐被商用音乐客户选中的概率已超过传统曲库,具备商用价值[14] 市场拓展与运营规划 - 海外市场拓展将分四步走:提升AI模型基础能力(已实现搜索)、验证优质AI生成内容并建立内容池、建立用户留存与互动场景、完善商业化与分成模式[10] - 海外市场拓展基于公司原有的海外产业积累与增长经验,国内市场竞争困难且不必要,更倾向于合作模式,例如已与太合音乐合作,并希望与网易云音乐等探索合作[15] - 公司将采取ToB和ToC并行策略:通过Studio工具服务创作者(To Creator),通过免费广告模式的APP吸引海量C端用户,并通过API服务商用音乐公司[14] - 公司计划很快在海外上线拥有完整打榜和排名机制的闭环展示APP,并利用原有K歌社区的运营经验和资源支持[19] 行业观点与竞争格局 - 生成式AI浪潮中,音频、视频、游戏及通用文本等赛道在未来1到3年都可能被AI原生平台颠覆,音乐将是第二个明显爆发的产业[8] - AI Super App(超级应用)只会在大厂中产生,因为大厂拥有AI原生公司不具备的产业厚度和资源,争夺Super App入口关系到其生死存亡[6][21] - 美国资本市场对创新给予极高资本溢价,使创新公司估值能短时间内剧升,形成巨大先发优势,例如OpenAI冲击8300亿美元估值,Anthropic估值达3500亿美元,大厂后发追赶困难[6][23] - 对于国内的头部AI原生模型公司(如智谱、Kimi、MiniMax、百川),其机会不在于打造Super App,而在于坚守阵地、保持节奏[6][22] 创作生态与产业影响 - AI音乐创作中,人的核心作用在于思想、情感和情绪的表达,未来写歌可能像写日记一样成为主流表达方式[13] - AI将改变音乐人工作流,许多音乐人已开始使用APP上传demo和人声,让AI协助编曲和延展创意,提升效率[16] - AI会提升“草根神曲”的格调和质量标准,弥补以往制作粗糙的短板,在神曲化与严肃艺术间达到平衡[18] - 版权划分是全球性新课题,尚无确切答案,公司将跟随时代发展;AI原生平台将通过更充分、高质量的供给扩大听歌用户基数,最终让唱片公司和音乐人获益变大[17] 模型竞争力与壁垒 - 技术是安全的壁垒,模型能力向上提升难度大,后来者赶超困难,正如美国Anthropic成立仅几年就获得高估值[13] - Mureka从V1到V8经历多次大的技术架构重构,其架构领先性得以保持,离职人员在其他公司带队一年多,产品仍与公司有较大差距[20] - 判断模型公司是否“守得住”,SOTA能力只是创造了“窗口期”,核心在于技术路径是否正确以及新产品能否持续召回用户[27] - 大模型产品粘性(用户迁移成本低)需通过建立社交关系、创作者生态及更深度的用户记忆来逐步提升,类似抖音早期发展过程[28]
我的2025年度AI大盘点 - 前路已明。
数字生命卡兹克· 2025-12-31 09:21
年度大模型 - **年度写作大模型为GPT-5.2 Thinking**,该模型在指令遵循、风格迁移和世界知识方面表现极佳,超越了Gemini 2.5 Pro和GPT-4.5 [2] - **年度Coding大模型为Gemini 3.0 Pro**,其超强的前端能力和审美,能够帮助用户快速实现创意灵感 [4][7][8] - **年度绘图大模型为Nano Banana**,该模型掀起了远超GPT-4o的潮流和热度,成为AI绘图领域分水岭级别的模型,并体现了原生多模态的优势 [10][14][15] - **年度音乐大模型为Suno V5**,该模型是2025年AI音乐领域的绝对王者,将领域天花板拉高了数个级别,并在B站等平台引发了大量二创视频的井喷 [16][18] - **年度声音大模型为MiniMax Speech 2.0**,该模型在2025年5月15日发布,首次在多项指标上超越11Labs,实现了逼近真人级别的情感表达 [19][22][23] - **年度视频大模型为Sora2**,该模型以其高度真实和趣味性的生成效果,成为2025年最令人印象深刻和破圈的AI视频模型 [24][26] - **年度大模型为DeepSeek R1**,该模型于2025年1月20日发布并开源,其推理效果媲美当时顶级的闭源模型OpenAI o1,而API价格仅为后者的3.7%,奠定了中国在开源模型领域的领军地位 [27][29][30][31] 年度AI产品与功能 - **年度AI编程产品为Claude Code**,该产品能探索本地代码库上下文、修改文件、运行CLI工具,并支持将工作流封装为自定义Skill [43][45] - **年度AI设计产品为Lovart**,该产品是首个设计类垂直Agent,专为设计场景优化,集成了文字编辑、Touch Edit、Mockup等功能,并经常首发最新的绘图和视频模型 [46][47][48] - **年度AI功能为ChatGPT DeepResearch**,该功能可将查找资料的效率提升百倍千倍,能在10到30分钟内搜索全网数据并生成一篇深度研究报告,质量不亚于研究员工作10小时到1周的成果 [49][50][51] - **年度AI应用为Manus**,该应用作为第一个通用Agent,开启了Agent时代,将Agent概念向前推进了一大步,并于2025年被Meta以数十亿美金的价格收购 [55][60][61][62] - **年度AI硬件为Plaude Note Pro**,该硬件开创了能贴在手机背后的AI硬件新品类,具备录音、实时转录、自动总结会议要点等功能,并以百万销量证明了市场需求的真实性 [65][66][68][72]
Suno V5让整个B站开始文艺复兴了。
数字生命卡兹克· 2025-11-04 09:33
B站内容生态变迁 - B站传统鬼畜视频内容曾是其核心特色,但近年来出现明显衰落迹象[11][12][13] - 用户观察到鬼畜区创作活力和音乐创造力显著减少,高质量作品产出频率降低[12][13] - 近期B站出现AI音乐鬼畜视频的复兴浪潮,以@漫游会议室为代表的创作者通过AI工具重新激活了该领域[24][26][43] AI音乐创作新趋势 - Suno V5模型成为推动B站AI音乐鬼畜复兴的核心技术工具[44][47] - AI音乐生成质量实现重大突破,V5版本生成的歌曲被评价优于当前大量流行口水歌[47] - 典型创作者@漫游会议室在十几天内粉丝从几万增长至28万,单个视频播放量达百万级别[31][32][34] - AI音乐创作呈现爆发式增长态势,涌现出雨姐鬼畜宇宙等多个热门系列作品[37][38] AI工具降低创作门槛 - Suno V5将音乐创作流程从需要乐理知识、专业软件技能和至少一周制作时间大幅简化[48][49][50] - 现在仅需足够审美品味即可快速创作,实现了创作能力的"究极跃迁"[47][51] - 非专业用户可在1天内完成包含国风rap的完整音乐视频制作[54] - 工具提供歌词编辑、音轨分离、段落修改等专业功能,大幅提升创作灵活性[84][85][86][87] AI创作工具商业化模式 - Suno提供pro版月费10美元和premier版月费30美元两种付费方案[59] - 每生成一首歌曲消耗5积分,付费模式具有较高性价比[59] - 配合即梦数字人等视频生成工具,可完成从音乐到视频的完整AI内容生产链条[91][92][94] 内容创作价值回归 - AI工具使得创作重点从技术执行转向表达内涵,重新强调鬼畜精神的核心价值[98][101] - 新技术环境下,内容的情感共鸣和创意表达比技术技巧更为重要[100][101] - B站社区氛围和分享快乐的初心在AI时代得以延续和强化[102][104][105]
AI 音乐都发展成这样了?藏师教你一键生成爆款 AI 音乐
歸藏的AI工具箱· 2025-10-16 21:19
AI音乐生成技术演进 - Suno V5模型在音乐生成质量上实现显著突破,音频清晰度极高,用户难以分辨AI生成内容与真人演唱的区别[1] - 该模型支持多维度的音乐元素控制,包括风格提示词、自定义歌词、分段落提示词以及音频上传修改功能,超越了早期版本仅能处理简单提示词的限制[5] - 新增Studio专业模式提供分音轨生成和控制能力,类似专业音频软件的操作逻辑[5] 市场应用与传播热度 - AI生成音乐内容在短视频平台呈现爆发式传播,单个作品获得数十万点赞成为普遍现象[3] - 技术应用范围扩展至热门娱乐形式,例如近期流行的《技能五子棋》也采用AI技术生成背景音乐[3] - 模型支持对经典歌曲进行多风格重混音,例如使用陶喆风格演绎《搁浅》或贾斯丁·比伯风格演绎《兰亭序》[6] 技术操作流程设计 - 工作流分为垫音生成(基于原曲调重新混音)和纯提示词生成(完全创新曲调)两种核心模式[6] - 操作界面包含歌词标注系统(方括号内提示词控制演唱风格)、全局风格设置、人声性别选择等专业参数[7] - 关键参数包括怪异值(控制音乐偏离主流程度)和风格遵循度(控制模型自由发挥空间)[8] 提示词工程体系 - 开发出结构化提示词生成模板,通过大型语言模型自动生成符合Suno要求的专业提示词[9] - 全局风格提示词需包含四大要素:核心曲风、标志性乐器编配、音色与演唱技巧、制作与节奏特点[10][11] - 分段指令系统要求智能划分歌词结构(主歌、副歌、桥段等),并为每个段落设计符合歌曲发展逻辑的编曲指令[12] 版权规避与商业化应用 - 针对版权限制提供两种解决方案:用户自主翻唱录制或使用翻唱音频规避版权检测[20] - Audio Influence参数允许控制生成声音与原始音频的相似度,低设置值可避免音色复刻风险[20] - 技术特性使Suno具备替代传统调音师的潜力,特别适用于内容创作者进行音乐后期处理[20] 行业影响评估 - AI音乐技术从纯生成逻辑转向编辑创作逻辑,大幅提升自由度和准确性[21] - 该技术可能打破音乐行业现有格局,使经典音乐作品能够被低成本、高质量地重新混音创作[21] - 与传统音乐平台低质量Remix内容相比,AI生成音乐在艺术质量上具备明显优势[23]