MusiCoT
搜索文档
刚刚,AI音乐被重新定义!昆仑天工甩出新王炸,拿下全球第一
机器之心· 2026-01-28 21:08
AI音乐行业发展趋势 - AI音乐创作正从辅助工具向独立的新音乐品类进化,其核心优势在于能集成所有乐器,有望成为流行、R&B、嘻哈、摇滚之外的第五大音乐品类 [11][35] - AI音乐作品传播速度极快,例如B站UP主“漫游会议室”利用AI创作《西游记》主题歌曲,三个月内产出30个作品,大部分获百万播放量,其中“美猴‘亡’”播放量超过1600万 [1] - AI音乐创作呈现人机协作融合形态,并非取代人类创作者,而是帮助作品出圈,被描述为“为创作者带来一场新的文艺复兴” [4] 昆仑天工Mureka V8模型技术突破 - 公司于1月28日面向全球发布最新音乐大模型Mureka V8,新模型推动“人人都能成为创作者”,并明确AI音乐进化为新音乐品类的概念 [5][6] - 模型在歌曲演绎上显著进步,歌词、旋律、编曲皆有提升,生成音乐不再是实验片段,而是可直接作为成品发布,成熟度与可用性高 [6] - 人声表现取得突破,告别“机械式念词”,带有更多情绪与张力,故事感更浓厚,听感更抓耳 [7] - 在专业音乐人参评的主观指标(如音乐旋律性、人声表现力、编曲/结构、情绪表达与渲染)上,Mureka V8全面胜出竞争对手Suno V5 [7] Mureka V8模型核心功能与体验 - 模型生成速度快,例如根据提示词生成一首近3分钟的中文歌曲《冬日的漫长告别》耗时不到半分钟 [14][15] - 生成歌曲结构丰富,包含前奏、主歌、副歌的递进,旋律与情感交织,编曲讲究乐器选用和进入时机 [15][17] - 歌词具备强故事性与画面感,通过徐徐展开的方式讲述故事 [16] - 支持二次创作功能,包括局部编辑、延长与裁剪,赋予创作者更高自由度与可玩性 [17] - 创作完成的歌曲能够即时发布,缩短从素材生产到成品分发的路径 [18] - 模型支持多种曲风(如流行、摇滚、嘻哈、R&B、民谣等)和情绪(如欢快、轻松、浪漫、悲伤等)的生成 [21] 底层技术创新:MusiCoT与人声建模 - 模型性能提升归功于公司自研的“MusiCoT”(音乐思维链)技术,该技术受语言建模中思维链提示启发,让模型能像人类一样预定义整体音乐结构及风格、乐器等元素,再生成音频 [27][28] - MusiCoT利用对比语言-音频预训练(CLAP)架构,在同一个空间中对文本与音频进行学习和训练,提高二者匹配度 [28] - 人声建模技术是模型能够“告别AI味唱腔”的另一关键因素,为人声注入统一而鲜明的人格,使其具备主唱气场 [21][31] - 两项技术加持下,AI音乐生成逻辑更接近人类,懂得铺垫、高潮等起承转合,具备驾驭宏大叙事的能力 [30][32] 公司战略与生态布局 - 公司宣布将推出“AI Studio”,为专业创作者打造更完整、可控的音乐创作环境,提供深度编辑、结构调整和创作管理功能,同时兼顾新创作者的易用性体验 [38] - 借助Mureka Studio,公司旨在重塑音乐创作范式,将创作者从操作技巧中解放,让创作回归“想法”和“审美”本身,创作者可像导演一样提出创意,由AI完成细粒度执行工作 [39] - 在B端,Mureka平台通过开放API服务与模型微调功能巩固优势,API允许终端用户结合歌词、人声和参考歌曲进行定制与调整 [41][42] - 公司与太和音乐达成战略合作,为AI创作者提供流量扶持与变现机会,推动更多人参与AI音乐创作,并可能加速AI音乐商业化、正版化落地 [42]
ZPedia|中国AI再出王炸!全球首个音乐推理大模型MurekaO1上线,硅谷彻底碎了?
Z Finance· 2025-03-26 17:14
中国AI音乐产业突破 - 2025年第一季度中国AI产业实现"三连跳"技术突破,包括DeepSeek开源大模型、Manus智能体协作范式、Mureka音乐生成平台 [1] - Mureka为全球首个开放API及模型微调功能的AI音乐生成平台,支持开发者集成和普通用户无门槛创作 [1] - AI生成音乐行业年复合增长率达16.3%,Mureka瞄准全球540亿美元音乐产业市场 [1] - Mureka构建了覆盖创作、生产、商业化的完整生态链,领先于仅优化单曲生成的Suno [1] Mureka核心技术能力 - 发布Mureka V6和O1两款革命性音乐大模型,V6采用ICL技术提升声场表现,O1引入COT技术实现思维链创作 [3] - 支持10种语言的歌词与音乐生成,涵盖多种风格流派 [3] - 具备场景化BGM生产功能,输入描述性Prompt即可生成契合场景的音乐 [4] - 提供音轨分离下载功能,支持人声、伴奏等多轨输出 [5] - 行业领先的音色克隆技术,可精准模拟歌手音色 [6] - 具备跨语言改编功能,保留原曲旋律生成不同语言版本 [7] 产品性能表现 - 在古典、流行、摇滚、电子等多种音乐风格中表现优异,人声自然无AI痕迹 [8] - 高级模式支持精细创作控制,可进行风格模仿和自定义歌词 [9] - 在专业评测中,Mureka O1在乐器多样性、配器设计、音质清晰度等方面优于Suno V4 [11] - 客观测试显示Mureka O1唱词错误率9.12%,显著低于Suno V4的36.6% [13] - 乐段一致性达84.01%,内容可用价值评分8.029,均领先竞品 [13] 应用场景拓展 - 普通用户可通过语义联想实现"文字转旋律"的直觉创作 [14] - 职业音乐人可利用风格迁移引擎探索传统与现代融合,1小时内批量生成高质量DEMO [16] - 音色还原技术可"复活"已故歌手音色,实现跨时空合唱 [16] - 企业可通过关键词生成多样化广告神曲,开发者可集成API实现实时BGM生成 [16] 技术突破与创新 - 采用MusiCoT技术实现"生成-批判-优化"思维链机制,专业音乐人认可度达73% [22] - 全民音色库技术实现98.7%频谱还原度,10秒语音样本即可克隆音色 [22] - BGM版权解决方案使场景化指令生成音乐100%规避版权争议 [22] - 基于CLAP架构实现无需人工标注的高效扩展,提升生成音乐可解释性 [23] 行业影响与全球化布局 - Mureka的API接口、模型协议、音色库正成为AI时代音乐产业新基建 [2] - 预测未来三年90%的TikTok神曲可能由AI生成,中国平台或主导音乐革命 [25] - 中国AI通过"开放创新+垂直应用"模式推动技术民主化进程 [25] - 中国公司以实际成果证明技术无国界,重新定义全球创新版图 [26]