Workflow
Mureka V9
icon
搜索文档
剑指OPC,昆仑万维携三大模型亮相中关村论坛,开启AGI平台经济新时代
创业邦· 2026-03-29 14:33
公司战略与产品发布 - 昆仑万维旗下天工AI在2026中关村论坛发布“2026 AGI战略”,并推出三大核心模型:Matrix-Game 3.0(AI游戏)、SkyReels V4(AI视频)、Mureka V9(AI音乐)[2] - 公司新战略聚焦于离内容变现最近的三大超级场景(游戏、视频、音乐),旨在通过SOTA模型重塑内容创作的生产和消费关系,告别“工具割裂”时代[2][6] - 公司战略定位从大模型工具时代跨越至AI-Native平台经济体时代,模型是引擎,平台是工厂,创作者是老板,三者合为一体[2][14] 核心技术模型与能力 - Matrix-Game 3.0是物理仿真驱动的实时交互式世界模型,实现了从“可运行Demo”到“工业级系统”的跨越,在5B参数规模下可实现720P分辨率、最高40FPS的实时渲染[7][8] - SkyReels V4通过四大底层技术突破(音画一体双流联合生成架构等),在国际权威榜单Artificial Analysis的“带音频文生视频”与“带音频图生视频”双核心赛道登顶全球第一[8] - Mureka V9音乐大模型依托MusiCoT(音乐思维链)体系,实现段落级文本控制更精准、混音质感更具成品水准、人声情感表达更具张力[10] - 三大模型在技术层面位列世界第一梯队,形成了全模态、全栈的AIGC视频数据生成体系平台[10] 商业生态与平台架构 - 公司发布“3+1”生态架构:“3”代表三个AI原生平台经济体,即AI短剧平台Dramawave、AI音乐平台Mureka、AI游戏平台猫森学园2.0;“1”代表通用操作系统Skywork Super Agent(天工超级智能体)[16] - Dramawave平台已覆盖170多个国家和地区,MAU突破8000万,ARR达到4.2亿[16] - Mureka平台被定义为“AI版Spotify”,重构了音乐“创作、分发、表达”全链条;猫森学园2.0实现“用口述做游戏”的功能[16] - Skywork Super Agent基于AI-Native架构与自研Skyclaw技术,实现多个Agent协同调度,让创作者只需输入核心需求即可自动完成从制作到商业变现的全链路[17][18] 市场趋势与行业机遇 - 行业正从单点模型能力竞争转向对工作流的重构能力竞争[5] - OPC(一人公司)趋势崛起:全球单人创始人新公司占比在2025年上半年已达36.3%,较2019年增长53%;国内一人有限责任公司在2025年6月已突破1600万家,占企业总数27.4%[19] - AI能力的跃升降低了影视、游戏和音乐产业的专业能力和资金门槛,赋予个体创作者匹敌专业公司的全栈生产力,使创作者数量指数级增加[19] - 公司商业模式从收取单次技术服务费转向通过掌控全模态内容的流量入口、分发渠道及IP孵化体系,享受平台网络效应带来的长期复利[19] 全球化竞争与行业地位 - 昆仑万维海外服务覆盖全球100多个国家和地区,全球平均月活跃用户近4亿,海外收入占比高达92%[22] - 公司全模态模型迭代速度与国际巨头同步:2023年4月发布Skywork系列大模型;2024年首发Mureka音乐模型,不到两年迭代9版;2025年8月紧跟Google发布游戏世界模型[22] - 2026年,Mureka V8和SkyReels V4接连在权威榜单登顶全球第一,并在各项指标上超越国际头部竞品[22] - 公司依托覆盖全球数亿用户的产品矩阵获取多元的多模态交互数据,反哺模型进化,形成飞轮效应,正参与并主导全球AIGC下一代标准的制定[24]
国产玩家亮剑世界模型!把全模态卷到顶后,天工AI不藏了
量子位· 2026-03-27 21:49
文章核心观点 - 行业正经历从大模型工具时代向AI平台经济时代的第二次跃迁 [3][4] - 天工AI的战略目标不是单纯打造更强的模型,而是构建一套完整的AI原生平台 [2][8] - 公司通过发布三大SOTA模型,正在拼凑一个“可理解、可生成、可交互”的世界模型雏形,并以此为基础搭建平台生态 [13][82][105] 天工AI的战略与平台愿景 - 公司提出“3+1”生态架构作为其2026年AGI战略升级,底层是四大SOTA模型(视频、音乐、游戏世界模型及Skywork 6.0),上层是三大AI原生平台经济体,并由Skywork Super Agents作为通用操作系统 [82][83][84][85][86] - 平台包含内外两层:内层是从技术到模型再到应用的完整闭环;外层是由开发者、创作者和合作伙伴加入后演化而成的生态 [9] - 公司的路径是先拿下“全模态”能力,再向平台延伸,与“先搭台、后唱戏”的传统路径相反 [119][123] 三大模型发布与技术进展 - **游戏世界模型Matrix-Game 3.0**:解决了长时序一致性与高分辨率实时生成两大难题,模型长期记忆能力达到分钟级,并在720P分辨率下,5B模型实现最高40FPS的实时生成 [19][20][27][29] - **视频大模型SkyReels V4**:在Artificial Analysis文转视频(含音频)全球榜登顶,解决了音画不同步、可控性差、缺叙事逻辑、商用落地难四大顽疾,通过自研对称双流MMDiT架构、全模态参考、强化学习与阶梯式课程学习提升能力,最终在保证1080P、32FPS、15秒成片质量的同时,将计算成本压至原来的三分之一 [42][43][44][53][58] - **音乐大模型Mureka V9**:其前代Mureka V8已登顶Artificial Analysis音乐模型榜,超越Suno V4.5、Udio v1.5 Allegro等国际主流模型,V9在段落内文本控制、生成效率、混音质量与整体听感上进行了全方位打磨 [68][66] 世界模型的构建路径 - 三大模型并非孤立推进,而是互相配合、彼此反哺:Matrix-Game系列构建可实时交互的世界框架,SkyReels系列承担对世界的理解与预测,Mureka系列补齐表达与情绪维度 [13][77] - 世界模型的核心在于学习状态转移参数,具备动态性、可交互性和物理一致性,从“视频生成器”转变为“可交互系统” [32][39] - 实现世界模型需要数据引擎、模型架构、推理部署三个层面的系统性升级 [33] 产业趋势与商业化落地 - AI正从“辅助工具”进入生产流程本身,开始“主导”部分生产环节,这要求能力从单点转向体系化 [92][100] - 公司模型已在具体平台落地:游戏世界模型驱动新一代AI开放世界模拟游戏平台“猫森学园”;视频模型驱动海外付费短剧平台DramaWave(“AI版Netflix”);音乐模型驱动AI音乐创作与分发平台Mureka(“AI版Spotify”) [97] - 产业一线人员(如游戏开发者、音乐人、导演)的实践表明,AI正在压缩传统高成本、耗时的创作环节,并降低创作门槛,但专业创作者面临的挑战是让AI理解专业语言 [93][94][95][96] 行业竞争格局与公司定位 - AI行业竞争分两条路径:一类在单一模态卷极致(如Midjourney、Sora);另一类尝试整合多模态能力构建统一系统或平台,后者更难且玩家寥寥 [109][110][112] - 天工AI作为后者,其转向平台标志着全球第一梯队迎来了一位“全能”国产玩家,竞争焦点可能从单点能力转向体系化能力 [107][108] - 母公司昆仑万维自2022年“All in AGI与AIGC”以来,已构建“模型+产品”完整矩阵,其海外服务覆盖全球100多个国家和地区,全球平均月活跃用户近4亿,海外收入占比达92% [114][117]
刚刚,一口气连发3个王炸模型、亮出2026年AGI战略,昆仑万维夯爆了
机器之心· 2026-03-27 21:38
昆仑万维AGI战略与三大模型发布 - 公司在2026中关村论坛上发布了其最新的AGI战略及三大核心模型,标志着其从全模态能力突破进入平台化构建阶段 [9] - 公司自2022年起便“All in AGI与AIGC”,此次发布旨在为实现通用人工智能目标提供清晰的路径指引 [1][9] 三大核心模型技术亮点与性能 Matrix-Game 3.0(AI游戏世界模型) - 该模型解决了世界模型“记不住、跑不久、跑不动”的三大短板,实现了数据、记忆与实时生成环节的贯通 [17] - 在模型架构上,通过协同机制同时实现了720p实时生成与分钟级长时序稳定演化的目标 [21] - 通过模型量化与蒸馏等技术,将模型压缩至约5B规模,并在720p分辨率下实现实时生成,其MoE-28B模型已将生成时长推进至分钟级 [28] - 公司已开源Matrix-Game 3.0的代码与模型权重 [30][32] SkyReels V4(AI视频大模型) - 该模型在Artificial Analysis基准测试中,于“带音频文生视频”和“带音频图生视频”榜单夺得全球第一,在“图生视频(不带音频)”榜单位列全球第二(截至2026年3月18日)[4][5] - 模型进化为“全模态音视频联合生成、修复与编辑”的大一统模型,采用原生音画一体的双流MMDiT架构,实现口型、动作与声音的精确对应 [33][34] - 通过引入VSA稀疏注意力等技术,将计算成本降低约3倍,实现了1080P分辨率、32FPS帧率、15秒时长的影院级内容生成 [38] - 模型支持从生成到精细编辑的全流程,实现了生成、编辑与修复的大一统 [37] Mureka V9(AI音乐大模型) - 与前代Mureka V8及Suno V5相比,Mureka V9在音乐旋律性、表现力、编曲等主观指标上全面胜出 [7] - 模型基于MusiCoT技术底座,使音乐生成更贴近真实创作流程,表达更稳定,将音乐从“用来听的内容”转变为“表达自我的语言” [45] - 模型致力于将“好听”从偶发结果变为可控、可复现的过程,创作方式转变为可反复尝试、局部调整、持续迭代的过程 [45][46] - Mureka V9正从音乐生成工具向创作平台演进,旨在打造可反复修改、持续演化的版本化作品 [46] 公司AGI战略布局与生态构建 - 公司提出“3+1”AGI战略:“3”指游戏、视频、音乐三大场景大模型,“1”指天工超级智能体,旨在统一调度AI能力 [51] - 天工超级智能体(Skywork Super Agents)具备跨任务一体化执行、Deep Research信息处理及多Agent分工协作能力,并通过推出SkyClaw及官方Skills,将能力封装为可直接调用的工具 [51] - 公司战略旨在构建“底层全模态基础模型-中间层超级智能体-上层应用”的三层协同体系,最终使AI从一个孤立的工具演变为一个可以持续运转的系统 [12][13] - 公司正围绕“平台+超级智能体+开发者+创作者”搭建开放的生态协同体系,通过统一入口开放多模态能力,并与产业伙伴合作,推动AI在具体场景的落地 [55] - 随着该体系的成熟,AI原生的平台经济将走向落地,赋能创作者拥有匹敌公司的全栈生产力 [15]
中国AI音乐,悄悄把全球第一拿走了
量子位· 2026-03-25 14:31
核心观点 - 昆仑万维旗下AI音乐模型Mureka V8在第三方评测平台Artificial Analysis的音乐模型榜单中,于人声和器乐两个分榜均位列第一,超越了Suno V4.5、Udio v1.5 Allegro等国际主流模型,标志着中国AI音乐模型在全球范围内取得领先地位 [1][2][3] 榜单表现与技术实力 - **人声榜单表现**:Mureka V8在Artificial Analysis人声音乐排行榜上以ELO评分1,137分位列第一,领先于第二名Suno V4.5的1,079分 [3] - **器乐榜单表现**:Mureka V8在器乐音乐排行榜上以ELO评分1,179分位列第一,领先于第二名Suno V4.5的1,120分 [3] - **模型生成质量**:实测显示,Mureka V8生成的人声具有真实的呼吸感、吐字清晰且能根据歌曲情绪进行细腻的气息与唱法处理,例如在民谣生成中能自然融入换气声与气息起伏 [4][5][6][7][8][9] - **复杂指令执行**:模型能够理解并执行复杂的混合曲风与唱法切换指令,例如在一首歌中融合Pop Rock和R&B,并在气声、摇滚嘶吼、R&B转音和假声等多种唱法间丝滑切换 [11][12][13] - **器乐生成能力**:模型生成的纯器乐作品能精准把握特定音乐风格的精髓,如成功复现了标志性的失真吉他riff,且器乐编排富有画面感和专业度 [14][15][16][17][18] - **完整歌曲创作**:模型结合其人声与器乐能力,能够生成结构完整、情感连贯、制作精良的完整歌曲,而非简单的音频片段,实现了从“可生成”到“可直接发布”的跨越 [20][21][22][23] 公司发展路径与迭代策略 - **快速迭代节奏**:公司从2024年2月SkyMusic 1.0内测开始,至2026年1月发布Mureka V8,在不到两年时间内迭代了8个大版本,平均更新周期约为三个月 [26][27][28] - **三阶段发展路径**:公司AI音乐业务的发展经历了从“不能用”到“能用”(1.0-2.0版本)、从“能用”到“好用”(3.0-5.5版本)、再从“好用”到“直接生产可发布内容”(V8版本)的三个明确阶段 [29][30][31][32][34][35][37] - **技术能力演进**:在迭代过程中,公司先后解决了端到端生成、规模化生产、音质听感跃迁、多语种工程化等关键问题,并通过引入MusiCoT等技术使模型具备主动规划音乐框架的“思考”能力 [30][32][34][35][36] - **持续投入与前瞻**:公司对AI音乐赛道进行了长期持续投入,并已预告将于近期发布基于MusiCoT进一步深化的Mureka V9,其目标是从“能写出来”进化到“能按你想的方式写出来” [41][42][57] 行业格局与趋势 - **竞争格局变化**:以昆仑万维Mureka V8为代表的国产模型在AI音乐领域登顶,改变了该领域长期由海外公司(如Suno、Udio)主导的局面,呈现出“东升西落”的态势 [44][45][46] - **国产AI发展模式**:在多个AI赛道(如大语言模型、视频生成),普遍出现了前期由海外技术引爆,后期由国产团队实现追赶甚至反超的模式,这得益于“中国速度”、“中国规模”和“中国场景”的优势 [48][49][51] - **本土优势**:国内互联网科技公司擅长“小步快跑、根据用户反馈迭代”的战术,且庞大的用户群体、丰富的应用场景和复杂的内容生态为AI模型提供了快速试错和优化的土壤,易于形成飞轮效应 [51][52][53][55] - **产业象征意义**:昆仑万维作为北京市人工智能产业的科技创新代表,其模型登顶也象征着北京在AI音乐领域占据了高地 [58]