AI平台经济
搜索文档
国产玩家亮剑世界模型!把全模态卷到顶后,天工AI不藏了
量子位· 2026-03-27 21:49
文章核心观点 - 行业正经历从大模型工具时代向AI平台经济时代的第二次跃迁 [3][4] - 天工AI的战略目标不是单纯打造更强的模型,而是构建一套完整的AI原生平台 [2][8] - 公司通过发布三大SOTA模型,正在拼凑一个“可理解、可生成、可交互”的世界模型雏形,并以此为基础搭建平台生态 [13][82][105] 天工AI的战略与平台愿景 - 公司提出“3+1”生态架构作为其2026年AGI战略升级,底层是四大SOTA模型(视频、音乐、游戏世界模型及Skywork 6.0),上层是三大AI原生平台经济体,并由Skywork Super Agents作为通用操作系统 [82][83][84][85][86] - 平台包含内外两层:内层是从技术到模型再到应用的完整闭环;外层是由开发者、创作者和合作伙伴加入后演化而成的生态 [9] - 公司的路径是先拿下“全模态”能力,再向平台延伸,与“先搭台、后唱戏”的传统路径相反 [119][123] 三大模型发布与技术进展 - **游戏世界模型Matrix-Game 3.0**:解决了长时序一致性与高分辨率实时生成两大难题,模型长期记忆能力达到分钟级,并在720P分辨率下,5B模型实现最高40FPS的实时生成 [19][20][27][29] - **视频大模型SkyReels V4**:在Artificial Analysis文转视频(含音频)全球榜登顶,解决了音画不同步、可控性差、缺叙事逻辑、商用落地难四大顽疾,通过自研对称双流MMDiT架构、全模态参考、强化学习与阶梯式课程学习提升能力,最终在保证1080P、32FPS、15秒成片质量的同时,将计算成本压至原来的三分之一 [42][43][44][53][58] - **音乐大模型Mureka V9**:其前代Mureka V8已登顶Artificial Analysis音乐模型榜,超越Suno V4.5、Udio v1.5 Allegro等国际主流模型,V9在段落内文本控制、生成效率、混音质量与整体听感上进行了全方位打磨 [68][66] 世界模型的构建路径 - 三大模型并非孤立推进,而是互相配合、彼此反哺:Matrix-Game系列构建可实时交互的世界框架,SkyReels系列承担对世界的理解与预测,Mureka系列补齐表达与情绪维度 [13][77] - 世界模型的核心在于学习状态转移参数,具备动态性、可交互性和物理一致性,从“视频生成器”转变为“可交互系统” [32][39] - 实现世界模型需要数据引擎、模型架构、推理部署三个层面的系统性升级 [33] 产业趋势与商业化落地 - AI正从“辅助工具”进入生产流程本身,开始“主导”部分生产环节,这要求能力从单点转向体系化 [92][100] - 公司模型已在具体平台落地:游戏世界模型驱动新一代AI开放世界模拟游戏平台“猫森学园”;视频模型驱动海外付费短剧平台DramaWave(“AI版Netflix”);音乐模型驱动AI音乐创作与分发平台Mureka(“AI版Spotify”) [97] - 产业一线人员(如游戏开发者、音乐人、导演)的实践表明,AI正在压缩传统高成本、耗时的创作环节,并降低创作门槛,但专业创作者面临的挑战是让AI理解专业语言 [93][94][95][96] 行业竞争格局与公司定位 - AI行业竞争分两条路径:一类在单一模态卷极致(如Midjourney、Sora);另一类尝试整合多模态能力构建统一系统或平台,后者更难且玩家寥寥 [109][110][112] - 天工AI作为后者,其转向平台标志着全球第一梯队迎来了一位“全能”国产玩家,竞争焦点可能从单点能力转向体系化能力 [107][108] - 母公司昆仑万维自2022年“All in AGI与AIGC”以来,已构建“模型+产品”完整矩阵,其海外服务覆盖全球100多个国家和地区,全球平均月活跃用户近4亿,海外收入占比达92% [114][117]