上海AI独角兽MiniMax发布全模态“全家桶”：中国AI从跟跑到领跑的技术突围

公司技术发布概览 - 上海AI独角兽MiniMax稀宇极智在10月底集中发布了文本、视频、语音和音乐四大模型，实现全模态技术领域的全面突破 [1] 文本大模型M2 - 新一代文本大模型MiniMax-M2正式发布和开源，该模型仅有10B激活参数（总参230B），在全球权威测评榜单Artificial Analysis (AA)上总分冲入全球前五、开源第一，跻身全球文本模型第一梯队 [2] - M2模型综合成本低至约0.53美元/百万Tokens，不及Claude 4.5 Sonnet的8%，推理速度是其近两倍，具备颠覆性的定价策略 [2] - 该模型专为编码与智能体任务深度优化，契合新兴多智能体工作流对高效协同与快速响应的需求 [2] 国际技术认可 - Meta在其大规模实验中正式采用了MiniMax原发技术报告中的CISPO损失函数和FP32 Head技术，将其整合进Meta的ScaleRL核心配方，标志着中国在强化学习算法领域的全球领先地位得到国际权威确认 [3] 视频生成模型海螺2.3 - 视频生成模型海螺2.3（Hailuo 2.3）在动态表现力、风格化呈现以及人物表演细腻度方面取得显著突破 [4] - 新版本模型在提升性能表现的同时保持了Hailuo 02的原有定价水平，其Fast版本批量创作成本最高可降低50% [4] 语音模型Speech 2.6 - Speech 2.6模型专门针对Voice Agent场景深度优化，将首包响应时间压到250毫秒，达到语音赛道绝对头部水平 [5] - 模型升级亮点包括超低延时响应、专业格式无障碍识别和更高自然度，新增的"Fluent Lora"功能可将原始录音复刻出流畅自然的声音 [6] 音乐生成模型Music 2.0 - Music 2.0模型能够精准捕捉与还原人声的细腻情绪和器乐的动态张力，在人声表现方面实现重大突破，音色无限接近真实人声 [7] - 模型支持生成结构完整、逻辑清晰的歌曲，单首时长可达5分钟，生成的旋律更容易记忆且能实现层次丰富的编曲 [7] 行业影响与战略意义 - 此次全模态模型发布反映出中国AI正从应用模仿转向算法原创，完成从"中国制造"到"中国创造"的战略转变 [8] - 公司的技术路径以性能比肩顶尖水平、成本实现普惠、算法勇于原创为特点，为全球AI发展提供了"中国方案" [8] - AI视频、语音、音乐生成技术的发布将为数字内容创作产业注入新的活力 [8]