Workflow
上海AI独角兽MiniMax发布全模态“全家桶”:中国AI从跟跑到领跑的技术突围
环球网资讯·2025-11-01 10:29

公司技术发布概览 - 上海AI独角兽MiniMax稀宇极智在10月底集中发布了文本、视频、语音和音乐四大模型,实现全模态技术领域的全面突破 [1] 文本大模型M2 - 新一代文本大模型MiniMax-M2正式发布和开源,该模型仅有10B激活参数(总参230B),在全球权威测评榜单Artificial Analysis (AA)上总分冲入全球前五、开源第一,跻身全球文本模型第一梯队 [2] - M2模型综合成本低至约0.53美元/百万Tokens,不及Claude 4.5 Sonnet的8%,推理速度是其近两倍,具备颠覆性的定价策略 [2] - 该模型专为编码与智能体任务深度优化,契合新兴多智能体工作流对高效协同与快速响应的需求 [2] 国际技术认可 - Meta在其大规模实验中正式采用了MiniMax原发技术报告中的CISPO损失函数和FP32 Head技术,将其整合进Meta的ScaleRL核心配方,标志着中国在强化学习算法领域的全球领先地位得到国际权威确认 [3] 视频生成模型海螺2.3 - 视频生成模型海螺2.3(Hailuo 2.3)在动态表现力、风格化呈现以及人物表演细腻度方面取得显著突破 [4] - 新版本模型在提升性能表现的同时保持了Hailuo 02的原有定价水平,其Fast版本批量创作成本最高可降低50% [4] 语音模型Speech 2.6 - Speech 2.6模型专门针对Voice Agent场景深度优化,将首包响应时间压到250毫秒,达到语音赛道绝对头部水平 [5] - 模型升级亮点包括超低延时响应、专业格式无障碍识别和更高自然度,新增的"Fluent Lora"功能可将原始录音复刻出流畅自然的声音 [6] 音乐生成模型Music 2.0 - Music 2.0模型能够精准捕捉与还原人声的细腻情绪和器乐的动态张力,在人声表现方面实现重大突破,音色无限接近真实人声 [7] - 模型支持生成结构完整、逻辑清晰的歌曲,单首时长可达5分钟,生成的旋律更容易记忆且能实现层次丰富的编曲 [7] 行业影响与战略意义 - 此次全模态模型发布反映出中国AI正从应用模仿转向算法原创,完成从"中国制造"到"中国创造"的战略转变 [8] - 公司的技术路径以性能比肩顶尖水平、成本实现普惠、算法勇于原创为特点,为全球AI发展提供了"中国方案" [8] - AI视频、语音、音乐生成技术的发布将为数字内容创作产业注入新的活力 [8]