Workflow
五连发!MiniMax发布周掀起全球AI技术风暴
环球网资讯·2025-06-23 17:25

技术发布周概述 - 公司MiniMax通过"技术发布周"展示在基座模型、多模态技术、通用智能体Agent和视频Agent等领域的全面突破,为全球AI竞赛注入新变量 [1] - 发布内容包括全球首个开源大规模混合架构推理模型MiniMax-M1、视频模型Hailuo-02、MiniMax Agent、Hailuo Agent和音色设计Voice Design [1] MiniMax-M1模型 - MiniMax-M1是全球首个开源大规模混合架构推理模型,在性能比肩顶尖闭源模型的同时实现极致成本效益 [1] - 采用"闪电注意力"混合架构与CISPO算法,支持100万上下文输入和8万Token推理输出,算力消耗仅为DeepSeek R1的30% [2] - 在Artificial Analysis Intelligence Index榜单中位列全球开源模型第二名 [2] - 强化学习阶段仅使用512块H800 GPU,耗时三周,成本53.5万美元,比预期少一个数量级 [4] - 海外开发者广泛讨论,被VentureBeat称为"正在搅动全球模型格局",The Decoder将其性能对标Google Gemini 2.5 Pro [4] Hailuo 02视频模型 - Hailuo 02视频生成模型以"世界一流效果"和"颠覆性成本效益"叫板Veo3等国际顶尖模型 [6] - 采用Noise-aware Compute Redistribution架构,模型参数和训练数据量分别提升3倍和4倍,效率提升2.5倍 [6] - 在Artificial Analysis视频竞技场中位列全球第二,领先Google Veo3和快手可灵,价格显著低于Runway等同行 [6][7] - 实现原生1080P电影级画面,是全球唯一能处理高复杂物理场景的视频大模型,如体操翻转和喷火互动 [10] - 已帮助全球200个国家创作者生成超过3.7亿个视频 [12] MiniMax Agent - MiniMax Agent是能完成长程复杂任务的通用智能体,可多步规划专家级解决方案并执行多个子任务 [12] - 在内部使用两个月后已成为超过50%员工的日常工具,能处理投资策略分析、深度解析和艺术导览等任务 [13] Hailuo Video Agent - 是国内首个"成片直出"视频创作Agent,通过自然语言输入一键生成专业级视频 [13] - 创新实现自然语言驱动全局、全流程工具集和创作过程可视化三大技术 [14] - 计划通过三阶段进化提升创作自由度,第二阶段工具将于2025年夏季推出 [14] Voice Design语音模型 - Voice Design是Speech 02语音模型的功能更新,支持通过自然语言描述生成任意音色 [14] - Speech-02已登顶Artificial Analysis语音评测榜单,累计生成1.5亿小时语音,与30个国家客户合作 [15] 行业影响 - 公司创新路径证明通过算法和架构优化可打破"算力-资本"壁垒,为全球AI发展提供第二条道路 [16] - 开源策略是对技术封锁的反击,推动全球AI平权并促进行业回归健康竞争 [17]