Workflow
MiniMax进化论:一群「偏执者」的破浪前行
36氪·2025-07-01 21:54

大模型行业特征 - 大模型技术发展速度极快,3年时间从默默无闻到改变世界,具备工业革命特质 [2] - 行业竞争激烈,头部玩家快速更迭,百亿资本投入可能迅速沉寂 [2] - 传统互联网的护城河、资金壁垒、规模效应失效,创业公司有机会站上世界舞台 [2] - 行业生存法则为创新至上,淘汰周期以季度为单位 [3][4] MiniMax的技术突破 - Hailuo 02模型参数较Hailuo 01增长3倍,视频分辨率提升至原生1080P,支持10秒高清内容生成 [9] - Hailuo 02在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅1/9 [10][11] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [12] - M1模型支持100万token输入长度,是DeepSeek R1的8倍,输出token达8万个打破Gemini 2.5 Pro记录 [16] - M1在工具使用场景(TAU-bench)中领跑所有开源权重模型,30多轮长链路任务稳定性极高 [18] 创新架构与训练方法 - 早期探索MoE架构和混合注意力机制,1/8用自注意力,7/8用自创Lightning Attention [20] - CISPO算法替代传统PPO/GRPO,仅用3周时间、512块H800 GPU完成强化学习训练,成本53万美元 [21][23] - 生成10万token时推理算力仅需DeepSeek R1的25%,数学和编程任务效率更高 [23] Agent应用创新 - Hailuo Video Agent支持超百种视频模板,涵盖艺术片、广告片等体裁,打通完整视频生产链路 [28] - MiniMax Agent具备长期任务规划能力,内部使用60天,50%员工用于PPT制作、网页搭建等 [31] - Agent能生成复杂跳转逻辑网页,支持多模态理解与生成,完成动画、广告片等任务 [31] 公司发展历程 - 2022年初成立,早于ChatGPT引爆全球的时间 [33] - 2023年将80%算力投入MoE开发,2024年初推出国内首个MoE大模型 [34] - 2024年1月开源Lightning Attention技术,6月M1模型拿下开源模型全球第二 [34] - 持续探索更高智能水平,创新驱动发展 [35][36]