大模型行业趋势 - 大模型技术以常规技术乘十的速度进化,颠覆互联网时代的生态护城河、资金壁垒和规模效应,使创业公司也能站上世界舞台中心 [1] - 行业生存法则已转变为"创新至上",传统互联网玩法彻底失效,淘汰周期缩短至季度为单位 [2][3] - 百模大战后,Open AI、Anthropic、MiniMax、DeepSeek等创业公司占据SOTA榜单大半,巨头优势被灵活创新机制瓦解 [10] MiniMax技术突破 视频模型Hailuo 02 - 参数量较前代增长3倍,分辨率达原生1080P,支持10秒高清内容生成,涵盖复杂物理交互与专业级运镜 [6] - 在Artificial Analysis Video Arena的Image-to-Video榜单全球第二,性能超Google Veo3但API成本仅其1/9 [7] - 采用NCR架构减少HBM内存读写量70%,训练与推理效率提升2.5倍 [9] 大模型M1 - 4560亿参数,原生支持100万token输入(DeepSeek R1的8倍)和8万token输出(超Gemini 2.5 Pro) [11] - 采用混合注意力机制(1/8自注意力+7/8线性注意力),实现长上下文窗口技术突破 [16] - CISPO算法使强化训练仅需3周+512块H800 GPU(成本53万美元),推理算力为DeepSeek R1的25% [17][19] 商业化与生态构建 Agent应用创新 - Hailuo Video Agent支持超百种视频模板,实现创意构思到成片的全链路生产,连续6个月全球视频生成AI榜首 [21][23] - 通用Agent可完成长程复杂任务(如网页搭建、PPT制作),内部使用率达50%,具备跨模态理解与生成能力 [24] - 基座模型与Agent形成技术闭环,性能优化与成本控制优势显著 [25] 公司发展路径 - 2022年初成立并提前布局MoE模型,2024年推出国内首个MoE大模型 [26] - 开源Lightning Attention技术,突破Transformer架构限制 [26] - 创新驱动战略使M1半年内登顶开源模型全球第二,通用Agent解决跨模态长距离任务难题 [27][28]
MiniMax 进化论:一群「偏执者」的破浪前行
36氪·2025-07-01 22:00