美团新模型有点东西:像调度外卖运力一样优化大模型
技术创新 - 采用类似外卖派单的算力调度逻辑 实现按需分配算力资源 总参数规模5600亿但每个token实际调用仅需18.6B–31.3B参数 [2] - 引入零计算专家机制 对简单token直接放行不消耗算力 平均激活专家数稳定在8个左右 激活参数约27B [3][5] - 创新ScMoE架构实现计算与通信重叠 在保持模型质量前提下显著提升吞吐率和推理速度 [6][8] 工程能力 - 采用渐进式训练方式 先在小型网络验证调度规则再扩大规模 30天内完成20万亿tokens训练任务 [9] - 设置三重稳定保障机制:路由稳定避免算力集中 激活稳定优化资源使用 优化器稳定确保长期运行 [9] 性能表现 - 通用任务达到国际一线水准 MMLU得分89.71 CEval得分90.44 中文理解能力突出 [10] - 复杂推理任务表现稳健 GPQA-diamond得分73.23 DROP得分79.06 ZebraLogic得分89.30 [11] - 数学能力维持高水平 MATH500得分96.40 AIME24得分70.42 BeyondAIME得分43.00 [13] - 编程任务稳定优于部分竞品 HumanEval+得分88.41 MBPP+得分79.63 [14] 效率优势 - 实测响应速度显著快于同类产品 在代码生成任务中实现"又快又好"的输出效果 [16][17][18] - 将百万tokens推理成本压缩至0.7美元 形成显著价格优势 [2] 战略定位 - 以运力调度思维切入AI赛道 通过效率优化和成本控制构建差异化竞争力 [2][20] - 采用价格杠杆策略 延续公司擅长的市场拓展打法 [20]