美团新模型有点东西：像调度外卖运力一样优化大模型

技术创新 - 采用类似外卖派单的算力调度逻辑实现按需分配算力资源总参数规模5600亿但每个token实际调用仅需18.6B–31.3B参数 [2] - 引入零计算专家机制对简单token直接放行不消耗算力平均激活专家数稳定在8个左右激活参数约27B [3][5] - 创新ScMoE架构实现计算与通信重叠在保持模型质量前提下显著提升吞吐率和推理速度 [6][8] 工程能力 - 采用渐进式训练方式先在小型网络验证调度规则再扩大规模 30天内完成20万亿tokens训练任务 [9] - 设置三重稳定保障机制：路由稳定避免算力集中激活稳定优化资源使用优化器稳定确保长期运行 [9] 性能表现 - 通用任务达到国际一线水准 MMLU得分89.71 CEval得分90.44 中文理解能力突出 [10] - 复杂推理任务表现稳健 GPQA-diamond得分73.23 DROP得分79.06 ZebraLogic得分89.30 [11] - 数学能力维持高水平 MATH500得分96.40 AIME24得分70.42 BeyondAIME得分43.00 [13] - 编程任务稳定优于部分竞品 HumanEval+得分88.41 MBPP+得分79.63 [14] 效率优势 - 实测响应速度显著快于同类产品在代码生成任务中实现"又快又好"的输出效果 [16][17][18] - 将百万tokens推理成本压缩至0.7美元形成显著价格优势 [2] 战略定位 - 以运力调度思维切入AI赛道通过效率优化和成本控制构建差异化竞争力 [2][20] - 采用价格杠杆策略延续公司擅长的市场拓展打法 [20]