Workflow
美团发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
中金在线·2025-09-01 10:28

公司AI模型发布 - 美团于9月1日正式发布并开源LongCat-Flash-Chat模型 同步上线官网及Github、Hugging Face平台 [1][3] - 模型采用混合专家模型架构 总参数量560B 激活参数范围18.6B-31.3B 平均激活27B参数 [3][5] - 通过零计算专家机制实现算力按需分配 配合PID控制器将单token平均激活量稳定在27B [5] 模型性能表现 - 在多项基准测试中性能比肩主流模型 智能体任务表现突出 推理速度明显更快 [3] - 在H800上实现单用户100+ tokens/s的推理速度 输出成本低至5元/百万token [6][7] - 通过跨层通道设计使通信与计算并行 30天内完成高效训练 [6] 技术架构创新 - 采用超参迁移和模型层叠加训练方式 结合多策略保证训练稳定性 [6] - 自建Agentic评测集指导数据策略 通过多智能体方法生成高质量轨迹数据 [7] - 通过算法与工程联合设计 理论成本与速度领先同业同等或更小规模模型 [7] 公司AI战略布局 - 本次模型开源是Building LLM战略的首度曝光 [5] - 公司2024年已发布AI Coding Agent工具NoCode、AI经营决策助手袋鼠参谋及酒店AI Agent美团既白等多款应用 [5] - AI战略建立在AI at work、AI in products及Building LLM三个层面 [5]