酒店经营的垂类 AI Agent 美团既白

搜索文档
美团“Building LLM ”进展首度曝光:发布并开源LongCat
环球网· 2025-09-01 13:07
模型架构与参数 - 采用创新性混合专家模型架构 总参数560B 激活参数范围18.6B-31.3B 平均激活27B [2] - 引入零计算专家机制 实现算力按需分配和高效利用 [4] - 层间铺设跨层通道 使通信和计算能并行 提高训练和推理效率 [5] 性能表现 - 在多项基准测试中性能比肩主流领先模型 智能体任务具突出优势 [2] - 在H800上实现单用户100+ tokens/s的推理速度 [5] - 输出成本低至5元/百万token 同时保持极致生成速度 [7] 训练优化 - 训练采用PID控制器实时微调专家偏置 将单token平均激活量稳定在约27B [4] - 通过超参迁移和改进训练方式 在30天内完成高效训练 [5] - 自建Agentic评测集指导数据策略 使用多智能体方法生成高质量轨迹数据 [7] 应用场景 - 更快的推理速度特别适合耗时较长的复杂智能体应用 [2] - 模型开源是公司Building LLM战略进展的首度曝光 [4] - 公司已发布AI Coding Agent工具NoCode AI经营决策助手袋鼠参谋等AI应用 [4]
美团“Building LLM ”进展首度曝光:发布并开源LongCat-Flash-Chat 输出成本低至5元/百万token
环球网· 2025-09-01 11:49
模型架构与性能 - 采用创新混合专家模型架构 总参数560B 激活参数范围18.6B-31.3B 平均激活27B [2] - 引入零计算专家机制 实现算力按需分配和高效利用 [4] - 层间铺设跨层通道 使通信与计算并行 大幅提升训练和推理效率 [5] 性能表现 - 在多项基准测试中性能比肩主流领先模型 智能体任务表现突出 [2] - 在H800上实现单用户100+ tokens/s推理速度 输出成本低至5元/百万token [5][7] - 通过算法工程联合设计 理论成本与速度大幅领先同业同等规模模型 [7] 训练优化 - 采用PID控制器实时微调专家偏置 将单token平均激活量稳定在27B [4] - 30天内完成高效训练 使用超参迁移技术改进训练方式 [5] - 自建智能体评测集指导数据策略 采用多智能体方法生成高质量轨迹数据 [7] 应用场景 - 非思考型基础模型 具备更快推理速度 适合耗时较长的复杂智能体应用 [2] - 模型开源是公司Building LLM战略进展的首度曝光 [4] - 公司今年已发布AI Coding Agent/经营决策助手/酒店AI Agent等多款应用 [4]
美团发布并开源 LongCat-Flash-Chat,动态计算开启高效 AI 时代
中金在线· 2025-09-01 10:28
公司AI模型发布 - 美团于9月1日正式发布并开源LongCat-Flash-Chat模型 同步上线官网及Github、Hugging Face平台 [1][3] - 模型采用混合专家模型架构 总参数量560B 激活参数范围18.6B-31.3B 平均激活27B参数 [3][5] - 通过零计算专家机制实现算力按需分配 配合PID控制器将单token平均激活量稳定在27B [5] 模型性能表现 - 在多项基准测试中性能比肩主流模型 智能体任务表现突出 推理速度明显更快 [3] - 在H800上实现单用户100+ tokens/s的推理速度 输出成本低至5元/百万token [6][7] - 通过跨层通道设计使通信与计算并行 30天内完成高效训练 [6] 技术架构创新 - 采用超参迁移和模型层叠加训练方式 结合多策略保证训练稳定性 [6] - 自建Agentic评测集指导数据策略 通过多智能体方法生成高质量轨迹数据 [7] - 通过算法与工程联合设计 理论成本与速度领先同业同等或更小规模模型 [7] 公司AI战略布局 - 本次模型开源是Building LLM战略的首度曝光 [5] - 公司2024年已发布AI Coding Agent工具NoCode、AI经营决策助手袋鼠参谋及酒店AI Agent美团既白等多款应用 [5] - AI战略建立在AI at work、AI in products及Building LLM三个层面 [5]