AI Coding Agent工具NoCode

搜索文档
LongCat实测:回答自带“美团基因”!美团开源大模型是防御性盾牌还是新增长引擎?
每日经济新闻· 2025-09-01 22:49
公司AI大模型产品发布 - 美团正式发布开源大模型产品LongCat-Flash-Chat(中文名:龙猫),同步上线Github、Hugging Face及官网 [2] - 该模型采用混合专家架构,总参数560B,激活参数18.6B至31.3B(平均27B),实现计算效率与性能双重优化 [5] - 在H800上达成100 token/s生成速度,输出成本低至5元/百万token,理论成本与速度大幅领先行业同等规模模型 [4] 产品功能特性 - 模型主打Agent和通用性性能,聚焦短模型设计,适用于MCP服务和客服场景 [4] - 生成内容会主动植入美团业务品牌(如"美团,让思念比月光先到"),并关联具体产品(如美团买菜、美食节活动) [5][9] - 当前仅支持联网搜索生成功能,"深度思考"功能暂未上线 [10] 公司AI战略布局 - AI战略分为三层:AI在工作中的应用、AI在产品中的应用、构建内部大语言模型,LongCat是Building LLM项目首度曝光 [11] - 每年AI投入超百亿元,主要因GPU成本高昂,但认为投入可使历史积累大数据发挥新价值 [12] - 通过投资收购光年之外、智谱、月之暗面等大模型企业抢占AI先机 [11] 行业竞争态势 - 互联网公司均已进入AI大模型赛道,美团入局主要为防止对手用AI颠覆行业而非追求增量 [4][14] - 本地生活领域因劳动力密集、高频互动特点,具备人工智能改造潜力 [14] - 阿里因算力芯片开发及通义千问全球影响力扩大,在资本市场获得更高业务想象力 [14]
美团首个大模型被爆成功跑通国产化训练路径,可在国产加速卡上进行
观察者网· 2025-09-01 21:29
模型发布与开源 - 美团于9月1日正式发布并开源LongCat-Flash-Chat模型 同步上线官网 在Github和Hugging Face平台开放访问 [1] - 模型采用创新性混合专家模型架构 总参数规模达560B 激活参数范围18.6B-31.3B 平均激活27B参数 [1][3] - 通过零计算专家机制实现算力按需分配 采用PID控制器实时微调专家偏置 将单token平均激活量稳定在27B [3] 技术架构创新 - 引入跨层通道设计 使MoE通信与计算并行化 显著提升训练和推理效率 [4] - 采用超参迁移和模型层叠加训练方式 结合多策略保障训练稳定性 实现30天内高效完成训练 [4] - 自建Agentic评测集指导数据策略 使用多智能体方法生成多样化高质量轨迹数据 [6] 性能表现 - 在H800上实现单用户100+tokens/s的推理速度 生成速度达100 token/s [4][6] - 输出成本低至5元/百万token 在保持极致生成速度的同时实现成本优势 [6] - 多项基准测试显示其性能比肩主流领先模型 在智能体任务中具备突出优势 [1] 战略背景 - 模型发布与公司AI战略三层框架直接相关 包括AI at work、AI in products和Building LLM [3] - 此次开源是Building LLM进展的首度曝光 此前已发布AI Coding Agent工具NoCode、AI经营决策助手袋鼠参谋等应用 [3]