美团推出LongCat-Flash-Lite
公司产品发布 - 公司推出名为“LongCat-Flash-Lite”的轻量化MoE模型 [1] - 该模型总参数为685亿,但每次推理仅激活29亿至45亿参数 [1] - 模型将超过300亿参数高效用于嵌入层 [1] 产品技术特点与性能 - 模型在智能体与代码领域表现突出 [1] - 依托YARN技术,模型可支持最长256K上下文长度 [1] - 模型能高效处理长文档、大规模代码分析等应用场景 [1]
公司产品发布 - 公司推出名为“LongCat-Flash-Lite”的轻量化MoE模型 [1] - 该模型总参数为685亿,但每次推理仅激活29亿至45亿参数 [1] - 模型将超过300亿参数高效用于嵌入层 [1] 产品技术特点与性能 - 模型在智能体与代码领域表现突出 [1] - 依托YARN技术,模型可支持最长256K上下文长度 [1] - 模型能高效处理长文档、大规模代码分析等应用场景 [1]