Workflow
美团LongCat-Flash-Omni正式发布并开源 开启全模态实时交互时代
中国金融信息网·2025-11-03 12:20

公司动态 - 美团于11月3日发布并开源全新自研大模型LongCat-Flash-Omni,同步上线LongCat官方App开启公测 [1] - 新App已支持联网搜索和语音通话功能,视频通话功能将稍后上线,Web端增加图片、文件上传和语音通话功能 [1] - 此次是继9月1日发布开源大模型LongCat-Flash-Chat后,公司再次将大模型作为完整产品开放给行业与开发者 [2] 产品技术特点 - LongCat-Flash-Omni模型总参数规模达5600亿,集成高效多模态感知与语音重建模块,实现低延迟实时音视频交互 [1] - 模型采用渐进式早期多模融合训练策略,逐步融入文本、音频、视频等模态,确保全模态性能强劲且无单模态性能退化 [2] - 模型被公司称为业界首个实现“全模态覆盖、端到端架构、大参数量高效推理”于一体的开源大语言模型 [1] 性能与行业地位 - 模型在Omni-Bench和WorldSense等全模态基准测试上达到开源最先进水平,在文本、图像、音频、视频各模态能力位居开源模型前列 [2] - 公司宣称该模型凭借创新架构与工程优化,实现大参数模型在多模态任务中的毫秒级响应,解决行业推理延迟痛点 [1] - 该模型首次在开源范畴内实现对标闭源模型的全模态能力 [1]