Workflow
vivo发布端侧多模态模型,只有3B可理解GUI界面,20项评测表现亮眼
量子位·2025-07-09 17:06

vivo AI Lab 投稿 量子位 | 公众号 QbitAI vivo AI Lab发布AI多模态新模型了,专门面向 端侧 设计,紧凑高效~ 能够 直接理解GUI页面 的那种: 兼具 多模态推理和文本 的推 理能力 ,思考范围扩展: 模型 BlueLM-2.5-3B ,融合文本和图文的理解和推理能力,支持长短思考模式自由切换,并引入思考预算控制机制。 与同尺寸模型相比,BlueLM-2.5-3B在多个文本与多模态评测任务中表现出色。 BlueLM-2.5-3B 支持思考预算控制 (thinking token budget) ,有效平衡思考深度和推理成本: 另外值得一提的是,作者对模型结构与训练策略进行了深度优化,显著降低了训练和推理成本。通过优质数据筛选、自动配比策略以及大规模 推理合成数据,模型的数据利用效率大幅提升。 同时,模型训练全过程由自建的高性能训练平台与框架高效支撑,确保了训练效率和训练稳定性。 以下是更多细节。 在20余项评测任务中表现出色 BlueLM-2.5-3B在20余项评测任务中展现出如下核心优势: 1、文本任务 表现出色,缓解 能力遗忘难题 BlueLM-2.5-3B在thinki ...