整整21个月,豆包大模型正式进入2.0时代!
量子位·2026-02-14 16:13

豆包大模型2.0发布 - 公司发布了豆包大模型2.0,这是时隔21个月以来的最大版本更新 [1][2][8] 模型能力提升 - 模型在多模态理解、企业级Agent、推理和代码能力上均有显著提升 [9] - 在MathVista、MathVision、MathKangaroo、MathCanvas等数学推理基准上达到业界最优水平 [9] - 在LogicVista、VisuLogic等视觉解谜与逻辑推理基准上,Seed2.0 Pro得分较Seed1.8显著提升 [9] - 在VLMsAreBiased、VLMsAreBlind、BabyVision等基准中,取得了业界最高分 [11] 多模态与企业级能力 - 多模态理解能力出色,涵盖多模态感知、高精度文字提取、图表理解、空间理解、运动理解、视觉知识和推理、长视频理解等方面 [10] - 企业级Agent能力增强,能更好支持对技能的理解和应用,Function Call、多轮指令遵循、搜索和工具调用能力显著增强,格式输出更稳定,支持灵活的上下文管理,更好地支持企业级复杂、长程任务 [10] 数学与代码推理 - 模型具备更强推理能力,支持思考长度可调节,且各思考长度下,Tokens效率都有大幅提升 [10] - 在ICPC、IMO、CMO测试中均获得金牌成绩 [10] - 实测显示,模型能很好地理解并生成复杂的代码,例如基于群论的魔方解决算法前端页面、3D版大富翁游戏,甚至《我的世界》游戏 [13][16][17][20] - 能处理复杂的数学公式图解问题和数学问题 [22][23][25] 性能与成本优势 - 虽然能力变强,但推理速度没有明显延迟 [35] - Seed-2.0系列通过架构优化,在同等性能下大幅提升了Tokens效率,意味着企业应用成本可能更低 [35][36] 行业与战略意义 - 此次发布可能意味着公司在数据质量、训练效率及应用效果上突破了一个新的临界点 [33] - 模型展现出的工具调用和长程任务规划能力,显示其战略方向是面向ToB市场和生产力工具 [34] - 模型不再局限于聊天,而是致力于帮助用户完成项目、解决难题、生成商用级内容 [30]