字节跳动豆包大模型2.0发布，多数基准达SOTA水平

豆包大模型2.0发布 - 字节跳动宣布豆包大模型正式进入2.0阶段，围绕大规模生产环境使用需求进行系统性优化，具备高效推理、多模态理解与复杂指令执行能力 [1] - 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型，以灵活适配各类业务场景 [1] 产品矩阵与部署 - 豆包2.0 Pro已在豆包App、电脑端和网页版上线，用户选择“专家”模式即可体验 [1] - 面向企业和开发者，火山引擎已上线豆包2.0系列模型的API服务 [1] - 豆包2.0 Code模型已接入AI编程产品TRAE [1] 模型性能与能力升级 - 多模态理解能力全面升级，在各类视觉理解任务上达到世界顶尖水平，视觉推理、感知能力、空间推理与长上下文理解能力表现突出 [2] - 在动态场景理解方面，模型强化了对时间序列与运动感知的理解能力，在TVBench等关键测评中领先，并在EgoTempo基准上超过了人类分数 [4] - 在长视频场景中，模型在大多评测上超越其他顶尖模型，在多个流式实时问答视频基准测试中表现优异，能完成实时视频流分析、环境感知、主动纠错与情感陪伴 [4] - 通过加强长尾领域知识，豆包2.0 Pro在SuperGPQA上分数超过GPT 5.2，并在HealthBench上拿到第一名，在科学领域的整体成绩与Gemini 3 Pro和GPT 5.2相当 [5] - 在推理和Agent能力评测中，豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩，超越了Gemini 3 Pro在Putnam Bench上的表现 [5] - 在HLE-text（人类的最后考试）上，豆包2.0 Pro取得最高分54.2分，在工具调用和指令遵循测试中也有出色表现 [5] 模型定位与成本优势 - 豆包2.0 Pro面向深度推理与长链路任务执行场景，全面对标GPT 5.2与Gemini 3 Pro [6] - 豆包2.0 Lite兼顾性能与成本，综合能力超越上一代主力模型豆包1.8 [6] - 豆包2.0 Mini面向低时延、高并发与成本敏感场景 [6] - 豆包2.0的模型效果与业界顶尖大模型相当，但token定价降低了约一个数量级，在复杂任务中成本优势更为关键 [8] 编程场景应用 - 豆包2.0 Code是基于2.0基座模型、针对编程场景优化的版本，强化了代码库解读和应用生成能力，并增强了Agent工作流中的纠错能力 [9] - 该模型已上线TRAE中国版作为内置模型，支持图片理解和推理 [9] - 以开发“TRAE 春节小镇 · 马年庙会”互动项目为例，通过TRAE+豆包2.0 Code，仅需1轮提示词构建基本架构，总共5轮提示词即可完成作品 [9]