豆包大模型2.0发布 - 字节跳动宣布豆包大模型正式进入2.0阶段,围绕大规模生产环境使用需求进行系统性优化,具备高效推理、多模态理解与复杂指令执行能力 [1] - 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型,以灵活适配各类业务场景 [1] 产品矩阵与部署 - 豆包2.0 Pro已在豆包App、电脑端和网页版上线,用户选择“专家”模式即可体验 [1] - 面向企业和开发者,火山引擎已上线豆包2.0系列模型的API服务 [1] - 豆包2.0 Code模型已接入AI编程产品TRAE [1] 模型性能与能力升级 - 多模态理解能力全面升级,在各类视觉理解任务上达到世界顶尖水平,视觉推理、感知能力、空间推理与长上下文理解能力表现突出 [2] - 在动态场景理解方面,模型强化了对时间序列与运动感知的理解能力,在TVBench等关键测评中领先,并在EgoTempo基准上超过了人类分数 [4] - 在长视频场景中,模型在大多评测上超越其他顶尖模型,在多个流式实时问答视频基准测试中表现优异,能完成实时视频流分析、环境感知、主动纠错与情感陪伴 [4] - 通过加强长尾领域知识,豆包2.0 Pro在SuperGPQA上分数超过GPT 5.2,并在HealthBench上拿到第一名,在科学领域的整体成绩与Gemini 3 Pro和GPT 5.2相当 [5] - 在推理和Agent能力评测中,豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,超越了Gemini 3 Pro在Putnam Bench上的表现 [5] - 在HLE-text(人类的最后考试)上,豆包2.0 Pro取得最高分54.2分,在工具调用和指令遵循测试中也有出色表现 [5] 模型定位与成本优势 - 豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro [6] - 豆包2.0 Lite兼顾性能与成本,综合能力超越上一代主力模型豆包1.8 [6] - 豆包2.0 Mini面向低时延、高并发与成本敏感场景 [6] - 豆包2.0的模型效果与业界顶尖大模型相当,但token定价降低了约一个数量级,在复杂任务中成本优势更为关键 [8] 编程场景应用 - 豆包2.0 Code是基于2.0基座模型、针对编程场景优化的版本,强化了代码库解读和应用生成能力,并增强了Agent工作流中的纠错能力 [9] - 该模型已上线TRAE中国版作为内置模型,支持图片理解和推理 [9] - 以开发“TRAE 春节小镇 · 马年庙会”互动项目为例,通过TRAE+豆包2.0 Code,仅需1轮提示词构建基本架构,总共5轮提示词即可完成作品 [9]
字节跳动豆包大模型2.0发布,多数基准达SOTA水平
搜狐财经·2026-02-14 23:57