大模型商业化应用 - 财报，业绩电话会，研报，新闻

大模型商业化应用

搜索文档

硬AI· 2026-02-14 19:37

豆包2.0模型发布与核心升级 - 公司正式发布豆包大模型2.0系列，包含Pro、Lite、Mini三款通用Agent模型和专门的Code模型，标志着其进入2.0阶段 [3] - 旗舰版豆包2.0 Pro全面对标GPT-5.2与Gemini 3 Pro，在多数视觉理解基准测试中达到业界最高水平 [3] - 新模型在保持与业界顶尖模型相当性能的同时，将推理成本降低约一个数量级，显著提升了大规模生产环境下复杂任务执行的性价比 [2][3][12] 多模态能力表现 - 模型全面升级多模态能力，在视觉推理、感知能力、空间推理与长上下文理解等任务上表现突出 [6] - 在动态场景理解方面，模型在TVBench等关键测评中领先，在EgoTempo基准上甚至超过人类分数 [8] - 在长视频场景中，模型在大多数评测上超越其他顶尖模型，并在多个流式实时问答视频基准测试中表现优异，使其能够应用于实时视频流分析、环境感知、主动纠错与情感陪伴等场景 [8] 推理与专业能力 - 豆包2.0 Pro通过加强长尾领域知识，在SuperGPQA上分数超过GPT-5.2，并在HealthBench上获得第一名，在科学领域的整体成绩与Gemini 3 Pro和GPT-5.2相当 [10] - 模型在推理和Agent能力评测中表现出色，在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩，超越了Gemini 3 Pro在Putnam Bench上的表现 [10] - 在HLE-text（人类的最后考试）上，豆包2.0 Pro取得最高分54.2分，在工具调用和指令遵循测试中也有出色表现 [10] 成本优势与商业化应用 - 模型在保持顶尖性能的同时，token定价降低了约一个数量级，这一成本优势在大规模推理与长链路生成场景中成为关键竞争力 [4][12] - 基于OpenClaw框架和豆包2.0 Pro模型，公司在飞书上构建了智能客服Agent，能够完成客户对话、拉群求助、预约维修和主动回访等复杂任务 [13] - 这标志着公司在大模型商业化应用上迈出重要一步 [4] Code模型与开发效率 - 豆包2.0 Code基于2.0基座模型针对编程场景优化，强化了代码库解读能力、应用生成能力以及在Agent工作流中的纠错能力 [15] - 该模型已上线AI编程产品TRAE中国版作为内置模型，支持图片理解和推理 [15] - 开发者使用TRAE配合豆包2.0 Code，仅需1轮提示词就能构建出“TRAE春节小镇·马年庙会”互动项目的基本架构，经过5轮提示词即可完成整个包含11位AI驱动NPC的复杂作品 [15][16] 产品上线与未来规划 - 豆包2.0 Pro已面向C端用户在豆包App、电脑端和网页版上线“专家”模式；面向企业和开发者，火山引擎已同步上线豆包2.0系列模型API服务 [17] - 公司表示未来将继续面向真实场景迭代模型，探索智能上限 [18]

大模型商业化应用

多模态能力

Artificial Intelligence

Artificial Intelligence

豆包2.0

豆包2.0 Pro

豆包2.0 Code

字节豆包2.0发布：推理成本降一个数量级，正面对标GPT-5和Gemini 3

华尔街见闻· 2026-02-14 17:29

核心观点 - 字节跳动旗下豆包大模型正式进入2.0阶段，推出包含Pro、Lite、Mini及Code模型的系列升级版本，在性能对标GPT-5.2和Gemini 3 Pro等顶尖模型的同时，将推理成本降低约一个数量级，旨在为大规模生产环境下的复杂任务提供更具竞争力的解决方案 [1] - 该系列模型已全面上线，面向C端用户、企业及开发者提供服务，标志着公司在大模型商业化应用上迈出重要一步 [1] 产品发布与性能对标 - 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和专门的Code模型 [1] - 旗舰版豆包2.0 Pro全面对标GPT-5.2与Gemini 3 Pro，在多数视觉理解基准测试中达到业界最高水平 [1] - 该模型在数学奥赛IMO、CMO和编程竞赛ICPC中获得金牌成绩 [1] - 在科学领域的整体成绩与Gemini 3 Pro和GPT-5.2相当，并在HealthBench上获得第一名 [5] - 在HLE-text（人类的最后考试）上，豆包2.0 Pro取得最高分54.2分 [5] 多模态与视觉能力 - 豆包2.0全面升级多模态能力，在视觉推理、感知能力、空间推理与长上下文理解等任务上表现突出 [2] - 在动态场景理解方面，该模型在TVBench等关键测评中处于领先位置，在EgoTempo基准上甚至超过人类分数 [4] - 在长视频场景中，豆包2.0在大多数评测上超越其他顶尖模型，并在多个流式实时问答视频基准测试中表现优异 [4] - 这使得其能够作为AI助手完成实时视频流分析、环境感知、主动纠错与情感陪伴，实现从被动问答到主动指导的交互升级，可应用于健身、穿搭等陪伴场景 [4] 成本与商业化优势 - 该模型在保持与业界顶尖大模型相当效果的同时，token定价降低了约一个数量级 [7] - 在现实世界复杂任务中，由于大规模推理与长链路生成将消耗大量token，豆包2.0的成本优势将成为关键竞争力 [1] - 基于OpenClaw框架和豆包2.0 Pro模型，公司在飞书上构建了智能客服Agent，能通过调用不同技能完成客户对话，遇到难题时会主动拉群求助真人同事，帮客户预约上门维修人员，并在维修后主动回访和推荐产品 [7] 编程模型与应用 - 豆包2.0 Code基于2.0基座模型针对编程场景进行优化，强化了代码库解读能力和应用生成能力，并增强了模型在Agent工作流中的纠错能力 [8] - 该模型已上线TRAE中国版作为内置模型，支持图片理解和推理 [8] - 开发者使用TRAE配合豆包2.0 Code，仅需1轮提示词就能构建出“TRAE春节小镇·马年庙会”互动项目的基本架构和场景，经过5轮提示词即可完成整个作品 [8] - 该项目包含11位由大语言模型驱动的NPC，能根据人设自然聊天、招呼顾客、现场砍价，AI游客也会自主决定去哪家摊位、买什么、说什么 [8] 产品上线与未来规划 - 豆包2.0 Pro已接入豆包App、电脑端和网页版的“专家”模式，Code版本已集成至AI编程产品TRAE [1] - 火山引擎同步上线面向企业和开发者的API服务 [1] - 公司表示未来将继续面向真实场景迭代模型，探索智能上限 [8]

大模型商业化应用

多模态能力

Artificial Intelligence

Artificial Intelligence

豆包2.0

GPT-5.2

Gemini 3 Pro