GPT 5.2
搜索文档
从Gemini到豆包:全球两大AI巨头为何走上同一条路?
第一财经· 2026-02-14 23:19
豆包大模型2.0发布概览 - 字节跳动于2月14日正式推出豆包大模型2.0系列,这是其自2023年初始测试版上线、2024年正式发布后的又一次重大代际更新[1] - 此次2.0版本具备全栈模型矩阵、多模态理解、企业级Agent和极致成本四大差异化优势,已跻身全球第一梯队,成为Agent时代的关键玩家[1] - 在多项公开测试集上表现突出,接近Google Gemini3,并具备更高性价比[1] 模型定位与战略共识 - 旗舰版豆包2.0 Pro定位为“面向深度推理与长链路任务执行场景”,官方明确表示其全面对标GPT 5.2与Gemini 3 Pro[2] - 豆包2.0与Google Gemini的相似性正从“对标”走向“一致”,这反映了全球顶尖AI实验室在通往通用人工智能路径上达成的战略共识,即AI最终需要为人类完成任务执行,这需要对真实世界物理运行规律的理解[2] 模型系列与核心能力升级 - 豆包2.0系列提供Pro、Lite、Mini三款不同尺寸的通用Agent模型,其多模态理解能力实现全面升级,并强化了LLM与Agent能力,使模型能在真实长链路任务中稳定推进[4] - 在语言模型基础能力上,豆包2.0 Pro旗舰版在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌成绩,数学和推理能力达到世界顶尖水平[4] - 模型加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上也排名前列[4] 多模态与Agent能力表现 - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现[5] - 面对动态场景,模型强化了对时间序列与运动感知的理解能力,该能力已应用于智能健身App实时动作纠正、穿搭建议、老人看护等领域[5] - 在Agent能力上,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶尖水平,在HLE-Text上获得54.2的最高分,大幅领先于其他模型[5] 产品上线与定价策略 - 豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择专家模式即可体验,火山引擎也已上线该系列模型的API服务[6] - 价格方面,豆包2.0 Pro按输入长度区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势[6] - 豆包2.0 Lite极具性价比,综合性能超越上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元[6] 核心突破:任务执行与成本优化 - 此次升级的核心落点是“真实世界复杂任务的执行力”,其根基在于多模态理解层的突破,让模型能从“答题者”进化为“执行者”[7] - 公司团队认为,现有LLM Agent在现实任务中碰壁的原因主要在于难以自主构建高效工作流以处理长时间跨度、多阶段的任务,以及专业领域的经验知识位于训练语料的长尾区[7] - 在提升长程任务执行能力的同时,模型还进一步降低了推理成本,其效果与业界顶尖大模型相当,同时token定价降低了约一个数量级,这对于消耗大量token的复杂任务至关重要[7] 多模态能力详解与行业对标 - 豆包2.0 Pro在视觉推理、空间感知、运动理解、长视频理解等维度的大多数相关基准测试中取得最高分[8] - 此前刷屏的AI视频模型Seedance 2.0(具备原声音画同步、多镜头长叙事、多模态可控生成能力)正是其多模态能力支撑的体现之一[8] - 豆包2.0可以处理复杂视觉输入并完成实时交互和应用生成,其升级方向与Google Gemini 3 Pro在视频理解、空间推理上的优势高度一致,均强调“原生多模态”能力,即在底层实现跨模态的深度对齐[8] 行业趋势:世界模型竞赛 - 豆包2.0与Gemini在基础模型层面均选择专注于多模态,本质上是在进行一场“世界模型”的军备竞赛[9] - 行业目标不再满足于让AI成为“语言游戏高手”,而是希望其成为能看懂、听懂、理解物理世界复杂性的“数字人类”,只有真正理解物理世界,AI才能在现实世界中可靠地执行任务[9]
Seedance 2.0之后 字节跳动发布豆包大模型2.0
中国经营报· 2026-02-14 18:22
公司发布与产品升级 - 字节跳动于2月14日正式发布豆包大模型2.0系列 该系列针对大规模生产环境使用需求完成系统性优化 核心聚焦提升真实世界复杂任务的执行能力 [1] - 此次发布是公司继Seedance 2.0视频模型、Seedream 5.0 Lite图像模型后 在大模型领域的又一重要布局 [1] 模型性能与基准测试 - 豆包2.0 Pro旗舰版展现出顶尖的基础能力 在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌 在Putnam基准测试上的表现超越Gemini 3 Pro 数学与推理能力跻身世界前列 [1] - 在知识储备层面 豆包2.0强化了长尾领域知识覆盖 科学领域知识测试成绩与Gemini 3 Pro、GPT 5.2持平 跨学科知识应用表现位居行业前列 [1] - 多模态能力全面升级 在视觉推理、空间感知、长上下文理解等权威测试中取得业界最佳成绩 可高效理解图表、复杂文档、视频等内容 [1] - 模型对时间序列与运动感知的理解能力进一步增强 能实现实时视频流分析、环境感知与主动交互 可落地于健身指导、看护陪伴等多元生活场景 [1] Agent能力与评测 - 作为大模型行动力的核心 豆包2.0 Pro的Agent能力表现亮眼 在指令遵循、工具调用等评测中达到顶级水平 [2] - 在HLE-Text评测中 豆包2.0 Pro斩获54.2的最高分 领先其他模型 [2] 产品上市与定价策略 - 豆包2.0 Pro已在豆包App、电脑客户端及网页版上线 用户开启“专家”模式即可体验 [2] - 火山引擎同步上线了豆包2.0系列模型API服务 [2] - 定价方面 豆包2.0 Pro版32k以内输入定价为3.2元/百万tokens 输出定价为16元/百万tokens 相较Gemini 3 Pro、GPT 5.2更具性价比 [2] - Lite版百万tokens输入定价仅0.6元 其综合性能超越了两个月前发布的豆包1.8 [2]
AI大战持续升级!Seedance 2.0之后,字节跳动又发布豆包大模型2.0
广州日报· 2026-02-14 17:06
豆包大模型2.0发布与核心能力 - 字节跳动于2月14日宣布推出豆包大模型2.0系列,针对大规模生产环境进行系统性优化,旨在更好地完成真实世界的复杂任务 [1] - 豆包2.0 Pro旗舰版在语言模型基础能力上表现突出,在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌成绩,并超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平 [1] - 模型加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上排名前列 [1] 1. 豆包2.0 Pro在HLE-Text评测中获得54.2的最高分,大幅领先于其他模型 [3] - 豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择「专家」模式即可体验,火山引擎也已上线该系列模型的API服务 [3] 多模态与Agent能力升级 - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现 [3] - 模型增强了对时间序列与运动感知的理解能力,可实现实时视频流分析、环境感知与主动交互,广泛应用于健身指导、穿搭建议、看护陪伴等生活场景 [3] - 在Agent能力方面,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平 [3] 定价策略与成本优势 - 豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势 [4] - 豆包2.0 Lite极具性价比,综合性能超越上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元 [4] 行业竞争格局与战略意义 - 2026年春节成为AI大厂的核心竞技场,字节、阿里、腾讯、百度豪掷超45亿展开角逐,竞争已从技术参数比拼转向真实场景落地的较量 [5] - 各大厂依托自身生态发力,字节跳动凭借豆包大模型2.0的顶尖推理能力、多模态理解能力和成本优势,持续强化其AI在用户生活场景中的应用能力 [5] - 春节大战的核心是抢占用户心智和AI生态入口,关键在于将硬核技术转化为用户可感知的实用价值,从而在AI全民普及浪潮中占据先机 [5]
Seedance2.0之后 字节发布豆包大模型2.0
南方都市报· 2026-02-14 15:07
公司产品发布与核心能力 - 字节跳动于2月14日宣布推出豆包大模型2.0系列,该系列针对大规模生产环境进行系统性优化,旨在更好地完成真实世界的复杂任务 [1] - 豆包2.0 Pro旗舰版在数学和推理能力上达到世界顶尖水平,其在国际数学奥林匹克(IMO)、国际数学奥林匹克竞赛(CMO)和国际大学生程序设计竞赛(ICPC)中取得金牌成绩,并超越了Gemini 3 Pro在Putnam基准测试上的表现 [1] - 豆包2.0加强了长尾领域知识覆盖,在SuperGPQA等多项科学领域知识测试中,成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上排名前列 [1] - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现 [1] - 豆包2.0增强了对时间序列与运动感知的理解能力,可实现实时视频流分析、环境感知与主动交互,应用于健身指导、穿搭建议、看护陪伴等生活场景 [2] 模型性能与定价策略 - 豆包2.0 Pro在Agent能力评测中达到顶级水平,在HLE-Text(人类的最后考试)上获得54.2的最高分,大幅领先于其他模型 [2] - 豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户可通过“专家”模式体验,其API服务也已通过火山引擎上线 [2] - 豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势 [2] - 豆包2.0 Lite极具性价比,综合性能超越两个月前发布的上一代主力模型豆包1.8,其百万tokens输入价格仅为0.6元 [2]
豆包大模型2.0正式发布
新华网财经· 2026-02-14 15:04
豆包大模型2.0发布 - 豆包大模型正式进入2.0阶段,围绕大规模生产环境下的使用需求做了系统性优化,依托高效推理、多模态理解与复杂指令执行能力,以更好地完成真实世界复杂任务 [1] 豆包2.0系列模型构成与定位 - 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和一款Code模型,旨在灵活适配各类业务场景 [2] - 豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro [2] - 豆包2.0 Lite兼顾性能与成本,综合能力超越上一代主力模型豆包1.8 [2] - 豆包2.0 Mini面向低时延、高并发与成本敏感场景 [2] - 豆包2.0 Code版专为编程场景打造,与TRAE结合使用效果更佳 [2]
豆包大模型2.0发布 包含三款通用Agent模型和Code模型
凤凰网· 2026-02-14 14:51
豆包大模型2.0产品发布 - 字节跳动宣布发布豆包大模型2.0系列,包含Pro、Lite、Mini三款通用Agent模型和一款Code模型 [1] - 该系列模型围绕大规模生产环境使用需求进行系统性优化,旨在提升多模态理解、复杂指令执行及长程任务处理能力 [1] 产品定位与对标 - 豆包2.0 Pro面向深度推理与长链路任务,对标GPT 5.2与Gemini 3 Pro [1] - 豆包2.0 Lite综合能力超越上一代主力模型豆包1.8 [1] - 豆包2.0 Mini面向低时延、高并发与成本敏感场景 [1] - Code版专为编程场景打造,可与AI编程产品TRAE结合使用 [1] 多模态与长视频理解能力 - 豆包2.0在多模态理解能力上全面升级,在视觉推理、感知、空间推理与长上下文理解等任务中达到SOTA水平 [1] - 在TVBench、EgoTempo等动态场景测评中表现领先,其中EgoTempo得分超过人类基准 [1] - 在长视频理解方面,于多个流式实时问答基准测试中表现优异 [1] 推理与专业领域能力 - 豆包2.0 Pro在SuperGPQA、HealthBench等科学领域评测中分数超过GPT 5.2 [1] - 豆包2.0 Pro在IMO、CMO数学奥赛及ICPC编程竞赛中取得金牌成绩 [1] - 豆包2.0 Pro的推理成本较业界顶尖模型降低约一个数量级 [1] 产品上线与商业化 - 豆包2.0 Pro已在豆包App、电脑端及网页版上线,用户选择「专家」模式即可体验 [2] - Code模型已接入TRAE中国版 [2] - 火山引擎同步上线豆包2.0系列模型API服务,供企业和开发者调用 [2]
字节跳动发布豆包大模型2.0,主打真实世界复杂任务执行力
环球网· 2026-02-14 14:36
公司产品发布 - 字节跳动于2月14日宣布推出豆包大模型2.0系列,旨在针对大规模生产环境进行系统性优化,以更好地完成真实世界的复杂任务 [1] - 豆包2.0系列是继Seedance 2.0视频模型和Seedream 5.0 Lite图像模型之后发布的新产品 [1] 模型核心能力 - 在语言模型基础能力上,豆包2.0 Pro旗舰版在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌成绩,并超越了Gemini 3 Pro在Putnam基准测试上的表现,数学和推理能力达到世界顶尖水平 [1] - 豆包2.0加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,其科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上也排名前列 [1] - 豆包2.0全面升级了多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现 [1] 1. 豆包2.0增强了对时间序列与运动感知的理解能力,可实现实时视频流分析、环境感知与主动交互 [2] 智能体与行动能力 - 在Agent能力方面,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平 [4] - 豆包2.0 Pro在HLE-Text评测中获得54.2的最高分,大幅领先于其他模型 [4] 产品上市与定价策略 - 目前,豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择「专家」模式即可体验 [4] - 火山引擎也已上线豆包2.0系列模型的API服务 [4] - 豆包2.0 Pro按“输入长度”区间定价,32k以内输入的定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势 [4] - 豆包2.0 Lite极具性价比,其综合性能超越两个月前发布的上代主力模型豆包1.8,百万tokens输入价格仅为0.6元 [4]
豆包大模型2.0正式发布
财联社· 2026-02-14 14:28
豆包大模型2.0发布 - 豆包大模型正式进入2.0阶段,围绕大规模生产环境下的使用需求进行了系统性优化 [1] - 新模型依托高效推理、多模态理解与复杂指令执行能力,旨在更好地完成真实世界复杂任务 [1] 模型系列构成 - 豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和一款Code模型,以灵活适配各类业务场景 [2] - 豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro [2] - 豆包2.0 Lite兼顾性能与成本,其综合能力超越上一代主力模型豆包1.8 [2] - 豆包2.0 Mini面向低时延、高并发与成本敏感的场景 [2] - Code版模型(Doubao-Seed-2.0-Code)专为编程场景打造,与TRAE结合使用效果更佳 [2]
Rosenblatt Raises Price Target For Arista Networks (ANET)
Yahoo Finance· 2026-02-12 16:54
公司评级与目标价调整 - Rosenblatt分析师Michael Genovese将Arista Networks的目标价从140美元上调至165美元 并重申“中性”评级 按当前股价计算隐含20%的上行潜力 [1] - 此次评级调整发生在公司发布第四季度财报之前 分析师注意到公司在近期订单和机会方面出现了有利的发展 [2] 业务发展与合作动态 - 分析师指出 公司的多种网络结构解决方案使其在Meta的份额保留时间比此前预期更长 [2] - Wells Fargo分析师Aaron Rakers认为 微软推出第二代Maia 200 AI芯片对Arista Networks是“衍生性利好” 因为微软转向为AI工作负载提供基于以太网的横向扩展支持 [3] - 微软的Maia 200 AI芯片专为OpenAI的GPT 5.2和Microsoft Copilot提供动力 此举突显了微软对英伟达依赖的降低 [3] 公司业务与市场定位 - Arista Networks开发并销售高性能、由软件和数据驱动的从客户端到云端的网络解决方案 [4] - 公司业务主要专注于促进AI、数据中心和路由架构 其核心关注点为低延迟、自动化、高速和可扩展性 [4] - 公司服务的市场领域广泛 包括云服务提供商、金融服务公司、政府客户、医疗保健、教育、能源等 [4] 行业地位与市场观点 - 根据对冲基金的持仓情况 Arista Networks被列为11支最佳通信设备股之一 [1]
微信,给元宝“纠偏”
搜狐财经· 2026-02-06 06:46
事件概述 - 微信封禁了元宝红包的外链分享功能 引发社交媒体热议 [1] - 元宝回应称正在紧急优化调整分享机制 将尽快上线以确保用户体验 [3] - 微信公关总监以“用户体验第一 一视同仁”回应 并配发“我发起疯来自己都打”的表情包 [3] 微信的产品哲学与战略演进 - 微信已从最初的“技术驱动” 历经“应用驱动” 演进至当前的“服务和用户驱动”阶段 [7] - 微信的产品形态已从张小龙倡导的“Less is more”变得复杂 添加了公众号、小程序、视频号及AI构成的生态 [7] - 用户体验是微信不可逾越的底线和信条 即便是腾讯自身最紧迫的AI战略也不例外 [7][8] - 微信作为一款已迭代15年的全民社交应用 承载着公司约5万亿港元的市值 坚守初心需要强大的定力 [17] 对AI行业竞争逻辑的反思 - 当前AI大模型的竞争存在“砸钱换规模”的路径依赖 但红包营销只能换来短暂规模 无法换来用户粘性 [11][12][13] - 对比海外 OpenAI的GPT-5.2 Pro版本月费已定价168美元 接近人工成本 而Openclaw等产品正快速扩散 [13] - AI产品的核心是给人使用 最终成功取决于产品体验和用户粘性 而非单纯的营销投入 [13] - 微信支付当年超越支付宝 底层逻辑在于微信固有的强用户粘性 春节红包活动只是加速了这一进程 [13] 微信生态与AI发展的关系 - 微信连接着约14亿全球用户 对AI发展而言是一片极其肥沃的土壤 [14] - 挖掘微信生态的价值需要耐心和定力 如同当年张小龙能将其小程序游戏“跳一跳”玩到6000分所展现的专注 [15] - 对于元宝等AI产品 微信不应被视为简单的流量管道 而应是培育产品的土壤 [14] - AI是人的反应器 人的行为数据训练AI AI提升后又反哺人的效率 微信是这一循环的关键环境 [14] - 当AI产品真正准备好时 微信生态作为土壤的价值才会爆发出来 [18]