Seedream 5.0 Lite
搜索文档
中国人工智能-春节至今:模型智能体化与 Token 消耗加速,上调智谱 AIMiniMax 目标价至 800-China Artificial Intelligence_ CNY-to-date_ model agentization with accelerating token consumption, raise Zhipu_MiniMax PT to HK$800_1000. Thu Feb 26 2026
2026-03-03 16:28
电话会议纪要关键要点总结 一、 涉及的行业与公司 * **行业**:中国人工智能(AI)行业,特别是生成式人工智能(GenAI)和基础大模型(LLM)领域 [1] * **主要公司**: * **智谱AI**(Knowledge Atlas,股票代码:2513.HK)[1][4] * **MiniMax**(股票代码:0100.HK)[1][4] * **其他提及公司**:字节跳动(Doubao)、阿里巴巴(Qwen)[33][61] 二、 核心观点与论据 1. 行业趋势:从能力展示到商业化,代理(Agent)成为核心驱动力 * **商业化拐点**:春节(CNY)模型发布周期标志着行业结构性转变,从单轮任务转向由**代理驱动的多步骤工作流**,这直接利好上游基础模型提供商 [1][3] * **需求结构变化**:根据OpenRouter数据,**每周全球token消耗量是年初至今(YTD)的2倍**,且基于代理的应用(如OpenClaw)的token消耗量已超过编码助手,成为最大需求来源 [3][49] * OpenClaw每周消耗约**2.35万亿(2.35T)** tokens,而Kilo Code消耗约**1.3万亿(1.3T)** tokens [49] * **模型定位转变**:各大模型厂商的发布均围绕**代理就绪性**、**推理效率**和**工作流稳定性**展开,强调在复杂、持久任务中的可靠执行能力 [28][30][31][32][33] 2. 公司战略与定价分化 * **智谱AI**:采取**高端化定价策略**,通过**GLM-5** 强调编码鲁棒性和长周期代理任务 [31][33] * GLM-5的API价格相比GLM-4.7**翻倍**,其编码计划价格上调**超过30%** [35][69] * 输入定价为人民币4-6元/百万tokens,输出定价为人民币18-22元/百万tokens [38][42] * 战略逻辑:通过提高工作流成功率和降低重试频率,为用户创造可衡量的生产力收益,从而支撑其溢价 [70][76][77] * **MiniMax**:坚持**效率优先、规模驱动的低成本策略** [39][102] * M2.5高速版和标准版的输入定价约为**0.3-0.6美元/百万tokens**,输出定价为**1.2-2.4美元/百万tokens**,处于国内定价谱系底端 [39][42] * 推出**M2.5-Lightning**层级,强调高吞吐量(约100 tokens/秒)和低边际循环成本,定位为高并发代理部署的基础设施 [71][72][102] * **阿里巴巴**:采取**价值重置策略**,在提升能力的同时优化工作负载经济性,声称Qwen 3.5比上一代**成本降低60%**,大工作负载处理能力**提升8倍** [33][65] * **字节跳动**:强调**多模态协同与大规模分发**,在春晚期间,豆包相关AI互动达到**约19亿次**,峰值推理吞吐量达到**每分钟633亿tokens** [33][64] 3. 财务预测与目标价上调 * **上调收入预测**:基于对代理驱动工作负载强度和定价能力的更强假设,上调两家公司2026-2030年收入预测 [1][3] * **智谱AI**:2026-2030年收入预测上调**12%-59%** [1][80] * **MiniMax**:2026-2030年收入预测上调**8%-35%** [1][106] * **上调目标价**: * 将**智谱AI**目标价从**400港元**大幅上调至**800港元** [1][4][80] * 将**MiniMax**目标价从**700港元**上调至**1000港元** [1][4][106] * **盈利路径**:预计两家公司均将在**2029年实现盈亏平衡** [3][80][106] * **估值方法**:目标价基于**30倍2030年预期市盈率(P/E)**,并以**15%的加权平均资本成本(WACC)** 折现得出 [3][5][86][93][112][119] 4. 估值交叉检验框架 * **方法一:对标美国同行历史收入倍数** [7] * 当年度经常性收入(ARR)**低于10亿美元**时,美国领先公司交易于约**97-145倍 P/ARR**倍数 [8] * 将此应用于2026年收入预测,智谱AI(2.54亿美元)和MiniMax(2.05亿美元)的隐含市值范围较广,潜在下行风险为**23%-34%**,上行空间有限(智谱AI为15%,MiniMax接近持平)[10] * 应用于2027年更高收入预测(智谱AI:6.51亿美元,MiniMax:5.77亿美元)时,隐含上行空间显著扩大至**85%-195%** [11] * 当ARR**超过10亿美元**时,历史倍数正常化至**27-44倍** [12] * 应用于2028年收入预测(智谱AI:18.58亿美元,MiniMax:16.55亿美元),经折现后估值仍显著高于当前水平 [12] * **方法二:作为美国同行最新估值的一定比例** [18] * 考虑到**总可寻址市场(TAM)差异**和**中国更激烈的竞争格局**,中国领先模型公司的估值可能相当于美国同行最新估值的**5%-25%** [20][21] * 基于此框架: * 相对于**Anthropic**最新3800亿美元估值,智谱AI和MiniMax的隐含市值范围为**190亿至950亿美元**,对应**41%下行至214%上行**空间 [21][27] * 相对于**OpenAI**最新8500亿美元估值,隐含市值范围为**425亿至2125亿美元**,对应**33%下行至603%上行**空间 [21][27] * **全球TAM分析**:2030年全球AI TAM预计为**1.414万亿美元**,其中美国6600亿美元,中国3080亿美元 [19][22] * 中国玩家的可触达市场规模(约4770亿美元)约为美国玩家(约9370亿美元)的**一半** [19][22] 5. 竞争优势与风险 * **智谱AI**: * 优势:专注于**工作流可靠性**(特别是编码场景),拥有**国内芯片供应链**(如华为昇腾)的韧性,在监管行业拥有可观的本地部署基础 [67][78][92] * 风险:定价能力取决于工作流优势的持续性;面临激烈竞争;持续的研发投入压力 [95] * **MiniMax**: * 优势:**推理效率高、成本结构优**,适合高并发代理部署;具备**多模态能力**和**全球市场布局** [102][111][118] * 风险:与美国工作室的诉讼程序;激烈竞争;商业化进程的不确定性 [121] * **共同风险**:出口管制和地缘政治风险;技术迭代快速;对算力基础设施和外部供应商的依赖 [95][121] 三、 其他重要信息 * **市场表现**:自IPO以来,智谱AI和MiniMax的股价已上涨**五倍**,而同期恒生指数上涨**4.3%** [1] * **token消耗领导者**:在OpenRouter上,**MiniMax M2.5** 以约**2.3万亿** 周token消耗量排名第一,其次是Kimi K2.5(约**9700亿**)和GLM-5(约**7700亿**)[51] * **模型能力**:中国玩家正从“缩小巨大能力差距”转向“在压缩的前沿集群中竞争”,差异化体现在整体智能水平、代理就绪性和推理效率 [56] * **投资评级**:报告对智谱AI和MiniMax均给予 **“增持”(Overweight)** 评级 [3][4][85][111]
开源证券:海内外大模型密集更新 AI算力需求有望持续受益增长
智通财经网· 2026-02-24 20:37
市场回顾 - 春节假期期间(2026.02.16-2026.02.20)海外科技股以上涨为主,纳斯达克指数涨1.51%,费城半导体指数涨1.51% [2] - 美股主要科技股中,英伟达涨3.83%,苹果涨3.44%,谷歌涨2.90%,亚马逊涨5.69%,AMD跌3.46% [2] - AI上游半导体设备、材料、存储普遍上涨,其中阿斯麦涨4.48%,AMAT涨5.90%,美光涨4.01%,闪迪涨3.74% [2] 行业动态:模型与终端 - 春节前后,国产大模型进入密集发布期,千问、Seedance、混元、星火、百灵、智谱GLM、MiniMax等厂商均有更新 [3] - 字节相继发布了Seedance2.0视频模型、Seedream5.0Lite图像模型和豆包大模型2.0系列多模态Agent模型产品 [3] - 谷歌发布Gemini 3.1 Pro基础模型,在ARC‑AGI‑2基准测试中取得77.1%的得分,推理性能是上一代3 Pro的两倍以上 [3] - 苹果计划于3月4日举行“苹果特别体验活动”,或有望发布包括iPhone 17E、低价版MacBook等在内的至少五款新产品 [3] 行业动态:算力 - 英伟达CEO黄仁勋预热GTC 2026大会,表示将揭晓“世界前所未见”的全新芯片 [4] - 英伟达与Meta宣布达成一项多年期、价值数十亿美元的芯片采购协议,Meta将采购数百万枚英伟达最新AI芯片,并承诺大规模部署英伟达独立CPU [4] - 电子布或因成本攀升与供给偏紧启动第二轮涨价,2025年10月、12月以及2026年1月、2月,普通电子布已历经四次涨价 [4] - OpenAI正敲定新一轮融资计划,目标筹集1000亿美元,融资完成后公司估值将达到8300亿美元,同时公司更新长期资本开支计划,预计到2030年实现总计约6000亿美元算力支出 [4] 行业动态:存力 - 因AI对存储需求激增,三星电子和SK海力士加速推进产能建设,三星计划将平泽P4工厂的投产时间从2027年一季度提前至2026年四季度,SK海力士计划将龙仁一期晶圆厂的试运行时间提前至2027年2-3月 [5] - 两家存储巨头均将在新产线重点部署高附加值产品,如高性能DRAM与HBM [5] - 美光CFO澄清其HBM4内存已经大规模量产,进度好于预期,当前已向客户发货,预计本季度出货量将持续攀升,HBM4良率符合预期,可实现11Gbps传输速率 [5] 投资建议与关注方向 - 建议重点关注受益于海内外AI算力资本开支上调的相关方向 [1] - 建议重点关注国产算力自主可控链条 [1] - 建议重点关注靶材、被动元器件等涨价方向 [1] - 推荐标的:江丰电子(300666.SZ) [1] - 受益标的包括:精测电子(300567.SZ)、芯原股份(688521.SH)、澜起科技(688008.SH)、华正新材(603186.SH)、晶合集成(688249.SH)等 [1]
春晚大考交卷 字节跳动AI 破局时
每日经济新闻· 2026-02-18 18:07
公司AI技术实力与产品发布 - 公司旗下火山引擎在2026年总台春晚中作为独家AI云合作伙伴,将AI深度嵌入节目创作、互动体验与底层算力调度[4] - 豆包大模型在除夕当天的AI互动总数达到19亿次,其TPM(每分钟token数)峰值高达633亿[3] - 公司在2026年2月12日至14日连续发布了豆包视频生成模型Seedance 2.0、图像创作模型Seedream 5.0 Lite和豆包大模型2.0 Pro[3] - Seedance 2.0模型在发布前已深度参与春晚视觉制作,并被媒体评价为“超越OpenAI的Sora 2”[3][6] - 豆包大模型2.0 Pro在多项评测中表现卓越,在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,超越了Gemini 3 Pro在Putnam基准测试上的表现,并在Agent能力评测HLE-text中取得最高分54.2分[11] 多模态AI技术突破与应用 - 为满足春晚8K超高清分辨率、50FPS高帧率的播出标准,技术团队采用“双模型协同”方案,先用Seedream 5.0 Lite生成关键帧,再由Seedance 2.0完成动态演绎,并引入大量中国文化语料进行专项训练[6] - 针对主流视频生成模型最高仅能输出1080P/24FPS内容的差距,视频云团队推出AI驱动智能精修方案,基于自研MIPP框架将720P原始画面提升至8K,并通过插帧技术将帧率从24FPS升级至50FPS[7] - 大模型能力不止于视觉,通过接入豆包大模型的完整能力(VLM、LLM、TTS 2.0),使春晚上的机器人能实时识别环境、理解复杂语义并进行带情感的对话[7] - 在具身智能领域,公司已与40余家具身智能公司达成合作,豆包大模型正成为机器人的“大脑”和“五官”[13] 算力支撑与规模化服务能力 - 面对除夕夜指数级增加的算力需求,火山方舟平台通过统一资源池调度,在多机房、多机型间动态调配算力,成功支撑了豆包大模型633亿tokens的分钟级峰值[8] - 官方数据显示,豆包大模型日均tokens使用量超过63万亿,已有超过100万家企业和个人通过火山引擎使用大模型服务,涵盖100多个行业[13] - 超过100家公司在火山引擎平台上的tokens使用量突破了1万亿[13] 行业落地与市场地位 - 在智能汽车领域,火山引擎服务超过9成主流车企,豆包大模型在2025年新车中的搭载量位居行业第一,与奔驰、宝马、奥迪、比亚迪等品牌深度合作[13] - 在智能终端方面,全球TOP10手机厂商中有9家选择火山引擎,合作终端超过5亿台,手机市场大模型市占率同样位居第一[13] - 2026年春晚期间,公司通过发放现金红包和送出超过10万份接入豆包大模型的科技好礼(包括宇树机器人、上汽奥迪E5 Sportback等)进行技术整合与展示[14]
字节跳动在春节点亮自己的 ChatGPT 时刻
晚点LatePost· 2026-02-17 12:11
公司战略与核心观点 - 公司2026年的战略关键词是“勇攀高峰”,旨在抓住AI时代最重要的机会,坚决将自己转型为一家科技企业 [6] - 公司认为,真正的AI攻势不是仅打造一两款应用,而是要将AI能力服务于各个产业,并试图通过春节等全民节点创造关于AI的集体记忆 [5][6] - 公司2026年春节的系列动作,被视为其试图点亮自己的“ChatGPT时刻”,标志着从互联网公司向科技企业的深刻转变 [6] 2026年春节AI战役具体举措 - 公司通过旗下火山引擎冠名央视春晚,并首次将AI能力全面渗透到舞美视效、机器人互动、播出保障及观众互动等环节 [3][7] - 在春晚节目《驭风歌》中,公司使用自研视频生成模型Seedance 2.0,解决了让国宝级水墨画中的马匹动态化并保持风格一致性的行业难题,最终将画面提升至6K或8K分辨率、50帧/秒 [9][10][11] - 春晚互动玩法革新:观众需通过豆包App调用大模型生成图片或文字才能获得红包,红包奖品包含3D打印机、汽车等科技产品,这些产品均来自豆包大模型的客户 [4][5][12] - 除夕当晚,豆包App的AI总互动量达到19亿次,并第一时间接入了最新的Seedance 2.0视频生成模型和豆包大模型2.0Pro [5] 技术能力与产品突破 - 视频生成模型Seedance 2.0实现重要突破:能更好地遵循物理规律和细微指令,并能同时学习大量不同风格的多模态素材,解决了运动一致性和高分辨率下艺术风格保持的难题 [9][10] - 公司采用Seedance 2.0与图像生成模型Seedream协作的流程,先由Seedream生成关键帧,再由Seedance生成动态视频,确保了风格与运动的一致性 [10] - 豆包大模型已具备国民级AI产品特征,其语音合成模型Seed TTS在2.0版本中增强了情感表达能力 [5][21] - 公司设立了代号为“Seed Edge”的长期AGI前沿研究项目,设定了更宽松的考核机制,旨在进行比预训练更基础的研究 [22] 算力挑战与工程能力 - 春晚互动带来前所未有的算力需求:用户生成一次图片或文字请求需完成10 TOPS计算量,是传统互动请求的100万倍 [13] - 公司通过统一的算力调度平台“火山方舟”,将推理、训练和离线任务资源池统一统筹,动态调度资源以应对春晚算力洪峰,成功保障了服务 [13][14] - 公司的工程化能力(infra)被认为已强于国内任何一家公司 [21] AI时代增长逻辑的转变 - AI产品的增长逻辑与移动互联网时代不同:用户增长不会线性摊薄成本,也难以通过收集普通用户数据显著提升模型能力 [16][17] - 以豆包为例,其并未显现出“越多人用越好用”的互联网产品特性,因为chatbot产品不是社交网络,用户问题高度重合且深度有限 [16] - AI产品体验的提升几乎全部依赖于底层模型能力的跃迁,而非用户规模,例如Cursor和OpenAI Deep Research的成功都基于底层模型的突破 [18] - 靠投流、补贴获取用户的传统模式在AI时代越来越吃力,模型与产品体验的硬实力成为拉开差距的关键 [18] 商业化路径与市场表现 - 与海外用户直接为软件服务付费的模式不同,公司等国内企业更多通过云服务(将模型能力作为API/托管服务)来赚回AI投入,企业按调用量、并发等付费 [17] - 2025年12月,火山引擎上的豆包大模型日均Token处理量超过50万亿,半年增长超200%,累计使用上万亿Token的外部客户超过100家 [17] - 公司在考察AI项目时,ROI周期被拉长,会以未来一定周期后的单用户价值作为考核系数,部分产品的考核周期甚至可达5年 [22] 历史投入与长期主义 - 公司自2022年底ChatGPT兴起后,进行了大规模投入,包括订购大量GPU、组建新AI部门,在全链条上追赶硅谷公司 [20] - 技术跃升需要坚定的长期投入,例如Seedance从1.5到2.0的改进,以及Seed TTS从1.0到2.0的迭代,都依赖于耗时的基础工作补齐 [20][21] - 公司认识到,与全球顶尖水平相比,最大的问题在于缺少能提出方向、进行前沿探索的顶尖研究人才 [21]
互联网巨头AI超级入口的第一战场
搜狐财经· 2026-02-17 04:06
春节作为AI超级应用与流量争夺的关键战场 - 春节是国内受众最广泛的节日 其带来的自然流量是其他节日无法比拟的[2] - 央视春晚已成为互联网公司为新业务争夺流量的特别战场[3] - 2026年春晚成为AI超级应用大爆发 互联网巨头争夺AI超级入口的炽热战场[4] 2026年AI巅峰对决的主要回合:大模型技术升级 - 大模型已普遍具备文本、图像、视频、音频多模态融合能力 准确率和稳定性提升让更多普通人开始上手[5] - 百度于1月22日发布文心5.0正式版 参数规模达2.4万亿 采用统一自回归架构进行原生全模态建模[6] - 文心5.0在40余项基准测试中 语言与多模态理解能力超过Gemini 2.5 Pro、GPT-5-High等模型[8] - 阿里于1月26日发布千问旗舰推理模型Qwen3-Max-Thinking 参数量超万亿 预训练数据量达36T Tokens[8] - Qwen3-Max-Thinking增强了自主选择并调用内置工具的能力 在19项基准测试中性能可媲美GPT-5.2-Thinking-xhigh、Claude Opus 4.5、Gemini 3 Pro[10] - 字节在春节前密集发布多款模型:2月12日发布视频生成模型Seedance 2.0 支持四种模态输入[10];2月13日发布图像生成模型Seedream 5.0 Lite 引入实时检索增强能力[14];2月14日发布豆包大模型2.0系列(Pro、Lite、Mini)[15] - 豆包2.0 Pro在多数视觉理解基准测试中达业界最高水准 并在数学和编程竞赛中获得金牌成绩 全面对标GPT-5.2与Gemini 3 Pro[15] - 字节的AI技术水准仍在快速提升[18] 互联网公司围绕核心业务构建AI超级入口 - 互联网公司作为生态构建者 竞争焦点是结合自身核心业务的AI超级入口[20] - 主要模式包括:百度的AI+搜索 阿里的AI+电商 腾讯的AI+社交 字节的AI+短视频[21] - 百度将文心大模型嵌入搜索引擎 用户检索时AI答案排在首位[22] - 国内360、腾讯等公司也加强AI搜索投入 但嵌入微信、小红书等超级应用的AI搜索正改变用户习惯[23] - 阿里于1月15日发布千问APP的“智能助理”功能 并打通淘宝、支付宝、高德等全系生态 用户可在对话中完成购物全流程 旨在推广AI+电商模式并抢占超级入口[25][28] - 腾讯于2月1日正式上线“元宝派” 这是一个加入了AI成员的聊天群 AI可与用户互动、分享内容 春节期间最火爆的是随机触发红包功能[28][30] - 腾讯在春节期间为元宝启动分10亿元现金红包活动 旨在复刻2015年微信支付的成功[32] 春节期间的AI品牌与流量争夺战 - 互联网公司视春节为AI大战的关键战场 核心目标是争夺流量和建立品牌[35] - 各公司公布巨额春节补贴政策:腾讯元宝App瓜分10亿现金红包 单个最高1万元[35];百度文心助手瓜分5亿现金红包 最高1万元[35];阿里千问APP投入30亿启动“春节请客计划” 以免单形式请客[35];字节豆包在春晚送出超10万份科技好礼及现金红包 奖品包括大疆无人机、宇树机器人乃至奥迪、奔驰汽车使用权[35][37] - 数十亿资金投入旨在抢夺流量、用户注意力和心智 建立AI超级入口的品牌效应[37] - 这是大模型技术成熟、智能体初具产品逻辑后 互联网巨头掀起的第一场大规模AI品牌大战[37] AI人才争夺激烈 - 互联网公司不惜重金抢夺AI科学家 例如小米在2025年11月引入DeepSeek研究员罗福莉 腾讯在2025年12月引入OpenAI研究员姚顺雨[32] - AI科学家在互联网公司中仍供不应求[33]
从Seedance 2.0到AI天团!海淀何以“生成”全球爆款
新浪财经· 2026-02-15 17:14
核心观点 - 以北京海淀区为创新策源地的中国AI产业,特别是“AI+视听”领域,在2026年初迎来一轮密集的产品发布和技术突破,展现出强大的全球竞争力,并正在重塑内容创作与影视制作行业[3][4][5] - 海淀区已形成从芯片、框架、大模型到应用的全产业链生态,产业基础雄厚,政策支持明确,正致力于打造全球人工智能创新高地和产业标杆集聚区[11][23] 行业动态与产品发布 - **字节跳动**发布视频生成模型Seedance 2.0,支持图像、视频、音频、文本四种模态输入,可在60秒内生成带原生音轨的多镜头视频,其多模态参考生成、音视频指令遵循等能力处于业内领先水平[3][4] - **月之暗面**发布新一代开源模型Kimi K2.5,能根据任务需求自主调度多达100个专业背景不同的分身,并行处理高达1500个步骤[5][17] - **生数科技**推出视频大模型Vidu Q3,具备“生成即成片”的声画一体能力,一次生成可输出16秒完整叙事段落,并支持多角色、多语种对话[5][17] - **快手**旗下可灵AI正式全球上线3.0系列模型,旨在将传统多轮协作的影像制作流程整合进单一创作界面,并推出首部AI贺岁动画短片集《马上有戏》[5][17] - **智谱**发布新模型GLM-5,擅长复杂系统工程与长程智能体任务,在真实编程场景体验逼近Claude Opus 4.5,并在全球权威榜单中位居开源第一[6][18] - 截至2月14日,海淀区已累计完成128款生成式人工智能服务备案,占全市59.5%,覆盖政务、科研、教育、文化、旅游、创意、电商、生活服务等多个领域[6][18] 市场影响与用户数据 - Seedance 2.0在海外社交平台持续霸榜,马斯克评论“模型发展速度太快”,美国影视从业者使用后感慨其对好莱坞的潜在冲击[3][4] - 2025年**抖音**日活跃用户已突破6亿,**快手**是拥有4亿日活用户的内容社区[7][19] - 截至2025年12月,**快手可灵AI**已拥有超过6000万创作者,生成超过6亿个视频[7][19] - **生数科技**旗下Vidu用户已覆盖全球200多个国家和地区,超过3000万[7][19] - **字节跳动**的汽水音乐月活跃用户达到1.4亿,日活位居行业第三[4][16] 产业基础与生态优势 - 海淀区聚集了1.23万名人工智能学者,超过2000家AI企业,人工智能核心产业规模近3600亿元[11][23] - 海淀是视听产业核心集聚区,汇聚了央视、中影等国家级影视机构,以及抖音、快手、爱奇艺、百度等视频平台和游戏企业[7][19] - 平台积累的海量用户数据为大模型持续迭代提供了养分[8][20] - 2025年10月,海淀区发布支持“人工智能+文化”、游戏电竞、精品微短剧产业高质量发展的若干措施,为产业发展提供政策支持[8][20] 硬件与基础设施进展 - 2月13日,人工智能芯片公司**寒武纪**市值达到4726亿元[11][23] - **龙芯中科**表示正在全力发展自研中高端显卡9A2000[11][23] - **摩尔线程**曝光旗舰级AI训推一体GPU MTT S5000,据业内人士消息,其实测性能对标英伟达H100,在多模态大模型微调任务中部分性能甚至超越H100[11][23]
大力出奇迹?春节前夕,字节跳动放大招:Seedance 2.0后,豆包2.0来了,还要上春晚发红包!记者实测→
每日经济新闻· 2026-02-15 16:54
公司动态:字节跳动豆包大模型2.0发布 - 字节跳动在春节前夕正式推出豆包大模型2.0系列,这是该模型自2024年5月发布以来的首次大版本跨代升级 [1] - 本次升级提供了豆包2.0 Pro、Lite、Mini三款多模态通用模型及面向开发者的Code模型,旗舰款Pro定位于复杂深度推理与Agent等高难度任务 [2] - 豆包2.0 Pro已在豆包App、电脑端、网页版上线,火山引擎同步开放API服务 [5] 技术性能与评测 - 在推理和Agent能力评测中,豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩,超越了Gemini 3 Pro在Putnam基准测试上的表现 [2] - 在HLE-text(人类的最后考试)中,豆包2.0 Pro取得最高分54.2分 [2] - 在多模态理解测评中,豆包2.0 Pro在空间理解MMSIBench、运动理解MotionBench、视频理解VideoMME等测评集上均略胜Gemini 3 Pro一筹 [4] - 豆包2.0重点强化了指令遵循能力,能在长链路、多步骤任务中严格按约束条件执行,实测显示其能有效处理多轮复杂指令并保持信息一致性 [3] 应用场景与定价 - 豆包2.0强化了对时间序列与运动感知的理解能力,在长视频场景中可作为AI助手完成实时视频流分析、环境感知与情感陪伴 [4] - 价格方面,豆包2.0 Pro的32k以内输入定价为3.2元/百万tokens,输出为16元/百万tokens,相较Gemini 3 Pro和GPT 5.2具备明显成本优势 [4] - 豆包2.0 Lite主打性价比,综合性能超越上一代主力豆包1.8,百万tokens输入价格为0.6元 [4] 行业竞争与布局 - 春节前夕国内大模型行业迭代加速,阿里、月之暗面、阶跃星辰、MiniMax等公司相继发布新模型,行业竞争激烈 [6] - 字节跳动同期连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型及豆包2.0,展现出全栈AI布局的野心 [1][6] - Seedance 2.0视频模型上线后出现用户排队现象,随后平台上线了消耗积分更少的Seedance 2.0 Fast版本 [7] 市场推广与生态建设 - 字节跳动深度参与2026年央视春晚,火山引擎成为独家AI云合作伙伴,全新Seedance 2.0、Seedream及空间视频技术将全面赋能春晚舞台 [8] - 豆包语音模型将用于春晚具身机器人表演,实现深度语义理解和拟人化表达 [8] - 公司推出“豆包过年”新春活动,计划在春晚期间送出超过10万份科技好礼及最高8888元的现金红包,活动启动后“豆包红包”话题冲上热搜 [1][8] - 千问斥资30亿元修筑生态围栏,锤炼真实应用 [1] 基础设施与战略投入 - 市场传出消息称,字节跳动今年计划至少生产10万颗AI推理芯片,并且AI芯片团队正在扩招,招聘岗位包括“AI芯片系统软件架构师/工程师-NPU”等 [1] - 分析认为,行业竞争的壁垒取决于资金实力、技术与产品储备能力,以及产品能否找到落地场景并吸引数亿级用户 [8][9]
春节将至,国产大模型再次迎来上新热潮
21世纪经济报道· 2026-02-15 07:35
行业动态:国产大模型春节前集中发布 - 春节前国产大模型迎来上新热潮,多家科技公司推出“王牌产品”,业界称之为“AI诸神之战” [1][11] - 包括智谱、字节跳动、阿里巴巴等在内的多家科技大厂近期均发布了重要模型更新 [1][11] MiniMax 发布新一代文本模型 M2.5 - MiniMax于2月13日正式上线新一代文本模型MiniMax M2.5 [1][11] - 在编程能力方面,M2.5在SWE-Bench Verified得分80.2%,在Multi-SWE-Bench得分51.3%,较上一代显著提升,并在多语言复杂环境中超越Opus 4.6,达到行业最好水平 [4][14] - 模型展现出“原生Spec能力”,在编码前主动拆解架构与功能规划,更接近真实架构师的工作模式 [4][14] - 在工具调用和搜索能力方面,模型在多项Agent任务中以更低的轮次消耗取得更优效果,相较于上一代表现提升20%,达到行业顶尖水平 [6][16] - M2.5-lightning版本支持100 TPS以上输出速度,是主流模型的2倍左右;输入价格约0.3美元/百万Token,输出约2.4美元/百万Token [6][16] - 按每秒输出100 Token计算,连续运行一小时成本约1美元;按50 Token计算,成本约0.3美元;1万美元理论上可支持4个Agent连续工作一年 [6][16] - M2.5已于2月12日在MiniMax Agent上线,并于13日全球开源支持本地化部署;不到一天,用户已在MiniMax Agent上构建了1万多个专家,且仍在快速增长 [6][16] - 公司表示希望构建一个可持续扩展的生态,让Agent渗透到工作和生活的各个角落,促进应用发展 [6][16] 智谱AI 发布并开源旗舰模型 GLM-5 - 智谱AI于2月12日正式上线并开源其新一代旗舰模型GLM-5,该模型即此前在OpenRouter登顶热度榜首的“Pony Alpha” [1][7][11][17] - 作为“大模型第一股”,GLM-5发布迅速引爆资本市场;2月12日收盘,智谱股价大涨28.68%,创历史新高,总市值达到1792亿港元,市值较前一日增加400亿港元 [7][17] - GLM-5全新基座从355B(激活32B)扩展至744B(激活40B),预训练数据从23T提升至28.5T,更大规模的预训练算力显著提升了模型的通用智能水平 [7][17] - 在编程能力上实现对齐Claude Opus 4.5,在主流基准测试中取得开源模型SOTA;在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,性能超过Gemini 3 Pro [9][19] - 公司表示今年大模型将从“会写”走到“会做事”,GLM-5相当于“系统架构师”,将为AI行业发展提供更大想象空间 [9][19] 字节跳动(火山引擎)相关模型进展 - 字节跳动旗下AI视频生成模型Seedance 2.0凭借多模态输入、文本/图片生成电影级视频等能力引爆网络,吸引全球关注,并获得马斯克和导演贾樟柯的公开称赞 [1][11] - 火山引擎将于2月14日正式发布豆包大模型2.0,这是其自2024年5月发布以来的首次大版本跨代升级 [9][19] - 豆包大模型2.0是多模态Agent模型,在多模态感知、高精度文字提取、图表理解、空间理解、运动理解、视觉知识和推理、长视频理解等方面表现出色 [9][19] - 模型能更好支持对技能的理解和应用,Function Call、多轮指令遵循、搜索和工具调用能力显著增强,格式输出更稳定,支持灵活的上下文管理,更好地支持企业级复杂、长程任务,在数据分析和客服Agent等企业场景中表现出色 [10][20] 资本市场反应 - 2月13日,MiniMax开盘报642港元,涨超9%,年内涨幅超56% [3][13] - 2月13日,智谱报492港元,涨超20%,年内涨幅达90% [3][13]
从Gemini到豆包:全球两大AI巨头为何走上同一条路?
第一财经资讯· 2026-02-14 23:27
产品发布与定位 - 字节跳动于2月14日正式推出豆包大模型2.0系列,这是自2023年初始测试版上线、2024年正式发布后,近一年半时间内的代际版本更新 [1] - 豆包2.0版本具备全栈模型矩阵、多模态理解、企业级Agent和极致成本四大差异化优势,已跻身全球第一梯队,在多项公开测试集上表现突出,接近Google Gemini3,且具备更高性价比 [1] - 公司官方明确表示,旗舰版豆包2.0 Pro面向深度推理与长链路任务执行场景,全面对标GPT 5.2与Gemini 3 Pro [2] 模型能力与技术参数 - 豆包2.0系列提供Pro、Lite、Mini三款不同尺寸的通用Agent模型,其多模态理解能力全面升级,并强化了LLM与Agent能力,使模型在真实长链路任务中能够稳定推进 [3] - 在语言模型基础能力上,豆包2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌成绩,数学和推理能力达到世界顶尖水平 [3] - 在科学领域知识测试中,豆包2.0在SuperGPQA等多项公开测试集上表现突出,成绩与Gemini 3 Pro和GPT 5.2相当,跨学科知识应用排名前列 [3] - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中取得业界最佳表现 [3] - 豆包2.0 Pro在视觉推理、空间感知、运动理解、长视频理解等维度的大多数相关基准测试中取得最高分 [7] - 豆包2.0可以处理复杂视觉输入并完成实时交互和应用生成,无论是从图像中提取结构化信息,还是通过视觉输入生成交互式内容,都能高效稳定地完成任务 [7] Agent与任务执行能力 - 豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶尖水平,在HLE-Text(人类的最后考试)上获得54.2的最高分,大幅领先于其他模型 [4] - 此次豆包2.0全面升级的核心落点在“真实世界复杂任务的执行力”,旨在让模型从“答题者”进化为“执行者” [6] - 公司强化了模型对时间序列与运动感知的理解能力,例如在健身场景中,接入豆包2.0的智能健身App可实时分析用户动作视频并语音纠正姿势偏移,该能力已延伸至穿搭建议、老人看护等领域 [4] 成本与定价策略 - 豆包2.0 Pro按“输入长度”区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势 [4] - 豆包2.0 Lite极具性价比,综合性能超越上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元 [4] - 在提升能力的同时,豆包2.0进一步降低了推理成本,其模型效果与业界顶尖大模型相当,同时token定价降低了约一个数量级 [6] 行业趋势与战略共识 - 豆包2.0与Google Gemini的相似性从“对标”走向“一致”,这本质上是全球顶尖AI实验室在通往通用人工智能路径上达成的战略共识,即AI最终需要为人类完成任务执行,这需要对真实世界物理运行规律的理解 [2] - 豆包2.0与Gemini在基础模型层面均选择深耕多模态,是在进行一场“世界模型”的军备竞赛,目标是让AI成为能看懂、听懂、理解物理世界复杂性的“数字人类” [8]
从Gemini到豆包:全球两大AI巨头为何走上同一条路?
第一财经· 2026-02-14 23:19
豆包大模型2.0发布概览 - 字节跳动于2月14日正式推出豆包大模型2.0系列,这是其自2023年初始测试版上线、2024年正式发布后的又一次重大代际更新[1] - 此次2.0版本具备全栈模型矩阵、多模态理解、企业级Agent和极致成本四大差异化优势,已跻身全球第一梯队,成为Agent时代的关键玩家[1] - 在多项公开测试集上表现突出,接近Google Gemini3,并具备更高性价比[1] 模型定位与战略共识 - 旗舰版豆包2.0 Pro定位为“面向深度推理与长链路任务执行场景”,官方明确表示其全面对标GPT 5.2与Gemini 3 Pro[2] - 豆包2.0与Google Gemini的相似性正从“对标”走向“一致”,这反映了全球顶尖AI实验室在通往通用人工智能路径上达成的战略共识,即AI最终需要为人类完成任务执行,这需要对真实世界物理运行规律的理解[2] 模型系列与核心能力升级 - 豆包2.0系列提供Pro、Lite、Mini三款不同尺寸的通用Agent模型,其多模态理解能力实现全面升级,并强化了LLM与Agent能力,使模型能在真实长链路任务中稳定推进[4] - 在语言模型基础能力上,豆包2.0 Pro旗舰版在IMO、CMO数学竞赛和ICPC编程竞赛中取得金牌成绩,数学和推理能力达到世界顶尖水平[4] - 模型加强了长尾领域知识覆盖,在SuperGPQA等多项公开测试集上表现突出,科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当,在跨学科知识应用上也排名前列[4] 多模态与Agent能力表现 - 豆包2.0全面升级多模态理解能力,在视觉推理、空间感知、长上下文理解等权威测试中均取得业界最佳表现[5] - 面对动态场景,模型强化了对时间序列与运动感知的理解能力,该能力已应用于智能健身App实时动作纠正、穿搭建议、老人看护等领域[5] - 在Agent能力上,豆包2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶尖水平,在HLE-Text上获得54.2的最高分,大幅领先于其他模型[5] 产品上线与定价策略 - 豆包2.0 Pro已在豆包App、电脑客户端和网页版上线,用户选择专家模式即可体验,火山引擎也已上线该系列模型的API服务[6] - 价格方面,豆包2.0 Pro按输入长度区间定价,32k以内的输入定价为3.2元/百万tokens,输出定价为16元/百万tokens,相比Gemini 3 Pro和GPT 5.2有较大的成本优势[6] - 豆包2.0 Lite极具性价比,综合性能超越上一代主力模型豆包1.8,百万tokens输入价格仅为0.6元[6] 核心突破:任务执行与成本优化 - 此次升级的核心落点是“真实世界复杂任务的执行力”,其根基在于多模态理解层的突破,让模型能从“答题者”进化为“执行者”[7] - 公司团队认为,现有LLM Agent在现实任务中碰壁的原因主要在于难以自主构建高效工作流以处理长时间跨度、多阶段的任务,以及专业领域的经验知识位于训练语料的长尾区[7] - 在提升长程任务执行能力的同时,模型还进一步降低了推理成本,其效果与业界顶尖大模型相当,同时token定价降低了约一个数量级,这对于消耗大量token的复杂任务至关重要[7] 多模态能力详解与行业对标 - 豆包2.0 Pro在视觉推理、空间感知、运动理解、长视频理解等维度的大多数相关基准测试中取得最高分[8] - 此前刷屏的AI视频模型Seedance 2.0(具备原声音画同步、多镜头长叙事、多模态可控生成能力)正是其多模态能力支撑的体现之一[8] - 豆包2.0可以处理复杂视觉输入并完成实时交互和应用生成,其升级方向与Google Gemini 3 Pro在视频理解、空间推理上的优势高度一致,均强调“原生多模态”能力,即在底层实现跨模态的深度对齐[8] 行业趋势:世界模型竞赛 - 豆包2.0与Gemini在基础模型层面均选择专注于多模态,本质上是在进行一场“世界模型”的军备竞赛[9] - 行业目标不再满足于让AI成为“语言游戏高手”,而是希望其成为能看懂、听懂、理解物理世界复杂性的“数字人类”,只有真正理解物理世界,AI才能在现实世界中可靠地执行任务[9]