Agent 能力 - 财报，业绩电话会，研报，新闻

Agent 能力

搜索文档

2026-04-13 14:12

行业与公司概览 * **行业**：全球大模型（AI）行业[1] * **涉及公司**：OpenAI、Anthropic、月之暗面（Kimi）、阶跃星辰[1][5] 行业结构性特征与发展趋势 * **资本密集化**：赛道成为大资本游戏，头部公司资本开支巨大，例如OpenAI在2024-2030年累计算力支出预计约4,500亿美元，2028年峰值达1,100亿美元[2]；OpenAI 2026年现金消耗预计170亿美元，2023-2028年累计亏损可能达四五百亿美元[2]；Anthropic 2025年现金消耗55亿美元，2026年预计90亿美元[2] * **商业模式转变**：商业模式正从售卖模型调用量（Token计价）转向售卖具体场景落地和工作流（Agent能力），即RaaS（成果即服务）[2][4]；自2025年下半年起，GPT-5、Claude 4.6、Kimi K2、阶跃Step 3等模型均重点发展Agent能力[2]；收费模式转变为按完成的任务收费，复杂任务单价可达几十甚至几百美元[2][4] * **中美差距变化**：中美模型能力差距持续收窄至5%-10%以内[4]；但商业化规模差距扩大，OpenAI的ARR是月之暗面（Kimi）的200多倍[1][4]；差距源于OpenAI起步早、全球化布局以及美国市场更高的SaaS渗透率和企业支付意愿[4] * **中国公司差异化路径**：中国大模型公司选择不同破局点：阶跃星辰押注AI加端侧终端，月之暗面聚焦C端订阅，智谱主攻B端，DeepSeek走开源路线，MiniMax朝平台型公司方向发展[4] OpenAI 深度分析 * **发展定位**：偏向平台型公司[5] * **财务与估值**：2025年收入130亿美元[1][7]；最新估值超过8,000亿美元（8,300多亿美元）[1][5][7]；对应2025年收入的PS倍数约65倍，对应2026年预测近300亿美元收入的PS倍数约30倍，对应2028年1,000亿美元收入目标的PS倍数约8.5倍[7]；最新一轮（G轮）融资规模1,200亿美元，投后估值约8,500亿美元[10] * **收入结构**：基于2026年250亿美元ARR分析，C端订阅业务是主要收入来源，占比50%-60%[1][8]；周活跃用户9.1亿，付费率约5%，贡献80亿美元收入[8]；Plus版本定价每月20美元，Pro版本每月200美元[8]；B端服务收入占比约25%-30%，拥有100万家企业客户和700万商业席位，同比增长近9倍[8]；企业版定价已从每年2万美元增至20万美元且供不应求，2026年目标是将B端收入占比提升至40%[1][8]；剩余15%-20%收入来自API调用及生态抽成[8]；来自免费用户的商业抽成（ChatGPT即时结账功能，抽佣1%-3%）在2026-2030年有望超过1,000亿美元[8] * **增长与成本**：ARR从2023年末约20亿美元增长至2026年3月的超250亿美元，五年内增长超7,000倍[7]；成本压力巨大，硬件、电力、数据成本极高，例如训练GPT-6预计至少需要12.5万个H200 GPU，仅硬件成本就高达50亿美元起[8]；正通过算力自建（计划投入近1,000亿美元自建数据中心）及递归自改进技术试图降低60%研发成本[3][9]；算力自建目标是在2030年实现算力自给自足，预计可比向云厂商采购算力节省30%的成本[9] * **技术演进**：从比拼参数规模，到多模态能力，再到竞争复杂任务推理能力，最终聚焦Agent能力[12]；GPT-5是自适应多模态系统，通过实时路由器动态分配计算单元，最高可降低40%算力浪费，使输入token价格相比GPT-4o下降50%[12]；GPT-6将押注AGI，并成为递归自改进技术的首个落地版本[12][13] * **融资与股东**：融资历程反映估值快速增长，从2016年12万美元种子轮到2026年G轮融资1,200亿美元[10]；最新一轮主要投资方包括软银（承诺投资300亿美元）、亚马逊（500亿美元单笔投资）及中东石油资本[10][11]；亚马逊同时是Anthropic最大战略投资者，显示大型资本方进行风险对冲[11]；微软最终持股比例预计将降至25%-30%，软银持股约13%[11] * **经营风险**：增长可持续性问题（高昂运营成本、推理成本下降不及预期、客户退订）[14]；反垄断风险（正受欧盟和美国联邦贸易委员会调查）[14]；人才与文化风险（核心人才被挖角和离职）[14] Anthropic 深度分析 * **发展定位**：定位为企业型公司[5] * **财务与估值**：2026年4月ARR达300亿美元，首次超过OpenAI（250亿美元）[1][6][15]；过去12个月ARR增长30倍[15]；最新估值3,800亿美元[19]；基于300亿美元ARR的PS倍数约12.7倍，远低于OpenAI的约30倍[1][19]；2025年毛利率约60%，远高于OpenAI的33%[18]；2025年现金消耗55亿美元，2026年预计超90亿美元[2][18]；现金流预计在2027-2028年间转正，比OpenAI早约两年[18] * **增长驱动**：推动ARR快速增长的核心产品是Cloud Code和企业级API[16]；Cloud Code是SaaS历史上增长最快的产品之一，15个月内ARR从零增长到100亿美元，增速超过ChatGPT早期[16]；截至2026年第一季度，Cloud Code订阅用户超200万，贡献接近40%的ARR[16]；在企业级大语言模型采购市场，Claude份额从2024年12%提升至2025年32%，超过OpenAI的25%[16] * **竞争优势**：企业客户选择Anthropic的主要原因：更强的长上下文处理能力（支持百万级别上下文窗口，OpenAI为200k）[17]；更高的安全与合规性（采用“宪法AI”训练方法）[17]；在编码、长文档分析及Agent任务上的性能优势[17] * **模型路线**：专注于实现对齐、安全可靠的长任务执行，未持续追求参数规模扩张[21]；Claude Sonnet 4.6是目前闭源模型中性价比最高的企业级模型[21] * **估值前景**：当前估值被认为显著低估，因ARR增速极快（是OpenAI的15倍以上）、毛利率更高、B端为主的客户结构（收入可预测性强、获客成本低、客户生命周期价值高）[20]；若能维持当前ARR增速至2026年底，估值有翻倍潜力[20] 月之暗面 (Kimi) 深度分析 * **发展定位**：是扩散型公司[5] * **财务与估值**：2026年3月ARR突破1亿美元[3][6][24]；当前估值180亿美元[25]；基于1亿美元ARR的PS倍数高达180倍[3][25]；收入结构：C端订阅占40%，API调用占35%，企业定制服务占25%[24] * **模型路线**：从K1系列开始专注于长文本能力，是国内长文本大模型开创者（2024年能处理200万字上下文）[24]；K2模型于2025年下半年发布，全面转向Agent能力[24]；最新的K2.5模型在SWE-bench上取得68%成绩，接近Claude Sonnet 4.6的71%[24] * **融资与IPO**：18个月内估值从25亿美元增长至180亿美元，增长超七倍[25]；正在评估港股IPO可能性，市场预期窗口期为2026年下半年或2027年上半年[3][26] * **经营风险**：面临C端市场激烈竞争（需直面字节跳动、阿里巴巴等资金雄厚大厂）[27]；监管风险（模型备案、出海业务、数据合规等方面存在持续合规成本）[27] 阶跃星辰深度分析 * **发展定位**：是一家产业型公司[5] * **商业模式**：采取“AI+终端”差异化商业模式，将多模态模型深度嵌入手机、智能汽车和IoT等硬件终端，与头部厂商深度共创[1][30]；避开传统C端订阅和B端API售卖路径[30] * **市场表现**：在手机领域，与OPPO、荣耀、中兴等占国内60%份额的头部品牌合作，模型装机量超4,200万台[1][30]；在汽车领域，与吉利、千里科技联合打造智能座舱Agent OS，搭载该技术的吉利银河M9上市三个月销量近4万辆，2026年目标是实现模型上车超100万辆[30]；截至2025年底，终端Agent的API调用量连续三个季度增长近170%，开放平台API调用量增长近20倍，活跃用户量增长近5倍[30][31] * **财务与估值**：2025年年营收接近5亿元人民币，预计2026年将突破12亿元[32]；最新估值60亿美元（Pre-IPO轮第二批投前估值50-60亿美元）[33][34]；基于约0.7亿美元ARR的PS倍数约85倍[34]；计划在2026年6月30日前向港交所提交上市申请，基石轮定价市场预期为100亿美元[1][33] * **技术产品**：专注于万亿参数模型研发，已发布30多款模型[29]；大规模投入自建AI Infra，在端侧部署领域建立技术壁垒[29]；产品包括StepClaw、个人效率引擎“悦问”（iPhone 16相机控制按键在中国市场唯一的独家多模态搜索合作伙伴）、Agent Studio可视化工作流编排平台[29] 公司横向对比 (截至分析时点) * **估值**：OpenAI约8,000多亿美元，Anthropic为3,800亿美元，月之暗面为180亿美元，阶跃星辰为60亿美元[34] * **ARR**：OpenAI（2026年3月）为250亿美元，Anthropic（2026年4月初）为300亿美元，Kimi为1亿美元，阶跃星辰约为0.7亿美元[34] * **PS倍数**：OpenAI约30倍，Anthropic不到13倍，Kimi为180倍，阶跃星辰为85倍[34] * **对比解读**：中国大模型公司当前PS倍数相对较高，主要因处于ARR指数级爆发增长的早期阶段，收入基数小，未来有望通过持续高速增长消化估值[34]

大模型

RaaS（成果即服务）

Agent 能力

Artificial Intelligence

Artificial Intelligence

GPT-5

Claude 4.6

Agent、图像、视频全是大版本升级：春晚还没开，豆包AI就火了

机器之心· 2026-02-14 15:32

行业背景与竞争格局 - 2026年被行业人士视为人类历史上最忙碌、最具决定性的一年，AI领域发布活动密集[1] - 2026年初，Anthropic推出Agent工具Claude Cowork及11个插件，随后与OpenAI几乎同时发布新基础模型Claude Opus 4.6与GPT-5.3-Codex[2] - 海外巨头密集发布导致市场剧烈波动，甲骨文、Adobe、Salesforce、汤森路透、NEC等知名公司股票遭抛售，近万亿美元市值蒸发[2] - 国内AI竞争激烈，腾讯、阿里、字节等公司投入大量真金白银进行春节营销，字节豆包将深度参与2026年春晚互动并送出高额现金红包及超10万份科技礼包[2] - 字节跳动最新上线的视频创作模型Seedance 2.0在未发红包、仍处内测阶段时已火遍全网，成为现象级产品[2] 字节跳动AI产品全面升级 - 2026年2月14日，火山引擎宣布豆包系列模型全面升级，标志着公司在AI领域开始全面出击[3] - 升级涵盖基座模型、图像到视频生成，均为大版本更新，包括豆包大模型2.0、图像创作模型Seedream 5.0 Lite以及视频创作模型Seedance 2.0[3] - 豆包大模型2.0是自2024年5月正式发布以来的首次大版本跨代升级，定位为多模态Agent模型[5] - 豆包大模型2.0在多模态理解、企业级Agent能力以及推理代码能力三个维度实现质的飞跃[6] - 模型针对大规模在线部署环境下的用户体验进行优化，着重加强视觉和多模态查询、推理延迟与复杂指令可靠性[8] - 模型提供多种体量型号以应对不同部署场景，包括Pro、Lite、Mini三款通用Agent模型和Code模型[12] - 模型API已在火山引擎上线[15] 豆包大模型2.0技术能力详述 - **数学与视觉推理能力**：豆包2.0 Pro在MathVista、MathVision、MathKangaroo、MathCanvas等数学推理基准上达到业界最优水平，在科学领域的整体成绩与Gemini 3 Pro和GPT 5.2相当[8] - **视觉感知能力**：在VLMsAreBiased、VLMsAreBlind、BabyVision等视觉感知能力基准中，豆包2.0取得了业界最高分[9] - **推理与Agent能力**：豆包2.0 Pro在IMO、CMO数学奥赛和ICPC编程竞赛中获得金牌成绩，超越了Gemini 3 Pro在Putnam Bench上的表现[10] - **复杂指令与搜索能力**：在HLE-text评测中，豆包2.0 Pro取得最高分54.2分[13] - **指令遵循能力**：豆包2.0重点强化了指令遵循能力，可保持较强的一致性与可控性，为执行长链路、多步骤任务奠定基础[14] - **多模态理解能力**：豆包2.0具备精准的文字提取、深度图表理解、出色的空间感知、运动捕捉和长视频解析能力[18] - **实际应用示例**：模型能识别潦草字迹并结合业务场景进行语义推理，能准确处理表格数据并完成计算、排序等任务[19][22][23][28][29] - **图像识别能力**：能准确识别图片内容，如数出卡通小狗数量并介绍品种，同时标注空间方位和外观特征[32] 豆包大模型2.0的推理与代码能力 - 推理能力大幅跃升，支持思考长度灵活调节，且各思考长度下Token效率全面提升[35] - 在代码生成特别是前端开发领域表现亮眼，能根据提示词生成功能完整的Python可视化代码、HTML Canvas交互效果及可玩的小游戏[35][37][39][40][42] - 在企业级应用场景中，模型能更好支持对Skills的理解和应用，Function Call、多轮指令遵循、搜索和工具调用能力显著增强，格式输出更稳定，并能灵活管理上下文[43] 视频创作模型Seedance 2.0 - Seedance 2.0火爆程度无需多言，在推特、B站等平台引发大量用户创作[44] - 行业普遍认为其在视频创作领域达到了改变业界走向的水平，对复杂场景、多人互动和真实运动逻辑的把控能力让人难辨真假[45] - 获得国内外好评，有网友用它模拟1670年的新阿姆斯特丹获得惊艳效果，连马斯克都评论“It's happening fast”[46] - 知名导演贾樟柯公开表示将用该技术创作短片，成为首位宣布使用该模型的知名导演[48] - 《黑神话：悟空》制作人冯骥评论“AIGC童年时代结束”[50] - 模型支持将任意小说文本生成视频，预计将催生大量AI短剧[51] - **实际应用示例**：仅凭世界上最短科幻小说《最后一个人》的十七个单词提示词，Seedance 2.0就生成了一段10秒高质量短片，具备电影级镜头语言和叙事[53][54] - **图生视频能力**：支持基于参考图生成视频，在角色一致性、动作连贯性和氛围渲染方面表现出色[55] - **技术特性**：支持混合模态输入，允许用户同时输入多达9张图片、3段视频、3段音频以及自然语言指令[56] - 生成视频最长15秒，带双声道音频[56] - 采用统一的多模态音视频联合生成架构，集成业界最全面的多模态内容参考和编辑能力[56] - 相比1.5版本，生成质量大幅提升，在复杂交互和运动场景下的可用率更高，物理准确度、逼真度、可控性均显著增强[56] - 在评测表现上处于业内领先水平，可精准呈现高张力大动作与精细微表情，支持专业级组合运镜与叙事节奏控制[57] - 音频维度上，针对中文方言、戏曲及演唱场景的指令响应准确度明显提升[57] - 该模型的出现标志着视频生成AI已经走到了生产力的门槛上[60] 图像创作模型Seedream 5.0 Lite - 在AI生成图像这个竞争最激烈的赛道，字节跳动已位列领先梯队[61] - Seedream 5.0 Lite是通向统一多模态模型的全新探索，相比4.5版本，在理解、推理和生成能力上实现全面跃升[62] - 模型采用多模态理解生成统一架构，能像人类设计师一样洞察用户意图，在主体一致性和图文对齐等方面表现显著提升[62] - 内置的世界知识体系覆盖科技与人文多个垂类领域，生成结果更符合物理规律，信息可视化能力大幅增强[63] - 首次引入实时检索增强能力，可通过联网获取最新知识和资讯，精准响应时效性创作需求[64] 字节跳动的全方位AI技术布局 - 在语音领域，发布豆包实时语音大模型，实现端到端语音对话，具备低时延、可随时打断等特性，在语音表现力、控制力、情绪承接方面表现惊艳[70] - 在具身智能领域，Seed-Robotics团队推出Seed GR-RL强化学习框架，让机器人在真实场景中稳定完成多步骤、高精度的操作任务[72] - 在AI for Science领域，已耐心投入5年，Seed-AI for Science团队围绕生物领域基础模型、量子化学、分子动力学等方向，发布了SeedFold、SeedProteo等有影响力的学术成果[72] - 这种全方位的技术储备，是公司敢于与OpenAI、谷歌、Anthropic等海外巨头正面交锋的底气[73] 行业影响与展望 - 随着豆包系列新模型的发布，2026年春节档已从“流量高峰”演变成纯粹的“技术战场”[68] - 全模态的豆包系列技术让AI能力又上了一个台阶[69] - 2026年的春节，或许会成为AI应用爆发的分水岭[74] - 行业正在见证首个真・国民级AI入口的诞生[75]