Token
搜索文档
中金公司- Token启示录系列:大模型商业模式的中观分析
2026-06-24 10:30
**行业与公司** * **行业**:人工智能(AI)大模型行业,特别是大模型商业化、Token经济、Agentic AI(智能体)[2][4] * **涉及公司**: * **海外模型厂商**:OpenAI (ChatGPT, Codex)、Anthropic (Claude, Claude Code)、Google (Gemini) [4][19][22][45] * **国内模型厂商**:智谱 (GLM)、深度求索 (DeepSeek)、Kimi、阿里 (通义千问)、字节 (豆包)、MiniMax [45][60][71][75] * **云厂商/合作伙伴**:微软 (Azure)、亚马逊 (AWS)、谷歌 (TPU) [22][27][40] **核心观点与论据** **1. 商业模式:B端与C端双轮驱动,Token价值分层** * **B端模式(Token Factory)**:以API调用为核心,模型智能水平和效率是关键。企业愿意为能提升生产力的智能模型付费 [4][5]。 * **核心场景**:AI编程(Coding)是首个进入真实生产力级别的应用,已初步验证投资回报率(ROI)[6][9]。 * **ROI测算**:假设中国程序员每日Token花费116美元(对应每年22万元),每日节省约4.5小时ROI即可转正;美国程序员在相同花费下,节省不到2.5小时ROI即可为正 [9]。 * **Token消耗量**:单用户基于Agentic Coding的Token消耗是普通ChatBot的**百倍以上** [10]。例如,完成一个代码重构(多文件)任务可能消耗15,000-80,000个Token,而一次普通ChatBot对话仅消耗900-5,700个Token [12]。 * **市场空间(TAM)巨大**:全球白领AI Agent市场总规模(TAM)估算在**1万亿美元(基准情形)至3万亿美元(乐观情形)** [4][16]。 * **用户分层与ARPU假设**: * 重度用户(如软件工程师):年ARPU 12,000-20,000美元 [17][18]。 * 中度用户(如金融分析师):年ARPU 1,000-5,000美元 [17][18]。 * 轻度用户(广义白领):年ARPU 200-1,500美元 [17][18]。 * **竞争格局**:Anthropic与OpenAI在企业市场展开角逐 [19][22]。 * **Anthropic**:专注于Coding和企业市场,年化经常性收入(ARR)从2025年底的**90亿美元**快速增长至2026年5月的**450亿美元**,预计年底有望达到**1000亿美元**,其中80%来自B端客户 [4][19]。 * **OpenAI**:优化商业化战略,加码企业级及Coding市场,其Codex产品周活用户已达**200万**,三个月增长5倍 [22]。 * **C端模式**:通过订阅制和广告进行商业转化,核心是巩固流量入口 [4][5]。 * **用户规模**:截至2026年5月,ChatGPT和Gemini的C端月活分别达到**10亿**和**9亿** [4][45]。 * **订阅模式**:ChatGPT付费用户约占周活用户的**5%**(约3500万用户)。OpenAI预计到2030年付费人数将达到**2.2亿**,占周活人数(26亿)的**8.5%**。假设2030年C端用户平均价格50美元/月,则OpenAI C端订阅ARR将达到约**1320亿美元** [45]。 * **广告模式**:作为覆盖免费用户Token成本的重要路径 [4][50]。 * **OpenAI**:ChatGPT广告上线不到6周ARR已超**1亿美元**,覆盖600个广告主。预计2026年广告收入达**25亿美元**,2030年达**1000亿美元** [50]。 * **Google**:以搜索引擎为基本盘,在AI Overview和AI Mode中加入广告,截至2025年10月,AI Overview年化收入已达**50亿美元** [50]。 * **国内市场**:付费意愿较低,厂商主要依托免费模型占据流量入口,通过与自身生态(如电商、本地生活)联动实现间接变现 [60]。 * **Token价值分层**: * **C端消费级**:完成日常任务,通过订阅/广告变现,预计2030年TAM约**6000亿美元**(订阅4800亿+广告1000亿)[65]。 * **B端Token Factory**:解决复杂任务,按Token或订阅付费,TAM或达约**4万亿美元** [65]。 * **AI原生应用**:按产出结果收费,价值含量最高,仍处探索阶段 [5][65]。 **2. 成本与盈利:训练投入高昂,推理毛利率趋势性提升,远期有望盈利** * **成本结构**:模型厂商成本主要集中在训练、推理和人员 [66]。 * **2025年情况**:海外模型厂商算力支出(训练+推理)基本是收入的**1.5倍**,人员成本占收入的**42%-64%**。Anthropic和OpenAI现金花费分别为**30亿/90亿美元** [66]。 * **训练端**:是当前算力投入重点(约占70%),以提升模型参数规模和智能水平 [68][71]。 * **参数规模**:海外头部模型参数达**2-3T**(Anthropic Mythos甚至达5-10T),国内模型突破**1T** [71]。 * **投入增长**:Anthropic预计2026年训练侧投入约**120亿美元**(同比+193%);OpenAI预计投入约**320亿美元**(同比+285%)[71]。 * **推理端**:随着Agentic AI需求爆发,推理算力占比将提升 [68]。工程优化(如注意力机制优化、PD分离)能有效降低单Token推理成本,提升毛利率 [75][78]。 * **盈利前景**:随着收入放量摊薄训练成本,以及推理毛利率提升,中长期模型厂商将实现盈利 [4][78]。 * **毛利率趋势**:国内模型因价格和参数规模差异,毛利率低于海外,但通过工程优化有望提升至**40%-50%**左右。OpenAI预测未来五年毛利率在**52%-67%**;Anthropic预计2029年毛利率达**77%** [75][78]。 * **盈利时间点**:根据公司预测及第三方估算,**Anthropic和OpenAI分别在2029和2030年实现盈利** [78]。敏感性模型显示,大模型公司可能在运营第**5年**实现营业利润转正 [80]。 **3. 发展趋势与风险** * **发展趋势**: * **Agentic AI渗透加速**:模型正从Coding向提升通用生产力进阶,未来可能出现以天、月为单位工作的智能体 [32]。 * **算力与生态成为关键**:充足的算力储备以支撑激增的推理需求,以及构建吸引开发者和企业的生态系统,将成为模型厂商的竞争壁垒 [38]。 * **Token管理精细化**:随着消耗指数级增长,Task Budget(任务预算)管理将变得重要,以实现任务输出与成本的平衡 [35]。 * **主要风险**:[3][82] 1. **算力持续涨价**:若上游算力(存储、GPU等)涨价幅度超过API提价,将挤压模型厂商利润。 2. **Agent泛化能力不及预期**:若Agent能力无法快速拓展至Coding以外的场景,将影响整体市场空间(TAM)的扩张。 3. **API价格战**:若厂商为争夺份额发起价格战,将影响毛利率和盈利时间表。 **其他重要信息** * **模型能力进展**:Claude Opus-4.6在准确率为50%的情况下可执行**10+小时**的复杂任务(如RFC工程化)[32]。 * **算力储备对比**:OpenAI已上线及锁定算力约**10 GW**,Anthropic约**5 GW** [40]。 * **分成模式差异**:OpenAI与微软分成较严苛(2030年前支付收入的20%),而Anthropic与AWS更偏向合作关系,ARR计算口径不同 [27]。 * **广告效率对比**:当前ChatGPT广告的每次购买成本(CPA)低于Google和Meta,但线索质量高于Meta、低于Google [54]。
DeepSeek抢人大战里,跑出了一家10人公司
虎嗅APP· 2026-06-23 18:55
文章核心观点 - 人工智能行业正经历一场由AI Agent普及引发的“Token-maxxing”现象,Token从模型公司的计费单位演变为企业重要的经营成本和生产力指标,其消耗与成本控制成为行业焦点 [5][7][16] - 在激烈的人才争夺战中,传统招聘平台难以满足AI公司对顶尖、非标准化人才的需求,催生了像DINQ这样利用AI技术从公开技术数据中精准挖掘人才的新型服务 [9][10][23] - AI行业商业化的核心正从单纯追求模型能力,转向关注AI如何进入真实业务场景并创造可衡量的价值,Token成为连接模型能力与商业价值的关键度量单位 [38][41] Token的商业化与成本演变 - **Token消耗激增成为行业现象**:过去半年,“Token-maxxing”在AI行业流行,开发者因使用Claude Code等工具,单月Token消耗可达数万美元,企业也开始将其视为重要经营成本 [5][7] - **AI Agent是推动Token消耗的核心因素**:自2023年下半年起,Claude Code、Cursor及各类Agent产品的成熟,使得“数字员工”能同时处理多项任务,导致Token消耗量级被显著放大,从后台走向前台 [15][16] - **Token成本成为企业现实考量**:企业面临鼓励使用AI与控制Token成本的双重压力,DINQ公司每月Token调用成本达数万至十万美元级别,成本优化成为Agent公司的关键能力 [8][17][18] - **产业链价值分配向模型公司集中**:当前产业链中,模型公司是Token收入的主要获益者,而Token中转服务等角色虽在增长,但其本质仍是购买和分销模型公司的Token [19][20] - **Token正演变为企业的基础生产资料**:随着Agent处理复杂任务(如写代码、分析长文档)导致账单激增,企业开始像管理云计算资源一样,设立专门的Token预算并进行成本管理 [36][37] - **未来Token市场将呈现分层趋势**:预计将形成由少数高价值场景使用昂贵模型、大量普通场景使用低成本模型的分层市场,核心是关注每个Token所能创造的价值 [38] AI人才招聘的挑战与变革 - **AI人才争夺战白热化**:过去一年,大模型、AI Agent、具身智能公司争抢同一批顶尖人才,字节等公司甚至以10倍薪资挖人,迫使如DeepSeek等公司通过融资和股权激励留人 [9] - **传统招聘平台难以满足新需求**:AI公司寻找的是具备特定能力(如强化学习、TPU研发、顶会论文)的非标准化人才,其信息分散在GitHub、OpenReview、论文等公开技术平台,而非传统简历库 [10][23][27] - **新型AI招聘平台应运而生**:以DINQ为例,其通过聚合、索引海量公开技术数据(如近2亿条GitHub数据),利用自然语言交互,帮助企业精准寻找特定方向的人才或潜力新星 [28][31][32] - **招聘逻辑从“找职位”转向“找能力”**:企业需求具体化为寻找“做过Coding Agent的年轻研究者”或“Google做TPU的华人工程师”等,招聘过程是一个通过AI Agent进行需求补全和持续交互的探索过程 [23][29][30] - **年轻潜力人才成为关注重点**:企业不仅寻找已成名的行业明星,更关注已做出项目成果但尚未被市场充分发现的年轻研究者(如00后研究员),这类人才市场需求旺盛 [24][25][31] AI公司的商业模式与价值定位 - **Agent公司的价值闭环挑战**:Agent的核心价值在于提升效率,但难以完全获取其创造的全部价值;而模型公司因处于产业链上游,只要Agent被使用就能通过消耗Token获得收入,商业模式更为直接 [21] - **专业化产品解决核心痛点**:DINQ选择专注于“找人”这一单一功能,旨在解决过去无法解决的人才发现难题,而非仅提升现有流程的效率,以此建立差异化价值 [28] - **数据能力构成核心壁垒**:对于AI招聘等依赖信息的服务,核心壁垒在于对分散的公开技术数据进行大规模聚合、索引和关联的数据建设能力,而非仅仅是模型或Agent能力 [32] - **行业进入理性算账阶段**:AI行业的发展重点从只看模型能力,转向审视AI是否真正进入业务、产生结果并跑出回报,关注技术的实际商业落地与价值转化 [41]