Workflow
Token 经济学
icon
搜索文档
GTC大会开幕,首提“Token经济学”勘误版
东吴证券· 2026-03-23 19:52
核心观点 - 英伟达在GTC 2026大会上首次提出“Token经济学”,宣告“推理时代”正式到来,预测到2027年AI计算需求将达1万亿美元,未来数据中心将成为生产Token的工厂,每瓦性能决定商业命脉[2][4] - AI产业正沿着算力、模型与应用协同推进的路径演进,基础设施加速系统化与重资产化,模型竞争由性能转向执行能力与定价权,应用则向企业流程和消费高频入口深度拓展[2][3][5][6] 算力与基础设施演进 - **算力体系转向推理导向并系统化重构**:在推理需求爆发驱动下,算力体系正向芯片自研、超大规模集群与长期算力绑定三条路径演进,基础设施加速系统化、重资产化与供给锁定[2][3] - **英伟达构建全栈“Token工厂”生态**:为降低Token生产成本,英伟达发布Vera Rubin平台、CPO交换机及太空数据中心等全栈硬件,并强化CUDA与NemoClaw平台生态,向系统级基础设施提供商升级[3] - **头部厂商强化算力自主可控**:特斯拉推进Terafab晶圆厂项目,尝试实现AI芯片从设计到制造的垂直整合;Nebius与Meta签署总额达270亿美元的长期算力协议,基于Vera Rubin平台锁定专属算力容量[3] - **技术突破推动效率跃升**:英伟达Vera Rubin系统实现两年内Token生成速率提升350倍,并通过整合Groq开辟极速推理新层级[4] 模型技术发展 - **模型竞争转向执行能力与分层体系**:大模型进入真实业务执行阶段,行业竞争由性能竞争转向执行能力与定价权竞争[2][5] - **模型体系呈现分层与协同趋势**:OpenAI推出针对高频、低延迟场景的GPT-5.4 mini与nano模型,定位子智能体执行层,推动模型体系分层协同;国内智谱与MiniMax则围绕长链路执行与工作流嵌入优化模型能力[2][5] - **模型厂商开始掌握定价权**:智谱在发布增强工具调用、长链路执行能力的GLM-5-Turbo模型时,同步将其API价格上调20%,反映行业由价格竞争转向能力定价[4][5] - **模型技术沿“执行强化”与“分层调度”发展**:一方面模型需具备长链路、多步骤与持续执行能力;另一方面,不同成本与能力模型的协同调度成为关键架构[5] AI应用落地 - **应用向企业流程与消费高频入口双向拓展**:AI应用正从辅助工具走向可嵌入、多场景运行的执行体系,落地深度与广度同步提升[6] - **企业级Agent成为流程执行节点**:阿里推出企业级Agent平台“悟空”,嵌入钉钉体系并打通账号、权限与业务系统,使AI可在授权范围内直接调用API执行任务,推动AI升级为企业流程执行节点[6] - **消费级Agent强化高频入口价值**:百度通过DuClaw与小度打通,将Agent能力嵌入智能家居,实现路况、天气等服务的主动触发,体现AI进入家庭高频场景[6] - **OpenClaw被预言为智能体时代操作系统**:黄仁勋预言OpenClaw将成为“智能体时代的操作系统”,每家SaaS公司将转型为AaaS(智能体即服务)[4] 行业动态与政策 - **韩国在AI芯片组件上取得突破**:韩国研究团队证实,“突触晶体管”关键组件在相当于太空20年辐射剂量的环境中保持稳定,表明AI系统在极端环境(如太空)中运行具有可靠性[4] - **国内政策提供长期指引**:国务院发布的“人工智能+”行动意见明确了到2027年、2030年、2035年不同阶段的发展目标,为AI产业发展提供了政策指引和长期支撑[6] 市场数据与报告推荐 - **主要科技股周度表现**:在2026年3月16日至20日当周,美国主要科技股普遍下跌,其中英伟达(NVDA.O)周跌4.19%,特斯拉(TSLA.O)周跌5.94%,微软(MSFT.O)周跌3.46%[9] - **东吴证券本周人工智能相关报告推荐**:报告推荐涉及算力ETF、汽车智能化、光模块设备及智能终端等多个AI相关领域,具体包括新华中证云计算50ETF、新泉股份、理想汽车-W、光模块设备商及小米集团-W等标的[8][16]
OpenClaw专家交流
2026-03-17 10:07
行业与公司 * **核心行业**:人工智能(AI),特别是大模型应用与交互范式 * **核心公司/项目**:OpenCloud(OpenCopilot)[1] * **相关国内公司/厂商**:腾讯、智谱、Kimi、Minimax、阿里云、百度云、飞书、东方财富 [1][4][9][10][14][16][24][26] * **相关国外公司/厂商**:OpenAI、Anthropic、微软、谷歌、GitHub [1][4][11][22] 核心观点与论据 1. 行业影响与范式转变 * **确立新交互范式**:OpenCloud 标志着进入“后 GPT 时代”,改变了人机交互范式,从用户通过反复试错的 Chatbot 形态,转变为通过自然语言驱动机器执行任务的智能助理,实现了从“探寻矿山”到“智能驾驶”的升级 [2] * **冲击传统APP生态**:其三层灵活架构支持 Skill 任意编排,对传统重 UI 的独立 APP 生态构成冲击,推动 AI 向主动交互助理演进 [1][10][12] * **引发国内跟进热潮**:2026年春节后,国内几乎所有知名科技公司,包括头部大模型厂商和云厂商,总计有十几家,都在积极跟进 Open Cloud,推出各类衍生版本 [4] * **中美商业模式差异**:国内厂商普遍希望借助 Open Cloud 作为流量入口,带动 Token 消耗、云存储或算力业务,而美国市场(除 OpenAI 外)反应相对平淡,这反映了中美大模型厂商在商业化大模型能力方面思路不同 [4] 2. 市场数据与增长表现 * **项目增长迅猛**:OpenCloud 成为 GitHub 史上增长最快项目,4 个月获约 25 万 star,超越了花费 15 至 16 年的 React 项目 [1][3][4] * **驱动Token消耗激增**:OpenCloud 直接驱动 Token 消耗量激增,2026 年 2 月单月增量达 8-10 万亿 [1][5] * **厂商消耗量暴涨**:如 Minimax 等厂商 Token 消耗环比增长达 197% [1][5] * **平台数据趋势**:在 OpenRouter 平台,Token 消耗量从 2026 年 2 月 2 日当周的约 9.8 万亿,增长至 3 月 9 日当周的 16.9 万亿,一个月左右几乎翻番 [6] * **应用消耗领先**:Open Cloud 在 OpenRouter 上以每周约 3,640 亿 token 的消耗量,遥遥领先于其他应用,高出一个数量级 [7] 3. 商业模式与经济学 * **“Token放大效应”**:商业模式呈现“Token 放大效应”,0.5 元电力成本生成的 Token,经高端模型或 Skill 包装后,可实现几十至上百倍的价值增值 [1][11] * **成本结构**:用户使用成本由“模型订阅费”和“高级 Skill 使用费”两部分组成 [18][20][27] * **催生新商业模式**:包括模型出海(如 Minimax 出海业务占投放的 70%)、Token 附加服务(调度平台)、以及 Token 租赁等 [11] * **项目无分成模式**:OpenCloud 作为开源项目,定位为非盈利,目前未观察到其有明确的抽成或分成模式,扮演流量入口和工具平台角色 [18][20][21] * **Skill收费模式**:Skill 由垂直领域服务商提供并收费,用户需订阅其服务获取 API Key,例如东方财富的 Skill 可能按调用次数收费,文本转语音 Skill 按分钟收费 [26][27][28] 4. 技术路径与生态 * **技术架构优势**:提供灵活的三层架构,支持对前后端、技能等进行任意组合与编排,填补了模型厂商有限内置技能与用户海量多样化需求之间的鸿沟 [7] * **交互方式颠覆**:具备“活人感”和主动性,能像同事一样主动与用户交互(如定时提醒),颠覆传统“一问一答”的 Chatbot 形态 [8] * **技术路线共存**:CLI 模式(高灵活性)与 MCP 协议(高确定性、企业级)将长期共存互补,共同解决用户需求 [1][22][23][24] * **快速迭代与生态壁垒**:迭代速度极快,主要版本更新有时仅需一两天,其核心壁垒在于率先积累的庞大用户生态和贡献者社区,使得后来者难以追赶 [3][4] * **国内产品现状**:国内厂商推出的衍生版(如智谱的 AutoCloud)在 UI 上进行了优化封装,但当前版本尚不稳定,存在配置错误导致服务崩溃且难以调试的问题 [9] 5. 对产业链的影响 * **盘活云与算力业务**:国内厂商跟进旨在争夺流量入口,盘活底层云存储、算力及算力分销业务 [1][4][24] * **正面冲击**:Token 消耗量急剧增长,使国内头部模型厂商原本略显过剩的算力在 2026 年 1 月、2 月迅速转为供不应求 [10] * **推动产业链适配**:对上游,推动了相关服务商的支持(如飞书提供每日 100 万 token 消耗量);对下游,促使企业将自身能力封装成 Skill(如百度高德地图开放 AI Skill) [16] * **合作模式共赢**:OpenCloud 作为重要的入口级产品,为大模型带来流量和应用场景,与大模型厂商是共赢的合作模式 [14][15] 6. 能力边界与风险 * **能力存在上限**:其智力上限由背后调用的大模型决定,动手能力上限由可调用的 Skill 决定 [13][14] * **安全依赖人工**:尽管采用了沙箱结构,但安全运行依然高度依赖于人的判断和指令约束 [13] * **企业使用风险**:由于产品尚不完善且存在漏洞,一些公司的 IT 部门出于安全风险考虑可能会禁止使用 [25] * **产品成熟度**:OpenCloud 从 2025 年 11 月底首次提交代码至今仅四五个月,还处于非常早期的阶段,成熟稳定需要时间 [30] 其他重要内容 * **用户使用范式**:处理复杂任务的基本范式是“发现-学习-执行-定制”的循环,关键在于根据问题类型匹配最合适的大模型 [15][17] * **云厂商产品差异**:云厂商推出的 Copilot 产品(如 Kimi Copilot、智谱 Copilot)与 OpenCloud 核心逻辑一致,差异主要体现在工程化优化(如容错性、重试机制)和用户界面(增加可视化 UI)上 [18][19] * **差异化竞争策略**:厂商应依托已有产品平台和用户基础构建闭环,针对特定用户群体(如企业客户的等保 2.0 合规要求)和场景打造优势,而非覆盖全市场 [24] * **个人使用成本参考**:个人重度用户使用 Kimi Cloud 199 元套餐,一天流量可能消耗月限额的 6%;使用 Open Router 三天内的模型调用花费约 10 美元(不含 Skill 费用) [25]
海外科技行业 2026 年第 7 期:算力景气延续,AI商业化加速落地
国泰海通证券· 2026-03-02 17:24
报告行业投资评级 1. 行业投资评级为“增持” [5] 报告的核心观点 1. 维持行业“增持”评级,推荐AI算力、云厂商、AI应用、AI社交四大方向 [5] 2. 英伟达业绩指引超预期,其新一代芯片的“Token经济学”优势显著,能效比大幅提升,成本急剧下降 [5][8] 3. 百度集团业绩短期承压,但AI相关收入占比显著提升,成为核心增长驱动力 [5][9] 4. 谷歌发布新一代图像生成模型,持续升级多模态能力,提升生成效率与成本表现 [5][10] 5. 中国AI模型调用量首次超过美国,显示出中国AI厂商整体崛起的规模效应 [25] 根据相关目录分别进行总结 周观点 1. **英伟达**:FY26Q4营收同比增长73%至681亿美元,其中数据中心收入623亿美元,同比增长75% [5][8]。来自云服务提供商(CSP)的收入占比略超50%,客户结构多元化 [5][8]。数据中心网络收入同比增长263%,主要受GB200/GB300系统及NVLink带动 [5][8]。公司上调Blackwell与Rubin平台合计收入指引至5000亿美元,Rubin样品已交付并将于2026年下半年量产 [5][8]。Blackwell平台每兆瓦吞吐量提升50倍,百万tokens成本降至1/35,预计Rubin平台将再提升10倍 [5][8] 2. **百度集团**:25Q4总营收327.4亿元,同比下降4.1%;核心收入261.1亿元,同比下降5.7% [5][9]。经调整净利润39.1亿元,同比下降41.8% [5][9]。AI相关收入超过110亿元,占核心收入比例达43% [5][9]。其中,AI云收入同比增长34%,AI加速器订阅收入同比增长143% [5][9]。AI原生营销收入27亿元,同比增长110% [9]。萝卜快跑在25Q4完成340万次全无人订单,同比增长200%,累计订单超2000万次,运营城市拓展至26个 [5][9] 3. **谷歌**:发布新一代图像生成模型Nano Banana 2(Gemini 3.1 Flash图像模型),旨在实现更快、更低成本、更易用的高质量图像创作 [5][10]。模型融合了高质量与高速度,并增强了自然语言理解能力以更准确解析复杂提示 [10]。新版本支持多种纵横比与最高4K分辨率输出,在光照、纹理细节与清晰度方面进一步优化 [10] 一周行情回顾 1. **大盘指数**:报告期内(2026.02.22-2026.02.28),恒生指数上涨0.82%,恒生科技指数下跌1.41%,道琼斯工业指数下跌1.31%,纳斯达克指数下跌0.95% [11][21] 2. **板块指数**:同期,恒生互联网科技业指数下跌2.49%,HK网络游戏指数下跌1.60%,HK AIGC概念指数下跌6.42%,纳斯达克中国金龙指数下跌3.61% [16][17] 3. **重点个股(港股)**:报告期内涨幅前三为联想集团(+5.5%)、京东集团-SW(+0.6%)、美团-W(+0.5%);跌幅较大的包括阅文集团(-11.2%)、快手-W(-5.5%)、哔哩哔哩-W(-3.7%) [18][19][22] 4. **重点个股(美股)**:报告期内涨幅前三为嘉楠科技(+8.5%)、TWILIO(+6.9%)、逸仙电商(+6.5%);跌幅较大的包括ZOOM(-18.1%)、爱奇艺(-12.1%)、新东方(-9.3%)、百度(-8.4%) [18][23][24] 一周AI行业要闻 1. **中国AI调用量首超美国**:根据OpenRouter数据,2026年2月9日至15日当周,中国AI模型调用量达4.12万亿Token,首次高于同期美国的2.94万亿Token;2月16日至22日进一步攀升至5.16万亿Token,三周累计增长127% [25]。全球调用量前五的模型中,中国占据四席 [25] 2. **苹果接受三星存储芯片涨价**:苹果确定由三星为iPhone 17系列提供LPDDR5X内存,采购价格较此前翻倍(上涨100%) [25] 3. **阿斯麦下一代EUV设备就绪**:阿斯麦表示新一代EUV光刻设备已完成准备,可正式交付用于大规模量产,单台价格约4亿美元 [26][27] 4. **宇树发布新款四足机器人**:宇树科技发布Unitree As2四足机器人,峰值扭矩90N·m,空载续航超4小时,支持15kg负载,具备复杂地形适应能力并搭载仿生具身大模型 [27] 5. **特斯拉Cybercab下线**:特斯拉自动驾驶出租车车型Cybercab已在得州超级工厂下线,该车为双门设计,取消方向盘和踏板 [28] 投资建议 1. **算力方向**:推荐英伟达、台积电、阿斯麦、博通 [28] 2. **云厂商方向**:推荐微软、亚马逊、谷歌 [28] 3. **AI应用方向**:推荐AI Agent方向受益的苹果、高通、联想集团、小米集团,以及Physical AI方向受益的特斯拉 [28] 4. **AI社交方向**:推荐腾讯控股、Meta、谷歌 [28]
黄仁勋年初对话:2025 的 AI 如何塑造产业的「五层蛋糕」?
机器之心· 2026-01-17 10:30
AI技术转化为社会产出的路径与模型 - AI行业的进步核心在于**Grounding(落地/基础能力)与推理能力的显著提升**,高质量推理Token已展现出巨大的商业价值和盈利潜力,例如某些公司毛利率高达90% [5][6] - 未来十年,**Token生成成本将实现十亿倍级别的削减**,这得益于硬件性能迭代和算法模型优化,构成了AI领域的“Token经济学” [6] - 实现这一价值转化的技术堆栈被定义为 **“五层蛋糕”模型**,从底层的能源与芯片,到基础设施层,再到核心的模型层,最终延伸至自动驾驶、机器人等垂直行业应用,将AI转化为实际生产力 [8][9][10] - **开源生态**是驱动技术普惠和加速创新的关键纽带,它降低了初创公司和科研机构的创新壁垒,使其能直接利用成熟模型进行研发,缩短了路径,并在医疗、工业等领域降低了准入门槛 [10][11][12] - **混合专家模型等架构优化**使得计算负载不再与模型规模同步增长,从底层保障了训练与推理成本的持续下降 [7] - 当前,**构建类似ChatGPT规模的模型成本已急剧下降**,从最初的高昂估算变为如今在个人电脑上仅需一个周末即可完成训练 [8] AI对能源产业的驱动与影响 - AI因其巨大的算力需求,正在**倒逼能源产业实现技术跨越**,特别是推动核能与小型模块化反应堆等可持续能源技术的发展 [13] - AI被视为**推动全球可持续能源转型的最强动力**,它通过驱动从芯片、超算到智能工厂的整个产业链,创造了实质性的工业增长 [13] 对“上帝AI”与“AI末日论”的产业观点 - AI的渗透趋势面临现实制约,其发展并非导向“上帝AI”或导致人类末日的叙事,相关论调存在漏洞 [4] - **AI成本正以每年超过10倍的速度下降**,这一趋势反驳了关于AI发展不可持续或必然导致泡沫的担忧 [1]