Token
搜索文档
黄仁勋GTC完整演讲:生成Token的成本与效率,决定科技企业的营收与生死
虎嗅APP· 2026-03-17 22:03
英伟达的战略定位与产业愿景 - 公司正从芯片制造商转型为AI时代的“发电商”,通过全面掌控能源、芯片、基础设施、模型、应用这五层蛋糕,构建统治下一个时代的AI工厂 [2] - AI时代正从单纯的数字生成时代,深化为物理AI大爆炸以及代理式AI全面普及的时代,AI将拥有在三维物理世界中行动与交互的实体能力 [2] - 公司致力于打造全球每Token成本最低的计算方案,因为Token是AI时代新的基础货币,其生成成本与效率直接决定了科技企业的营收 [3] 市场规模与算力需求 - 到2027年,全球计算需求将突破1万亿美元大关 [3] - 过去两年计算需求增长了10000倍,使用量可能增长了100倍,公司相信计算需求在过去两年里增长了一百万倍 [32] - 到2026年,Blackwell和Rubin架构的采购订单总额将达到5000亿美元,而到2027年这一数字将至少达到1万亿美元 [32] 下一代计算架构与平台 - 下一代Vera CPU + Rubin GPU架构专为AI代理系统打造,能在一个系统中连接多达144个GPU,并实现硬件与软件的彻底垂直整合 [5] - 新架构结合液冷技术和封装光学器件,预期能为企业带来高达5倍的营收产出比 [5] - Vera Rubin平台提供3.6 Exaflops算力和每秒260 Terabytes的全对全带宽,算力在10年内提升了4000万倍 [43] - Vera Rubin系统已实现100%液冷,安装时间从两天缩短至两小时,并使用45度温冷却以降低散热成本 [44] 软件生态与CUDA护城河 - CUDA生态诞生20周年,已在全球累积数亿GPU的装机量,渗透进每一个技术生态 [6][12] - 庞大的CUDA装机量是推动飞轮效应的核心动力,吸引了开发者并催生了新市场 [12] - 公司发布了用于结构化数据处理的cuDF和用于非结构化AI数据的cuVS两个基础库 [16] - 公司正在研发下一代图形技术DLSS 5.0,这是3D图形与人工智能(神经渲染)的融合 [15] 代理式AI与操作系统 - 公司推出了NemoClaw参考堆栈,相当于为代理式计算机打造了一个专用的操作系统底座,让开发者能快速构建、部署和加速个性化AI Agent [7] - OpenClaw成为人类历史上最受欢迎的开源项目,它是一个超级连接器和全局化的智能体系统,本质上是一个操作系统 [69][71] - 公司宣布全力支持OpenClaw生态,并推出了具备企业级安全和隐私保护能力的NemoClaw参考实现 [69][74] 物理AI与机器人技术 - 公司强调物理AI的概念,AI必须学会理解重力、摩擦力以及复杂的三维物理空间 [8] - 在自动驾驶领域,比亚迪、现代、日产等头部车企已加入公司的Robotaxi就绪平台 [8] - 公司发布了专为人形机器人打造的通用基础模型Project GR00T,并大幅更新了Isaac机器人平台 [8] - 自动驾驶汽车的ChatGPT时刻已经到来,公司自动驾驶出租车平台新增四位合作伙伴,其年产量达1800万辆 [80] 垂直整合与横向开放 - 公司是一家垂直整合但同时横向开放的公司,深入理解各垂直行业和领域,并开发相应的库 [26][27] - 通过将软件、库和技术与合作伙伴的技术结合,集成到任何目标平台,将加速计算带给世界上的每一个人 [27] - 公司拥有触达各大垂直领域的领域特定库,例如金融服务、医疗保健、工业、量子计算等 [27][28] 推理之年与Token经济学 - 2025年是公司的推理之年,致力于在AI的每一个阶段都表现出色 [35] - 公司60%的业务来自前五大超大规模云服务商,另外40%的业务遍布区域云、主权云、企业、工业等领域 [35][36] - Token正在成为一种新的大宗商品,市场将出现细分,从免费层级到每百万Token收费150美元的高级模型服务 [45][46] - 在给定的功率下,AI工厂的吞吐量和Token生成速度将直接决定明年的收入 [44] 收购与架构整合 - 公司收购了Groq芯片研发团队并获得技术授权,以打破同时兼顾高吞吐量与极低延迟的物理瓶颈 [52] - 通过名为Dynamo的软件实现解耦推理,将高吞吐量计算任务交给Vera Rubin,将解码生成等负载卸载给Groq [54] - 整合Groq技术的新一代Vera Rubin系统实现了高达35倍的性能飞跃 [55] 产品路线图与未来架构 - 公司正以每年一次的极速节奏推进架构迭代,从芯片公司蜕变为提供AI工厂和基础设施的系统级公司 [64] - 下一代Rubin Ultra芯片正在流片中,将首发搭载革命性的NVFP4计算架构 [61] - 之后将迎来代号为Feynman的全新一代架构,拥有全面革新的GPU和由公司与Grok团队打造的全新LPU——LP40芯片 [62] AI工厂设计与运营 - 公司打造了Omniverse及其延伸的DSX平台,这是一个用于联合设计吉瓦级超级AI工厂的数字孪生平台 [64] - DSX平台能直接与现实世界的电网连接,动态统筹调度数据中心功耗以节约能源,并引入Max-Q技术进行动态负载均衡 [64] - 公司计划在太空中建设数据中心,正研发名为Vera Rubin Space One的新型计算机 [66] 开放模型与主权AI - 公司处于每一个AI模型领域的最前沿,拥有涵盖语言、视觉、生物学、物理学等领域的近三百万个开放模型 [74][75] - 公司宣布成立Nemotron联盟,致力于开发更出色的基础模型,以帮助每个国家建立其主权AI [76] - 公司的开放模型为研究人员和开发人员提供了构建其专业领域AI的基础,模型在多个领域位列排行榜第一 [75][76]
华尔街点评GTC:在英伟达的定义里,算力即收入,Token是新的大宗商品
华尔街见闻· 2026-03-17 20:16
AI算力商业逻辑重构 - 公司提出核心叙事:Token已成为新的大宗商品,算力即收入 [1] - Blackwell系统相较上一代Hopper,每Token成本降低高达35倍,即将推出的Rubin系列有望在此基础上再降低2至35倍 [1] - 持续压缩的Token成本曲线被视为驱动AI需求规模化扩张的根本动力 [1] 需求能见度与结构 - 公司管理层将数据中心销售可见度从5000亿美元(覆盖至2026年)大幅上调至逾1万亿美元(覆盖2025至2027年累计)[1] - 高置信度采购订单已超过1万亿美元,较2025年10月公布的5000亿美元翻倍 [2] - 需求结构多元化:约60%来自超大规模云厂商,约40%分布于CUDA云原生AI企业、云合作伙伴、主权AI及工业/企业客户 [2] 传统企业工作负载加速 - 公司阐述了传统企业工作负载加速这一需求向量,宣布与IBM、谷歌云、戴尔等合作,并推出cuDF及cuVS两大CUDA-X基础库 [3] - 该方向逻辑在于摩尔定律趋于失效,领域专用加速是唯一可行的替代路径,这将把公司的可寻址市场扩展至AI训练/推理周期之外 [3] 架构创新:Groq LPU整合 - Groq 3 LPU与Vera Rubin的整合被评定为架构层面最重要的新品发布 [4] - 该解耦推理架构将高吞吐量的Rubin GPU与低延迟解码的Groq LPU配对使用,优化不同工作负载 [4] - LPX机架集成256颗LPU,提供128GB聚合SRAM、40PB/s内存带宽及315 PFLOPS推理算力,预计2026年第三季度上市 [4] - 对于需要超高Token速度的工作负载,约25%的数据中心功耗将分配给LPX机架 [4] - Rubin系统搭配SRAM LPX机架后,高端低延迟工作负载的效率可较上一代提升35倍 [5] - 该架构解决了单一处理器无法同时优化吞吐量与延迟的矛盾,使公司能在高端推理市场有效竞争 [6] 互联技术路线 - 公司将同时推进铜缆与共封装光学两条互联路线 [7] - 在Vera Rubin世代,Oberon机架采用铜缆扩展至NVL72,光学扩展至NVL576 [7] - Spectrum-6 SPX共封装光学以太网交换机已量产,其光学功耗效率较传统可插拔收发器提升5倍,韧性提升10倍 [7] - 对于Rubin Ultra,Kyber机架采用铜缆NVLink扩展,同时提供基于CPO的NVLink交换方案作为备选 [7] - CPO扩展对客户完全可选,预计铜缆扩展将在至少2027年前继续主导NVL72/NVL144配置 [7] 独立CPU业务 - Vera CPU独立业务被确定将成为一个数十亿美元量级的业务,属于增量收入来源,尚未被当前市场一致预期所涵盖 [8] - Vera CPU搭载88颗自研ARM核心,内存带宽1.2TB/s,功耗仅为传统服务器CPU的一半,通过NVLink-C2C以1.8TB/s速率与GPU互联 [8] - CPU正成为智能体AI扩展的瓶颈,强化学习与智能体工作流需要大量CPU环境来测试和验证GPU模型的输出结果 [8] - Meta已在规模化部署上一代Grace CPU,Vera将于2027年接替 [8] 产品路线图与平台战略 - 公司重申年度平台发布节奏:Blackwell(2024年)→ Blackwell Ultra(2025年)→ Rubin(2026年)→ Rubin Ultra(2027年)→ Feynman(2028年)[9] - Rubin Ultra将采用4芯片GPU配置,搭载1TB HBM4e,新增LP35 LPU芯片,Kyber机架支持每NVLink域144颗GPU [9] - Feynman细节超出预期:采用台积电A16(1.6nm)工艺,引入芯片堆叠与定制HBM;新CPU命名为Rosa;新LPU命名为LP40;还包括BlueField-5 DPU、ConnectX-10超级网卡等 [9] - 公司纵向整合平台横跨七颗芯片、五种机架系统及配套软件栈,难以被复制 [10] - 推理需求加速、传统工作负载加速带来的可寻址市场结构性扩张,以及客户基础的持续拓宽,共同支撑着一个更具持续性的AI资本开支周期 [10]
吴泳铭挥刀向内:终结阿里诸侯割据,AI正式接管核心战场
创业邦· 2026-03-17 12:14
阿里巴巴组织架构调整核心 - 阿里巴巴集团CEO吴泳铭于3月16日晚发布全员信,宣告成立全新的核心事业群——Alibaba Token Hub (ATH),该事业群将与阿里云智能、电商事业群平行,成为公司三大核心业务支柱之一[2][3] - 此次调整是吴泳铭上任后最具标志性的架构变动之一,其核心是将AGI(通用人工智能)业务从云计算体系中彻底剥离,并提升至与集团现金牛业务同等的战略高度[4][6] - 调整的核心主线是“Token”,公司旨在围绕Token打造从创造、输送到应用的全链路商业体系,以应对AI需求向生产力端快速转移的趋势[7][11] 调整动因与战略考量 - 直接动因是企业端AI需求的爆发,春节期间阿里云Coding Plan的Tokens成为阿里云史上销量增长最快产品,其“首购优惠”因过于火爆而在上线两周后被迫停止[10] - 公司高层判断AI Coding能力已跨越临界点,AI Agent将带动Token需求指数级增长,未来云的核心用户将从企业级开发者扩展至小B和超级个体,Token将升级为数字时代的基础能源[11] - 内部长期存在的协同壁垒是调整的另一动因,此前AI相关功能分散在不同事业群,存在“BU墙”或“诸侯割据”现象,这在红利期后成为阻碍[12][14] - 此次调整旨在通过组织整合实现AI业务的“大兵团作战”,以应对百度、字节、腾讯在AGI赛道的激烈竞争,避免在生产力落地战场落入下风[27] ATH事业群的具体构成与整合逻辑 - ATH整合了通义实验室、MaaS平台、千问、悟空、AI创新事业部等资源,围绕Token拆分为“创造-输送-应用”三个关键阶段[16] - “悟空事业部”首次亮相,定位为“B端AI原生工作平台”,标志着公司将重点发力企业级AI市场[16] - 整合逻辑是基于Token的“生命周期链路”,旨在将技术优势转化为系统性的商业生产力,这与谷歌合并Google Brain与DeepMind的研发产品统一思路有所不同[16] 调整面临的挑战与阵痛 - 技术人才出现更替,通义千问技术灵魂人物林俊旸在调整前两周突然离职,他曾带领Qwen成为全球最受欢迎的开源大模型之一[17] - 商业化面临现实难题:春节期间公司举生态之力强推千问APP,据估算营销花费约30亿元,日活峰值达7352万,但活动结束后日活腰斩;新成立的“悟空事业部”面临企业服务市场需要慢工出细活的挑战[18] - ATH与阿里云作为平行事业群,未来如何划分权责、实现“算力+模型+应用”的真正协同,仍是未知数[18] 阿里巴巴频繁组织调整的深层逻辑 - 公司是国内互联网大厂中组织架构调整最频繁的,过去三年进行了超过10次重大组织调整[20] - 深层原因在于其超大型商业生态的复杂性,既有业务墙和内部“山头主义”往往成为新战略落地的阻碍,历次重大调整本质都是为了打破这种格局,寻找新生产力时代下的最优协作模式[21][22] - 公司战略重心几乎每三到五年就有一次大的转向,从早期的电商使命到“消费+产业互联网”双轮驱动,再到“内需、全球化、云计算”三大战略,如今加上“AI驱动”,每次战略转向都需要组织架构适配[23][24] - 掌舵人风格影响显著,技术背景出身的CEO吴泳铭上任后,公司在AI投资上明显加速,据不完全统计,2025年投资了近10家AI公司,2026年已公布5家,投资领域涵盖大模型、人形机器人、算力存储及脑机接口[25] 头部大厂AGI组织路径对比 - 阿里巴巴采取高频调整、全链路闭环逻辑,将AGI业务完全剥离为独立战略主体,打造以Token为核心的全链路商业体系[30] - 百度采取低频调整、坚持“云智一体”逻辑,将AI业务全部整合至百度智能云事业群,形成“飞桨框架-文心大模型-智能云”全栈自研闭环,AI是强化云服务竞争力的基础能力[30][31] - 字节跳动采取中频调整、产品驱动逻辑,实行“大中台小前台”模式,大模型研发集中在研究院(中台),C端与B端应用作为独立前台单元快速试错迭代,以此保持产品敏捷性[30][32] - 腾讯采取极低频调整、生态赋能逻辑,将AI定位为全业务线的底层赋能工具,大模型研发集中在研究院,落地能力分散在各事业群,让AI深度融入现有业务生态[30][34]
阿里、腾讯、京东、小米,集体上涨
第一财经· 2026-03-17 09:50AI 处理中...
| 名称 | 现价 | | --- | --- | | 恒生指数 | 26059.17 225.15 0.87% | | 恒生科技 | 5163.34 51.56 1.01% | | 恒生生物科技 | 14504.70 131.95 0.92% | | 恒生中国企业指数 | 8883.31 66.99 0.76% | | 恒生综合指数 | 3959.53 36.62 0.93% | 科网股集体走高, 理想汽车涨超3%, 腾讯音乐、蔚来涨超2%,小米集团、美团、商汤、 腾讯控 股、京东集团 等涨超1%。 3月17日,香港恒生指数开盘涨0.4%,恒生科技指数涨0.5%。盘初, 恒生科技指数迅速扩大至1%。 阿里巴巴涨超2%。 3月16日,阿里巴巴正式成立Alibaba Token Hub(ATH)事业群,建立以"创造 Token、输送Token、应用Token"为核心目标的新组织,由阿里巴巴CEO吴泳铭直接负责。Alibaba Token Hub包括通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部。 | 名称 | 涨跌幅 ▼ | 现价 | 淵跌 | | --- | --- | --- | --- ...
重磅!阿里成立Alibaba Token Hub事业群
是说芯语· 2026-03-17 07:53
阿里巴巴成立Alibaba Token Hub事业群 - 公司于3月16日宣布成立Alibaba Token Hub事业群,由CEO吴泳铭直接负责,其核心目标是“创造Token、输送Token、应用Token” [2] - 新事业群整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部,覆盖从基础模型研发、模型服务平台到个人与企业端AI应用的完整布局 [2] 新组织架构的具体职责划分 - 通义实验室负责“创造Token”,任务是创造领先的多模态模型 [2] - MaaS业务线负责“输送Token”,作为大模型服务平台面向企业客户 [2] - 千问事业部、悟空事业部及AI创新事业部负责“应用Token”,面向B端和C端用户的AI入口 [2] - 悟空事业部首次公开,定位为“B端AI原生工作平台”,关注将模型能力深度融入企业工作流 [2] - AI创新事业部旨在快速验证AI应用的新模式和新市场 [2] 公司的战略意图与行业背景 - 公司认为当下正处于AGI(通用人工智能)爆发前夜,未来将由数以百亿计的AI Agent支撑大量数字化工作,这些AI Agent由模型产生的Token驱动,成为人机交互的主要载体 [3] - 公司CEO曾预测,未来可能有超过全球人口数量的Agent和机器人与人类协同工作,Agent将成为消耗Token的主力 [4] - 公司以“Token”而非“模型”或“算力”为主线整合AI业务,标志着战略重心从追求技术领先转向追求商业落地和应用爆发 [5] - 面对字节跳动“豆包”等AI应用的竞争压力,公司正从组织架构上整合资源,全面投入智能体(Agent)时代的竞争 [5] 内部调整与协同战略 - 此前,千问大模型技术负责人林俊旸离职,部分原因被指是其希望保持通义实验室独立性与集团战略不符 [5] - 随着通义实验室与千问事业部等并入Alibaba Token Hub,公司旨在加强基础大模型与应用端的协同 [5] - 公司的论断正从“模型即产品”转向相信“模型 + 智能体”是走向AGI的路径 [6]
阿里CEO亲自带队,内部信称“历史性机遇”来了!
第一财经· 2026-03-17 00:02
阿里巴巴组织架构调整 - 阿里巴巴于3月16日成立Alibaba Token Hub事业群,由CEO吴泳铭直接负责[3] - 新事业群以“创造Token、输送Token、应用Token”为核心目标[3] - 该事业群整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部,覆盖从基础模型研发到个人与企业端AI应用的完整布局[3] 新事业群具体业务分工 - “创造Token”由通义实验室负责,任务是创造领先的多模态模型[3] - “输送Token”由MaaS业务线负责,作为大模型服务平台面向企业客户[3] - “应用Token”由千问事业部、悟空事业部及AI创新事业部负责,面向B端和C端用户的AI入口[3] 新业务单元与战略方向 - 悟空事业部首次公开,定位为“B端AI原生工作平台”,关注将模型能力深度融入企业工作流[3] - AI创新事业部的成立旨在快速验证AI应用的新模式和新市场[3] - 此举意味着阿里巴巴在发力C端AI入口之战的同时,也将重点布局B端AI应用市场[3] 公司战略转型与行业背景 - 阿里巴巴正从追求技术领先的探索,全面转向追求商业落地的应用爆发,以“Token”而非模型或算力为主线整合AI版图[5] - 公司调整了过去几年更专注基础大模型的AI路线,为应对智能体时代加速到来的行业竞争,从组织架构上整合兵力[5] - 此次整合旨在加强基础大模型与应用端的协同,此前千问大模型技术负责人林俊旸离职的部分原因被指与集团希望加强协同的战略不符[5] 对AGI与Token经济的展望 - 公司CEO吴泳铭认为当下正处于AGI爆发前夜,未来大量数字化工作将由数以百亿计的AI Agent支撑[4] - 这些AI Agent将由模型产生的Token支撑运行,成为人类与数字世界交互的主要载体[4] - 公司相信“模型 + 智能体”是走向AGI的路径,“模型即产品”的论断正在成为过去[6] - 未来可能有超过全球人口数量的Agent和机器人与人类一起工作,Agent将成为消耗Token的主力[5]
阿里的“DeepMind时刻”:吴泳铭亲征,Token帝国的黎明
华尔街见闻· 2026-03-16 22:47
阿里巴巴组织架构重塑 - 公司于3月16日宣布成立Alibaba Token Hub事业群,由CEO吴泳铭直接挂帅,整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新部[1] - 此次重组是全球科技巨头中首次彻底摒弃按产品线划分的传统逻辑,转而以“Token流转”为核心组织原则重构AI版图[2] - 新组织ATH的使命是“创造Token、输送Token、应用Token”,覆盖从基础模型研发、模型服务平台到C端和B端AI应用的完整链条[6][9] AI行业Token消耗趋势 - 全球Token消耗量正经历“寒武纪大爆发”,驱动力来自AI Agent[3] - 当AI从“聊天”转向“办事”,推理模型每次查询的Token消耗比普通模型高17倍以上,Agent工作流消耗更是传统聊天的100倍[3] - 谷歌CEO皮查伊在2025年10月透露,谷歌每月处理的Token数量已达1.3千万亿个,较一年前暴增约130倍[4] 阿里巴巴AI业务增长数据 - 阿里云百炼平台的API调用量在去年一年内增长接近100倍[5] - 千问模型全球下载量突破10亿次,并在OpenRouter全球市场份额中占比超12.3%,超越OpenAI和Llama系列[5] - 千问App自去年11月公测起,3个月内月活跃用户突破2.03亿[7] - 百炼的Coding Plan订阅服务因需求持续快速暴涨超出预期,上线约两个月后被迫暂停首购优惠[5] 与谷歌DeepMind整合案例对比 - 谷歌在2023年4月将Google Brain和DeepMind合并,由Demis Hassabis统帅,以应对外部竞争和内部资源内耗[10] - 合并后8个月发布Gemini 1.0系列模型,次日Alphabet股价涨5.3%[11] - 到2026年1月,Gemini市场份额从一年前的约5.7%跃升至21.5%,全球月活用户达7.5亿[11] - Alphabet市值在2026年1月12日历史性突破4万亿美元[11] - 从合并重组到市值巅峰,耗时不到3年[12] ATH整合的潜在优势与关注点 - ATH的整合版本比谷歌更领先,一步到位将模型研发、MaaS平台、C端和B端应用全部整合,覆盖Token完整生命周期,而谷歌DeepMind的整合前后经历了约18个月[14] - 首次亮相的悟空事业部定位B端AI原生工作平台,旨在将模型能力深度融入企业工作流[15] - ATH还将监管钉钉和夸克品牌下的设备,钉钉在中国企业市场拥有超过7亿用户,为B端AI应用提供了强大的分发基础[15] - 公司自2023年9月确立“AI驱动”战略,到2025年2月抛出3800亿元人民币资本开支计划,再到ATH成立,完成了“战略宣言→资本配置→组织重塑”的闭环[17] 行业竞争格局演变 - ATH的成立宣告AI战争从“模型军备竞赛”正式进入“Token供应链之争”[20] - 行业竞争的关键在于谁能率先完成从底层算力到顶层应用的全链条整合,从而掌握下一个十年的定价权[20]
阿里建立AI新组织,CEO挂帅,Token 为尺、Agent为纲
雷峰网· 2026-03-16 20:48
ATH事业群成立与战略目标 - 阿里巴巴于2026年3月16日宣布成立Alibaba Token Hub(ATH)事业群,由CEO吴泳铭直接负责,事业群以“创造Token、输送Token、应用Token”为核心目标,成为全球首个以Token为核心组织架构的科技巨头 [1][2][3] - ATH事业群的成立旨在应对AI Agent时代的新竞赛,其认为当下处于AGI爆发前夜,未来将有数以百亿计的AI Agent由模型产生的Token支撑运行,成为人机交互的主要载体 [2][3] - ATH事业群整合了通义实验室、MaaS业务线、千问事业部、悟空事业部及AI创新事业部,覆盖从基础模型研发、模型服务平台到个人与企业端AI应用的完整布局,标志着阿里AI业务走向“大一统” [2][8][9] 市场背景与Token需求激增 - 中国企业级大模型日均调用量在2025年下半年飙升至37.0万亿tokens,较上半年的10.2万亿增长263% [5][6] - 在2025年下半年,阿里千问(Qwen)在中国企业级大模型市场的占比从17.7%跃升至32.1%,几乎翻倍,且增幅最多 [6] - 阿里云百炼推出的最强Coding Plan因订阅火爆导致tokens价格暴涨,成为阿里云史上增长最快的产品 [4] - 阿里在C端产品也取得进展,千问App在2026年2月7日的日活跃用户数达到7352万 [5] 产品布局与市场动作 - 阿里近期推出多款Agent相关产品,包括桌面Agent工具CoPaw、集成全球顶尖模型和Agent框架的QoderWork,以及面向C端用户、可实现“一键养虾”的JVS Claw [4] - 公司计划最快于本周推出由钉钉团队开发的全新企业级AI Agent应用,旨在提供比OpenClaw更强大的Agent能力,并内置专门的安全功能以保障企业数据隐私 [4] - 新成立的“悟空事业部”定位为B端AI原生工作平台,是阿里在B端深水区变现的重武器,旨在将大模型能力深度融入企业工作流,用数百亿计的AI Agent替代传统数字化工具 [9][10] 竞争优势与行业趋势 - 阿里拥有由通义实验室、阿里云和平头哥组成的AI黄金三角“通云哥”,具备全栈自研芯片、亚太第一的云平台以及全球最强开源模型“千问”的协同创新能力 [12] - 底层模型全面革新的Qwen3.5-Plus,性能媲美Gemini 3,但Token价格仅为后者的1/18 [12] - AI正成为云计算的核心驱动力,阿里云在中国云市场的份额在2025年第一、二、三季度依次为33%、34%和36%,连续三个季度保持增长并稳居市场第一 [12] - 行业趋势显示,AI Coding能力已跨越临界点,未来云计算产品的用户将从人类工程师逐渐变成AI Agent;AI Agent的不眠不休工作将带动tokens需求飞速增长;云和AI产品的使用者将从大型企业扩展至更多小型B端客户和超级个体 [11] 组织调整的挑战与对标 - 此次组织调整被类比为2023年谷歌合并Google Brain与DeepMind以应对ChatGPT的竞争,合并后的谷歌DeepMind在2025年1月至2026年1月期间,其Gemini的市场份额从14.7%提升至25.1% [2][3] - 市场期待阿里通过ATH的横向整合,实现类似谷歌的“Gemini式”智能大爆发,并构建从创造、输送到应用Token的完整产业链纵向优势 [10][12] - 如同在高速飞行的飞机上更换发动机,此次大调整将面临部门利益博弈、底层数据打通、技术架构融合及人才出走等“阵痛”挑战 [12]
独家|阿里再放大招,围绕Token成立事业群,吴泳铭亲自带
虎嗅APP· 2026-03-16 18:50
公司核心战略与组织架构调整 - 阿里巴巴于3月16日进行了一次重要的内部架构调整,成立了全新的Alibaba Token Hub(ATH)事业群,该事业群将平行于阿里云智能事业群和电商事业群,由CEO吴泳铭直接负责 [4] - ATH事业群的核心目标是围绕Token的创造、输送和应用,旨在打破原有“BU墙”,强化各AI业务板块之间的战略协同,以“大兵团作战”方式应对AI生产力时代的竞争 [5][10] - 此次架构调整的深层逻辑是将Token作为串联AI业务的核心抓手,构建一个从模型创造到场景应用的完整工业生态体系,标志着公司AI战略从关注技术本身转向关注AI作为关键生产力的整体可用性 [6][11] ATH事业群的业务构成 - ATH事业群由五大事业部构成,形成一个“4+N”体系:“4”为基础支柱,包括通义实验室、MaaS业务线(原百炼)、千问事业部和悟空事业部;“N”则为持续探索的AI创新事业部 [6][9] - 通义实验室负责Qwen大模型等基础模型的研发,追求模型能力上限;MaaS业务线负责构建模型服务平台,支撑全行业AI生态;千问事业部聚焦打造最好的个人AI助手;悟空事业部致力于打造B端AI原生工作平台;AI创新事业部负责探索新模式和新市场 [9][17][18][19][20][21] - 该架构将原本“通云哥”体系中的“通”(通义实验室)进一步放大,涵盖了AI在B端和C端的全面布局,使基座模型能力能够贯穿所有业务板块,并在不同用户和场景中释放 [6] 市场趋势与战略判断 - 公司高层判断,AI Coding能力已在过去两三个月跨越临界点,大部分应用系统可通过模型解决,未来云计算产品的用户将从人类工程师逐渐转变为AI Agent [8] - 由于大量“AI员工”将成为工作主力,其必需的“粮食”——Token将进入需求大爆炸时期,这是一个关键的市场机会 [10] - 未来云和AI产品的用户将不再局限于企业级客户和专业开发者,更多的小B客户和超级个体将成为使用者,公司需要为此提供相应的AI产品 [13] 整合动因与行业对标 - “Token热”是促成ATH成立的重要诱因,春节期间阿里云Coding Plan的Tokens销量成为公司史上增长最快的产品,甚至因过于火爆而调整了首购优惠策略,凸显了Token需求向生产力端快速转移的趋势 [7] - 公司此次整合的思路,与2023年谷歌合并Google Brain和DeepMind成立Google DeepMind的举措有相似之处,都是为了强化内部协同、减少资源内耗以应对激烈竞争 [12][15] - 与谷歌基于“AI研发、产品统一”维度的合并不同,阿里的整合思路是基于Token的“生命周期链路”,更侧重于AI的“可使用”性和工业化生态的构建 [15] Token链路的业务逻辑 - 在ATH的新架构下,Token的完整链路被清晰地拆分为三个关键阶段:创造、输送和应用,分别对应不同的业务部门 [10][14] - “创造Token”对应通义实验室,主要负责贡献基座模型能力;“输送Token”对应百炼MaaS平台,负责将模型能力以多种产品形态输送给企业级用户;“应用Token”对应千问、悟空及创新应用等部门,负责在细分用户和场景中开发具体应用 [14] - 这一体系旨在形成一个有机联动的工业生产式体系,在最上游以Qwen的基座模型能力为基础生产要素,在下游通过不同形态的产品释放能力,在此过程中Token被持续产生和消耗,形成完整生态 [11]
电力设备行业周报:Token调用激增,风电出海补位欧洲能源缺口
华鑫证券· 2026-03-16 16:24
行业投资评级 - 对电力设备板块维持“推荐”评级 [7][22] 核心观点 - AI Agent应用(如OpenClaw)爆发式增长,推动Token调用量激增,标志着AI产业从“单轮推理”进入“多轮自动化推理”阶段,显著提升算力需求,并形成“应用增长-Token需求提升-算力扩张-IDC建设-电力基础设施升级”的产业传导路径 [5][6][15][17][18] - AI推理算力需求增长将带动AI服务器、国产算力产业链、高功率密度AIDC建设以及变压器、UPS、电源及储能等电力设备需求 [6][18] - 英国取消33项风电组件进口关税(如叶片、电缆税率由6%、2%降至0),叠加AR7拍卖落地8.4GW海风项目,预计释放约220亿英镑投资,加速北海海风建设 [6][19][20] - 欧洲能源转型压力下海风装机有望持续提速,本土供应链偏紧将提升设备进口需求,中国风电产业链凭借成本与交付优势,设备出海空间进一步打开 [6][20][21] - 报告建议重点关注国产算力、IDC/AIDC、相关电力设备行业的中长期投资机会,以及风电产业链中的大金重工、天顺风能、金风科技、中际联合、振江股份等公司 [6][7][21] 根据相关目录分别进行总结 1. 投资观点:OpenClaw催化AI Agent生态下Token调用激增,风电出海补位欧洲能源缺口 - **AI Agent生态与Token调用**:OpenClaw当月(截至3月15日)累计调用量达10.4T tokens,当周调用量3.14T tokens,环比增长30% [5][15]。应用榜单前三均为中国模型(Step 3.5 Flash、Kimi K2.5与MiniMax M2.5),其中Step 3.5 Flash近30天Token调用量跃居全球第一 [5][16] - **产业影响**:AI Agent通过多轮自动化推理,使单次任务Token消耗显著高于传统Chatbot,推动算力需求指数级增长 [6][17]。产业链传导将利好国产算力、AI服务器、高功率密度AIDC及配套电力设备 [6][18] - **风电出海机遇**:英国关税取消及AR7拍卖8.4GW项目,预计释放220亿英镑投资,加速北海海风建设 [6][19][20]。欧洲风能协会预计,2026-2030年欧洲将新增高达34GW海上风电装机至73GW,年复合增长率约13% [20] - **投资建议**:看好中国风电产业链出海,建议关注大金重工、天顺风能、金风科技、中际联合、振江股份等公司 [7][21] 2. 行业动态 - **光伏行业**:通威股份披露重组预案,拟收购青海丽豪清能100%股权以提升高纯晶硅市场份额 [24]。晶科能源在澳大利亚签约2GW飞虎3组件订单,其澳大利亚市场份额达26% [25] - **电力设备行业**:东北松辽清洁能源基地送电华北工程计划2026年核准,2029年投产;内蒙古电力集团与国家电网签署1000千伏交流输变电工程建设管理委托协议 [26] - **AI行业**:AI服务器对HBM需求激增导致普通DRAM和NAND供应减少,部分DRAM芯片现货价格过去一年上涨近700%,成本压力蔓延至消费电子产品 [27]。字节豆包内测购物功能,DAU在央视春晚期间达1.45亿 [28] - **机器人行业**:中国家用电器协会成立家用服务机器人专委会并发布产业发展白皮书;京东发布“智能机器人产业加速2.0计划”,目标助力品牌在2026年实现累计百亿元营收 [29][30] 3. 光伏产业链跟踪:上游价格再度下行,下游报价缺乏支撑 - **硅料**:价格持续下行,成交执行价格区间下滑至45-50元人民币/公斤,买方压价接近40元人民币/公斤,库存达历史新高 [31] - **硅片**:价格延续下行但幅度有限,183N成交价普遍为每片1.05元人民币,210N成交价每片1.30-1.40元人民币,库存仍处高位 [32] - **电池片**:N型电池片价格稳中有降,183N均价持平于每瓦0.42元人民币,210RN与210N均价分别降至每瓦0.42元与0.41元人民币 [33]。海外电池片价格部分下降,183N中国出口均价降至每瓦0.057美元 [34] - **组件**:国内TOPCon组件集中式成交价每瓦0.68-0.70元人民币,分布式每瓦0.76-0.83元人民币;海外TOPCon组件均价每瓦0.096美元 [35]。近期价格上涨主要受银价上涨推动,而非终端需求实质性改善 [36] - **辅材价格**:本周EVA粒子价格上涨9.3%,背板PET价格上涨14.5%,边框铝材价格上涨4.5%,电缆电解铜价格下降0.9%,支架热卷价格上涨0.2%,光伏玻璃价格持平 [39][40][41] 4. 上周市场表现:电力设备板块涨幅4.55%,排名第1名 - 电力设备板块上周涨幅4.55%,在28个申万一级行业中排名第1,跑赢上证综指5.25个百分点,跑赢沪深300指数4.36个百分点 [43] - 成分股中周涨幅前五为:通裕重工(+28.35%)、鹏辉能源(+21.99%)、璞泰来(+21.80%)、南网科技(+20.89%)、吉鑫科技(+20.28%);跌幅前五为:红相股份(-12.48%)、东方电气(-13.16%)、华明装备(-13.93%)、安靠智电(-13.99%)、科泰电源(-14.73%) [45][46] 5. 储能市场数据跟踪 - 2025年中国储能一级市场融资事件175起,同比增长16%;145家企业完成融资,吸引资金约211亿元 [49] - 融资轮次呈现早期项目活跃、成长期融资升温格局:A轮占比30%,B轮占比19%,天使轮占比18%,Pre-A轮占比8% [50] - 2025年有14家企业估值突破15亿元,固态电池、硅碳负极等技术赛道估值突出 [50] - IPO方面,截至2026年1月底,已有25家储能和新能源企业登陆港股与A股,港股成为资本运作主引擎 [49]