AI推理时代
搜索文档
亚马逊(AMZN):云计算进入AI推理时代,AWS有望后发先至
申万宏源证券· 2026-03-23 19:09
投资评级与估值 - 首次覆盖亚马逊,给予“买入”评级,目标股价271.5美元 [1][5] - 采用分部估值法,目标总市值29149亿美元,其中:北美业务给予2026年20倍市值/EBIT估值(7182亿美元),国际业务给予2026年3倍PS估值(5490亿美元),AWS业务给予2026年10倍PS估值(16477亿美元) [5][10][11] 核心观点与行业趋势 - 云计算行业正从AI训练时代迈入AI推理时代,价值重心有望从硬件环节向云厂商迁移 [5] - 当前AI算力环节获取了产业链大部分价值,例如英伟达营收从FY23的269.7亿美元增长至FY26的2159.4亿美元,而同期三大云厂商(AWS、谷歌云、微软智能云)的公有云业务营收总和仅增长1043.5亿美元 [5][27] - 推理时代对算力性价比、网络稳定性和云生态丰富度要求更高,看好拥有自研芯片能力、丰富企业客户积累及全栈AI技术能力的传统云巨头(AWS、Azure、Google Cloud)重获竞争优势 [5][24] - 2025年以来北美云厂商资本开支大幅抬升,市场关注焦点已从投入规模转向投资回报率(ROI) [5][39] 亚马逊AWS业务竞争力 - **自研芯片与网络优势**:AWS通过自研Trainium系列AI芯片和EFA(弹性网络适配器)网络架构,在推理时代的算力性价比和网络稳定性上逐渐体现优势 [5][7][54] - **战略合作绑定核心客户**:亚马逊是AI公司Anthropic的最大单一股东(截至25Q4持股价值606亿美元),并与OpenAI达成战略合作,获得其算力订单与芯片迭代合作 [5][73][74] - **关键客户贡献增长**:预计Anthropic对AWS的营收贡献将从2025年的1.9%提升至2028年的8.0%,OpenAI也将在FY26开始对AWS形成贡献 [5][80] - **AI云业务高速增长**:预计AWS营收在2026-2028年将保持28.0%、27.0%、26.0%的高速增长,其中AI云业务占比将从2026年的15.6%提升至2028年的31.2% [12][47] - **盈利能力改善**:自研芯片有望优化成本结构,提升云服务利润率,预计AWS营业利润率在2026-2028年分别为34.5%、35.0%、35.5% [12][47] 亚马逊电商与零售业务 - **物流体系护城河稳固**:已完成物流网络区域化重构,履约费用率进入平稳区间,盈利质量逐步改善 [5][88] - **AI重构流量入口**:公司正将AI能力深度整合至Alexa+和Rufus等助手,依托Anthropic的Claude模型能力,有望演进为下一代AI电商核心入口,强化用户粘性与转化效率 [5][9][97] - **业务结构健康**:第三方(3P)平台业务已成为核心营收来源,2025年营收达1722亿美元,高毛利的广告业务占比提升驱动利润率改善 [5][85][91] 财务预测与关键假设 - **整体营收与利润**:预计公司营业收入将从2025年的7169.2亿美元增长至2028年的10341.8亿美元,年复合增长率约13% [2] - **净利润增长**:预计GAAP净利润将从2025年的776.7亿美元增长至2028年的1362.5亿美元 [2] - **各业务增长假设**: - AWS业务:2026-2028年营收增速假设为28.0%、27.0%、26.0% [12] - 1P自营业务:2026-2028年营收增速假设为9.0%、9.0%、9.0% [12] - 3P平台业务:2026-2028年营收增速假设为8.0%、9.0%、9.0% [12] - 广告业务:2026-2028年营收增速假设为16%、15%、13% [12] 资本开支与投资回报 - **行业Capex高增**:预计谷歌、微软、亚马逊、META、Oracle在FY26的资本开支总和将接近7000亿美元,同比增长73% [36] - **亚马逊Capex指引**:公司上调2026年Capex指引至2000亿美元,Capex与经营性现金流比率预计达到110% [36] - **关注AI云ROI**:市场对高资本开支的投资回报率担忧加剧,预计随着Anthropic、OpenAI等客户工作负载部署及自研芯片成本优化,AWS的AI云业务资本密集度(Capex/营收)有望持续改善 [46][49]
7位专家拆解GTC,结论让英伟达难堪
雷峰网· 2026-03-19 08:41
英伟达GTC 2026核心叙事转变 - 英伟达在GTC 2026上宣布AI正从“模型训练时代”加速迈入“模型推理时代”,整个AI技术栈的组织方式被重新定义 [7] - 叙事重心从“更强的GPU”转向“如何组织算力”,数据中心被重新定义为生产Token的“AI工厂”,衡量标准从单卡性能转向Token产出效率(Tokens/W)[3][4][17] - 公司推出包括Vera Rubin平台、LPX推理机架及Feynman架构在内的新叙事,从单一GPU主导转向多处理器协同的“AI工厂” [3][7] 推理时代硬件架构的演变 - 英伟达承认GPU并非推理最优解,推出专用推理处理器LPU,标志着AI基础设施从通用走向分工 [3][8] - 在Transformer推理中,Prefill、Decode、Orchestration三个阶段开始由不同硬件承担,LPX专门优化Decode阶段 [9] - GPU依然是训练和复杂推理(如视频生成)的最优解,而LPU等专用架构在低延迟、轻算力推理场景显示出优势,未来数据中心将是多元处理器各安其位的图景 [9][12] - 公司推出Vera CPU,其核心是掌握AI工厂内部的算力编排权,而非直接与x86竞争,短期内对x86格局冲击有限 [13] LPU的定位与市场影响 - LPU的推出是英伟达对GPU在推理场景非最优解的承认,但公司仍将LPU与GPU捆绑组合,以维持生态延续 [8] - LPU短期内难以成为主力,其经济性存疑:单芯片集成500MB片上SRAM,而SRAM价格是HBM的6-8倍,会抬高成本,且受工具链融合滞后影响 [10][11] - 头部云厂商的推理需求将坚定走向自研ASIC路线,英伟达的GPU+LPU方案重点客户可能是中小互联网客户 [8] - CPX(负责Prefill阶段)在发布会上未被提及,出乎部分行业人士意料 [12] Token经济与万亿美元营收愿景 - 黄仁勋认为Token已成为AI时代的硬通货,并宣称英伟达的Token成本全球最低 [17] - 公司预测到2027年,仅Blackwell和Vera Rubin两条产品线的AI芯片营收将至少达到1万亿美元,相比去年预测翻倍,原因是“过去两年计算需求增长了一百万倍” [18] - 若叠加CPU、Groq、存储及网络设备,总规模或将达到1.25万亿美元 [18] - 行业竞争的核心正转向Token的生产、计量与分配主导权,如同电力时代的电网,AI时代正围绕Token形成全新产业生态 [20][22] - 推理环节才是算力消耗的主力,需持续生成Token,Token的成本高低直接决定AI的普及程度 [22] 系统级竞争与生态闭环 - 英伟达的竞争护城河正从“算力垄断”转向“生态闭环”,通过绑定上下游构建垂直整合的产业链控制力 [21] - 算力竞争的度量体系正在从芯片峰值参数走向端到端系统能效(Tokens/W),英伟达在系统级优化上具有优势 [19] - 公司正以Vera CPU、Rubin GPU、NVLink 6、Spectrum-X交换机等“全家桶”组合重构系统解决方案,叙事重心从单颗芯片转向系统级交付 [26] - 英伟达尝试构建包括台积电、美光、三星等在内的联盟,以锁定先进封装与存储资源 [26] 互连技术与CPO的挑战 - 英伟达在Vera Rubin平台部署第六代NVLink,并推出全球首个CPO(光电共封装)Spectrum-X以太网交换机,目前已进入量产阶段 [25] - CPO的推广面临挑战:维护便利性及成本较高、核心芯片良率偏低导致系统成本高、在短距离内铜互联比光互联更有优势 [27] - 技术的庞杂产品矩阵与“加法”生态,被部分观点认为是对手(如谷歌简洁ASIC架构)用“减法”定义下一代基础设施时的包袱 [26] - 随着Scaling Law对带宽需求的极致放大,铜与光的界限在发生改变,光互联替代铜互联是明确方向,但尚需时日 [28] 智能体(Agent)与AaaS时代 - 英伟达将OpenClaw定位为定义“智能体计算机”的下一代操作系统,重要性类比Linux之于服务器 [32] - 黄仁勋判断未来绝大多数SaaS都将演变为AaaS(智能体即服务),“你的OpenClaw战略是什么?”将成为科技公司的核心命题 [32] - AI智能体对当前SaaS业态带来冲击,按席位订阅的商业模式逐步失效,企业必须走向AI化,打造和运营自主智能体 [33] - Token分层定价将成为AI时代商业模式的自然演进,实现成本与价值的精准匹配 [33] - OpenClaw是以CPU为主的控制与编排系统,外接GPU推理后端,因此Agent越流行,CPU的总需求就越高 [35] - 未来数据中心的基础设施衡量标准将从比拼“模型能力”转向“同等投资下可支撑的持续在线Agent数量”,推动从单一GPU算力转向GPU+CPU双芯驱动 [35]
杨斌:确定token的中文译名,已经迫在眉睫了
腾讯研究院· 2026-03-18 17:03
文章核心观点 - 文章认为,在AI推理时代,**“模元”** 作为token的专属中文译名至关重要,它不仅是英伟达2026年GTC大会演讲的核心锚点,更是理解与重构AI产业经济逻辑的基石 文章核心是论证并推广“模元”这一译名,以打破专业与大众间的认知壁垒,推动AI技术在中国千行百业的普及与应用[2][3][5] 根据相关目录分别进行总结 AI产业的新度量衡与经济逻辑 - 英伟达在2026年GTC大会上宣告,AI产业进入以**“模元”** 为核心的新阶段,传统数据中心正转型为生产模元的智能工厂[2][3] - **模元** 被定义为AI时代的基础度量衡,兼具信息单位、算力单位和货币单位三重属性,是AI思考的最小单元和算力消耗核算基准[3][4] - 全球大模型日均模元消耗已达**30万亿**级别,中国模型调用量占比超过**60%**,首次超越美国,模元已成为衡量智能经济规模与活力的核心指标[4] - 企业的核心竞争力取决于**固定功耗下的模元每秒吞吐量**和**单位模元成本**,模元经济学正在重塑全球AI产业的运行规则[3][4] “模元”译名的必要性与紧迫性 - 当前AI行业普遍直接使用英文“token”,缺乏统一中文表述,这为专业圈层外的公众及传统行业从业者带来了认知隔阂[5] - 当“token”成为万亿级产业的核心标尺,其中文定名关乎产业共识形成、技术普惠落地与公众认知普及,从学术探讨变为实践刚需[5] - 文章提出,一个精准适配、通俗易懂的中文译名是AI从专业圈层走向全民“众技”的关键纽带[3][5] “模元”译名的词源依据与优势 - 从词源看,token本义为“可被识别、承载特定信息或功能的基本单元”,在AI时代已从语言学单元跃升为AI模型可计算、可处理的**最小通用单元**,取代了“字节”的地位[6] - 与“字节”作为物理存储单位不同,**模元是智能逻辑单元**,承载全模态信息,并关联模型理解、推理计算与价值创造,标志着计算文明从“数据处理”走向“智能涌现”[6] - 相比“词元”、“语元”、“义节”等旧译名,“模元”译法更具优势:“模”指向大模型与多模态,“元”代表最小基本单元,承续了“字节”等经典中文度量单位的命名逻辑[7] - 该译名具备三大优势:对大众友好易懂、对产业实用(可直接衍生“模元消耗量”、“模元成本”等核心指标)、对未来兼容(适配智能体、多模态、物理AI等全场景)[8][9] “模元”译名的产业与社会价值 - 使用“模元”一词能使产业逻辑表达更清晰:从业者视其为AI生产的基础原料,投资者视模元效率为降本增效关键,公众则能将其理解为AI时代的“字节”[9] - 推广“模元”这一有词源、有内涵、有延伸性的中文译名,旨在为中国AI的高普及率搭建语言桥梁,让更多人无需跨越语言门槛即可探索AI时代的基本规律[9][10] - 文章呼吁在学术、产业、政策与媒体讨论中采纳并使用“模元”,共同推动其成为理解与参与AI时代的日常用语[10]
中国资产大爆发,2026年A股能否迎来“开门红”?高手看好贵金属、人形机器人等行业
搜狐财经· 2026-01-04 16:01
中国资产市场表现与投资主线 - 元旦节期间中国资产表现强劲,恒生指数涨2.76%,恒生科技指数涨4%,纳斯达克中国金龙指数大涨4.38% [1] - 市场关注2026年A股能否迎来“开门红”及年初行情主线 [1] 业绩预告与高增长公司 - A股公司2025年年度业绩预告拉开序幕,12家公司预告净利润增长上限超过50% [3] - 传化智联预告净利润约5.4亿元至7亿元,增长256.07%至361.57% [4] - 百奥赛图预告净利润约1.35亿元,增长303.57% [4] - 天赐材料预告净利润约11亿元至16亿元,增长127.31%至230.63% [4] - 光库科技预告净利润约1.69亿元至1.82亿元,增长152%至172% [4] - 首钢股份预告净利润约9.2亿元至10.6亿元,增长95.29%至125.01% [4] - 盐湖股份预告净利润约82.9亿元至88.9亿元,增长77.78%至90.65% [4] - 孩子王预告净利润约2.75亿元至3.3亿元,增长51.72%至82.06% [4] - 强一股份预告净利润约3.55亿元至4.2亿元,增长52.3%至80.18% [4] - 紫金矿业预告净利润约510亿元至520亿元,增长59%至62% [4] - 锡华科技预告净利润约2.04亿元至2.17亿元,增长43.89%至52.61% [4] - 三花智控预告净利润约38.74亿元至46.49亿元,增长25%至50% [4] 行业景气周期与驱动因素 - 业绩预喜公司反映出碳酸锂、有色金属、黄金白银等行业处于景气周期中 [5] - 2025年下半年广期所碳酸锂期货价格涨幅翻倍,盐湖提锂因成本优势受关注 [6] - 市场观点认为若美联储下半年开始大幅降息,将利好有色金属、黄金白银等行业 [6] 科技展会与产业趋势 - 2026年国际消费电子展(CES 2026)将于1月6日至9日举行,涉及AI、自动驾驶、人形机器人、AI眼镜等领域 [3][6] - 英伟达、苹果、Meta等科技巨头将参展,元旦节前A股人形机器人板块已有所启动 [6] - AI叙事正从训练时代迈入推理时代,谷歌TPU芯片正在撼动英伟达GPU芯片的长期统治 [6] - 谷歌TPU芯片因实现降本增效构成竞争,英伟达支付约200亿美元获得初创公司Groq技术授权并聘用其核心团队 [6] - SRAM存储芯片在内存带宽和访问速度上远超HBM,前景值得研究 [6] 地缘局势与板块影响 - 市场担忧地缘局势升温,委内瑞拉局势引发广泛关注 [3][6] - 参赛高手认为地缘局势可能刺激军工、黄金板块 [6] 市场走势观点 - 目前大盘处于震荡蓄势之中,一些参赛高手认为春节前A股大概率有一波上攻行情 [6] - 后市大盘一旦放量拉升,将被视为新的启动信号 [6]
盘前下跌超3%!英伟达遭史上最强阻击?谷歌TPU获Meta数十亿美元洽购!深度重磅拆解:性能硬刚Blackwell、能效怼GPU
美股IPO· 2025-11-25 18:17
文章核心观点 - 谷歌自研TPU的核心价值在于通过掌控全栈设计绕开“英伟达税”,从而显著提升AI业务的利润率,并为AI推理时代构建强大护城河 [1][17][18] - 谷歌TPU v7在算力、显存和能效比等关键性能指标上实现代际跨越,足以与英伟达最新Blackwell架构芯片处于同一竞争梯队 [14][15][16][20] - TPU获得Meta数十亿美元规模的洽购,表明其市场竞争力已对英伟达构成实质性威胁 [3][4] TPU的发展背景与战略意义 - TPU的研发缘起于2013年,是为应对语音搜索等AI业务算力需求激增导致的财务和物流成本噩梦而进行的“生存自救” [6] - 项目从设计概念到数据中心部署仅用15个月,2015年已默默支撑谷歌地图、照片和翻译等核心业务 [7][8] - 公司并非将TPU视为“备胎”,而是为AI推理时代构建一道几乎不可逾越的护城河的关键战略 [5] TPU的技术架构优势 - TPU采用极简主义的“脉动阵列”架构,剥离了GPU中为图形处理设计的无关硬件,使数据能像血液一样流动,大幅减少对HBM的读写次数 [10][11] - 这种设计有效规避了“冯·诺依曼瓶颈”,让芯片将更多时间用于计算而非等待数据,从而在“每焦耳运算量”上拥有碾压级优势 [11][12] - 在互联技术上使用光路交换机和3D环面网络,相比英伟达的InfiniBand,极其节省成本和功耗 [16] TPU v7 (Ironwood) 的性能突破 - 算力实现数量级提升:BF16算力高达4,614 TFLOPS,远超上一代TPU v5p的459 TFLOPS [15] - 显存容量对标英伟达B200:单芯片HBM容量达到192GB,内存带宽飙升至7,370 GB/s,远超v5p的2,765 GB/s [16] - 能效比显著优化:v7的每瓦性能比v6e提升了100%,针对特定应用能提供比GPU高出1.4倍的每美元性能,处理动态模型训练时速度可达GPU的5倍 [16] TPU对商业模式和行业格局的影响 - 自研ASIC是云厂商逃离“英伟达税”、重回高毛利时代的唯一解药,可避免AI业务毛利从传统的50-70%骤降至20-35% [17][18] - 谷歌通过全栈设计掌控(前端RTL自行设计,Broadcom仅负责后端物理实现),并利用Broadcom远低于英伟达的毛利,将算力成本压到极致 [1][18] - 随着AI工作负载从训练向推理转移,CUDA生态系统的重要性在降低,TPU的性价比优势(成本可降至原五分之一)日益凸显 [19][20]