Workflow
AI五层蛋糕理论
icon
搜索文档
英伟达塑造“Token经济学”
21世纪经济报道· 2026-03-18 07:10
Vera Rubin平台与芯片发布 - 公司宣布Vera Rubin平台开启Agentic AI新时代,旨在构建全球最大的AI工厂,该平台包含七款已全面投入生产的新芯片[1][14] - 七款芯片包括:NVIDIA Vera CPU(服务器CPU)、NVIDIA Rubin GPU、NVIDIA NVLink 6(第六代交换机芯片)、NVIDIA ConnectX-9 SuperNIC(超级网卡)、NVIDIA BlueField-4 DPU(存储芯片)、NVIDIA Spectrum-6(支持CPO技术的以太网交换机芯片)以及新集成的NVIDIA Groq 3 LPU[1][15] - 这些芯片能够组成五种机架在数据中心运行,标志着公司从单一芯片竞争进入全方位的系统级竞赛阶段[1][16] 技术规格与性能突破 - Rubin架构计划于2026年下半年量产,采用台积电3nm工艺,Vera CPU(88核自研架构)与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成[4][18] - 采用“去PCIe化”紧耦合设计,单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,规模化推理能效较Blackwell提升5倍[4][18] - 平台为Agentic AI与长上下文推理设计,引入Transformer Engine 3.0等技术,使AI能处理数万个Token的上下文,单机柜NVL72内部互联总带宽达260 TB/s[5][19] - Vera CPU机架集成256个Vera CPU,基于MGX液冷基础设施,其效率是传统CPU的两倍,速度提升50%[5][19] 市场预测与客户进展 - 公司CEO预测,Blackwell与Rubin的AI芯片到2027年底的收入将达到1万亿美元,较去年10月的5000亿美元预测翻倍[2][15] - 已确认合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure、CoreWeave、Lambda、Nebius和Nscale,芯片已全面投产并将于今年下半年供货[6][20] Groq LPU与混合算力战略 - 公司通过200亿美元战略授权并集成Groq LPU架构,新推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s扩展带宽[6][21] - LPU采用确定性流水线架构,消除计算抖动,专为Agentic AI与实时交互设计,能保证毫秒级任务的执行时间恒定,将复杂Agent链条的思考时间从数分钟缩短至数秒[9][22] - 公司构建混合算力帝国:GPU负责万亿参数模型训练与长文本预处理,LPU阵列以10倍于对手的能效比统治实时推理市场,实现训练与推理分离[10][23] 软件、模型与生态系统建设 - 面向OpenClaw社区推出NemoClaw软件栈,提供基础软件能力,支持通过一条命令安装Nemotron模型和OpenShell运行时环境,为AI代理增加安全与隐私控制[11][23] - NemoClaw支持本地与云端模型混合调用,可运行于GeForce RTX设备、RTX PRO工作站及DGX系统,为全天候AI代理提供算力[12][24] - 宣布成立Nemotron联盟,联合全球AI实验室推进开放前沿模型发展,并扩展Nemotron 3系列多模态模型,包括Ultra、Omni和VoiceChat等版本[12][24] - 发布应用于物理世界的新模型,包括面向类人机器人的Isaac GR00T N1.7模型、面向自动驾驶的Alpamayo 1.5模型,以及即将推出的统一世界基础模型Cosmos 3[13][25] 行业趋势与战略定位 - 公司CEO强调“Token”是AI时代的新货币,AI工厂是生成Token的基础设施,公司通过Vera Rubin DSX AI Factory参考设计和Omniverse数字孪生蓝图提供构建最高生产力AI工厂的基础[6][20] - 行业趋势显示,巨头正通过聚集能力、补齐短板、延伸上下游来构建强大壁垒,单一比拼芯片性能的阶段已过去,系统级竞赛正在上演[2][16]
黄仁勋塑造“Token经济学” 英伟达拥抱智能体时代
21世纪经济报道· 2026-03-18 06:29
英伟达GTC大会核心发布 - 公司宣布其最新芯片架构Vera Rubin平台已全面投入生产,该平台包含七款新芯片和五种机架,旨在开启Agentic AI新时代并构建全球最大的AI工厂 [1] - 公司创始人预测,基于Blackwell与Rubin架构的AI芯片,到2027年底的收入将达到1万亿美元,较去年10月的5000亿美元预测翻倍 [2] - 发布会标志着行业竞争从单一芯片性能比拼进入全方位的系统级竞赛阶段 [2] Vera Rubin平台技术革新 - Rubin架构计划于2026年下半年量产,采用台积电3nm工艺,其Vera CPU与Rubin GPU通过1.8 TB/s的NVLink-C2C技术实现同封装集成,是“去PCIe化”的紧耦合设计 [2] - 单GPU在NVFP4精度下的推理算力增至50 PFlops,训练算力达35 PFlops,规模化推理能效较Blackwell提升5倍 [3] - 平台引入Transformer Engine 3.0与Inference Context Memory存储平台,并配备支持硅光子技术的Spectrum-X网络,单机柜NVL72内部互联总带宽达260 TB/s [3] 新芯片产品组合 - 七款新芯片包括:NVIDIA Vera CPU、NVIDIA Rubin GPU、NVIDIA NVLink 6、NVIDIA ConnectX-9 SuperNIC、NVIDIA BlueField-4 DPU、NVIDIA Spectrum-6以及新集成的NVIDIA Groq 3 LPU [1] - Vera CPU机架集成256个Vera CPU,其效率是传统CPU的两倍,速度提升50% [4] - 与公司合作部署Vera CPU的客户包括阿里巴巴、字节跳动、Meta、Oracle Cloud Infrastructure等,该产品已全面投产并将于今年下半年供货 [4] Groq LPU推理芯片战略 - 公司通过200亿美元战略授权并深度集成Groq LPU架构,新推出的Groq 3 LPX机架包含256个LPU处理器,具有128GB片上SRAM和640 TB/s扩展带宽 [5] - LPU采用确定性流水线架构,旨在实现极低延迟和确定性算力,专为实时交互场景设计,如自动驾驶和高频交易 [6] - LPU与GPU通过NVFusion技术协同,构建混合算力帝国:GPU负责训练,LPU负责高效实时推理,能效比号称可达对手的10倍 [7] AI代理与软件生态进展 - 公司推出面向OpenClaw社区的NemoClaw软件栈,提供基础软件能力,支持通过一条命令安装模型和OpenShell运行时环境,并增强安全与隐私控制 [8] - NemoClaw支持本地模型与云端模型的混合调用,可运行在多种计算平台上,为全天候运行的AI代理提供算力 [9][10] - 公司宣布成立Nemotron联盟,联合全球AI实验室共同推进开放前沿模型发展,并扩展了Nemotron 3系列多模态模型 [10] 物理智能与行业应用扩展 - 公司发布用于机器人和自动驾驶的新模型,包括面向类人机器人的NVIDIA Isaac GR00T N1.7模型和面向自动驾驶的NVIDIA Alpamayo 1.5模型 [11] - 即将推出的NVIDIA Cosmos 3被称为首个统一“世界生成、物理推理和行动仿真”的世界基础模型 [11] - 公司正搭建一个覆盖数字世界与物理世界的AI技术体系,推动人工智能在机器人、自动驾驶等领域的创新与落地 [11]
霍尼韦尔(HON.US)佐证物理AI加速增长:建筑领域广泛应用,正重塑全球20万场所
智通财经网· 2026-01-27 17:17
核心观点 - 人工智能正从数字领域走向物理世界,被用于提升建筑、工厂等实体场所的运营效率与生产力,其大规模应用阶段正在开启 [1] - 行业领袖提出“物理AI”概念,并认为其“ChatGPT时刻”已经到来,意味着机器开始具备理解、推理并作用于现实世界的能力 [1] 行业趋势与应用 - 所谓的“物理AI”在2025年从试点项目发展到广泛应用,全球有超过20万个场所部署了此类工具 [1] - “物理AI”的应用场景包括配置汽车工厂的工作流程、决定建筑物在不同时间段的能源使用等,旨在提升能源效率、安全保障和人员生产力 [1] - 每栋建筑都存在提升能源效率、加强安全保障和提高生产力的需求,这是“物理AI”发展的核心驱动力 [1] 供应链战略调整 - 新冠疫情促使企业重新审视供应链,推动其建立能够在本地生态系统中运作的体系,以增强韧性 [1] - 世界贸易秩序正在转变,从标准的全球供应链转向更多双边贸易 [1] - 霍尼韦尔公司利用疫情期间的经验,已构建能够承受双边关系变化和关税冲击的供应链 [1] 技术发展框架 - 英伟达首席执行官提出了AI“五层蛋糕”理论,自下而上分别为:能源、芯片与计算基础设施、云数据中心、AI模型以及最上层的应用层 [1] - 该框架明确了支撑AI,特别是“物理AI”发展的底层技术栈和基础设施层级 [1]
早报 | 浙江一地取消中考选拔功能;贾国龙回归一线,不再打造个人IP;春节AI大战百度腾讯狂“撒钱”;伊武装力量已进入全面戒备状态
虎嗅APP· 2026-01-26 08:15
地缘政治与安全 - 伊朗武装力量已进入全面戒备状态 并警告若遭侵犯将发起猛烈反击 打击范围涵盖霍尔木兹海峡到美国在地区内的所有利益网 [2] 人工智能与科技行业动态 - 百度宣布自1月26日至3月12日 用户在百度APP使用文心助手可瓜分5亿现金红包 最高奖励1万元 并成为《2026北京广播电视台春节联欢晚会》首席AI合作伙伴 [3] - 腾讯宣布将于2月1日上线春节活动 用户在元宝APP可分10亿现金红包 单个红包金额可达万元 [3] - 中央广播电视总台官宣银河通用机器人成为2026年春晚指定具身大模型机器人 该公司成立于2023年5月 业务覆盖零售、工业、医疗、文旅等领域 [4] - 英伟达创始人黄仁勋2026年首次来华 将到访上海、北京、深圳等地 目前已抵达北京 [12] - 特斯拉CEO埃隆·马斯克预言真正的通用人工智能(AGI)将在2026年实现 并指出未来三到七年白领工作将首当其冲被AI替代 能源将取代美元成为硬通货 [27] - 英伟达CEO黄仁勋在达沃斯论坛阐述AI产业“五层蛋糕理论” 预测未来几年AI基础设施将需要数万亿美元的额外投资 并创造大量高薪蓝领工作岗位 [28] - 中国信息通信研究院将于1月26日召开“星算·智联”太空算力研讨会 发布“算力星网”联合推进倡议 启动《太空算力发展前瞻研究报告(2026年)》编制工作 [25] 金融市场与监管 - 《每日经济新闻》调查曝光“陈小群”概念股炒作利益链 指出同花顺、东方财富等平台通过算法将中国银河证券大连黄河路营业部锚定为“陈小群”席位 本质是“交易软件+券商”龙虎榜信息造神 游资借此收割散户 [5][6] - 上海证监局对浙江瑞丰达及关联8家私募作出行政处罚 合计罚没超4100万元 创私募领域处罚金额新纪录 实际控制人孙伟被终身禁止进入证券市场 [14][15] 消费与餐饮行业 - 西贝餐饮集团创始人贾国龙表示将回归一线、聚焦主业 不再打造个人IP [8] - 贾国龙预计2025年9月至2026年3月 西贝累计亏损将超6亿元 将在一季度陆续关闭全国102家门店 占门店总数的30% [8] 半导体与存储市场 - 韩国媒体报道三星电子在第一季度将NAND闪存供应价格上调了100%以上 远超市场预期 [11] - Wind存储器指数自2025年6月底至今涨幅已超过100% [11] 教育政策 - 浙江省舟山市嵊泗县取消中考选拔功能 实现普高“全员直升” 相关做法入选浙江省委改革办重大改革周报 [9][10] 公共卫生事件 - 印度西孟加拉邦暴发尼帕病毒疫情 该病毒可人传人 死亡率在40%到75%之间 目前尚无专门疫苗和有效疗法 [7] 公司回应与声明 - 新东方创始人俞敏洪回应被称为“老登” 表示自己不敢过多教育年轻一代 并提及新东方文旅面向全年龄段 近期成立了新东方退休俱乐部 [16] - 抖音回应演员孙涛被网暴传闻 已下架8000余条不实视频 封禁首发账号 清理6万余条评论 并对孙涛账号启动保护机制 处置17万条负向内容 [19] 其他行业信息 - 国务院新闻办公室将于2026年1月26日举行新闻发布会 商务部副部长鄢东将介绍2025年商务工作及运行情况 [24] - 美国财长贝森特证实 美国总统特朗普可能最早在1月26日当周宣布新任美联储主席人选 目前有四位候选人 [26]
黄仁勋最新对话:几千亿只是开胃菜,AI基建还得再砸几万亿
创业邦· 2026-01-22 18:19
文章核心观点 - 英伟达首席执行官黄仁勋认为,当前的人工智能热潮并非泡沫,而是人类历史上最大规模的基础设施建设浪潮,已投入的数千亿美元仅是开始,未来还需数万亿美元投资以构建完整的AI基础设施体系 [5][11][13] - AI的发展被比喻为一个“五层蛋糕”,从底层到顶层依次为:能源、芯片与计算设备、云设施与服务、AI模型、实际应用,每一层都需要巨额投资和建设 [5][11][13] - AI技术正在创造大量高薪蓝领工作岗位,并提升高端服务业从业者的效率与价值,而非简单地取代人类工作 [7][18][19] - 每个国家都应发展自己的“AI主权”,将其视为像电网和公路一样的关键基础设施,这对于发展中国家是跨越技术鸿沟的机会,对欧洲则是利用其强大工业基础直接拥抱“物理AI”和机器人技术的机遇 [8][26][28] - AI技术本身在过去一年取得了从“聊天”到“办事”、开源模型普及以及“物理智能”觉醒三大关键突破,这为万亿美元基建投资提供了根本动力 [16][17][44] AI基础设施的规模与投资 - 全球已在AI基础设施领域投入了数千亿美元,但这仅仅是开始,未来需要的投资将达到数万亿美元级别 [5][13] - 黄仁勋预测,到2030年,全球在AI基础设施上的花费可能达到3万亿至4万亿美元 [13] - 主要科技公司(如微软、Meta、亚马逊、谷歌)已承诺在未来几年投入超过5000亿美元用于数据中心的建设和租赁 [15][31] - 2025年全球风险投资规模创历史新高,超过1000亿美元流向了“AI原生公司”,覆盖医疗、机器人、制造、金融等领域 [15][43][55] “五层蛋糕”理论详解 - **第一层:能源**:AI计算需要巨大的能源支撑,全球的电站升级和绿色能源项目正在提速以满足需求 [13][15] - **第二层:芯片与计算设备**:这是英伟达的主战场,其GPU需求旺盛,一卡难求,连前两代旧型号的租赁价格都在上涨 [5][13][30] - 台积电计划新建20座芯片厂 [15][43] - 英伟达的制造伙伴(如富士康、纬创、广达)计划新建30座“AI工厂” [15][43] - 美光已启动在美国的2000亿美元投资,SK海力士和三星也在扩产 [15][43] - **第三层:云设施与服务**:需要高效管理和分发算力 [13] - **第四层:AI模型**:如ChatGPT等大模型,是公众最熟悉的层面 [13] - **第五层:实际应用**:AI在金融、医疗、制造等行业产生价值的最终层面 [13] AI技术的近期突破 - **突破一:从“聊天”到“办事”**:AI模型从早期易产生“幻觉”,发展到能够进行逐步推理、制定计划并执行任务,成为“智能体” [17][44] - **突破二:开源浪潮**:以DeepSeek为代表的开放推理模型出现,降低了全球企业和研究机构获取强大AI能力的成本 [17][45] - **突破三:物理智能的觉醒**:AI开始理解蛋白质结构、化学分子、流体力学等自然科学规律,例如与礼来公司合作,AI可以像对话一样设计和研究蛋白质分子,有望彻底改变新药研发速度 [17][45][46] AI对就业市场的影响 - **创造高薪蓝领岗位**:数据中心和芯片工厂的建设催生了大量对电工、管道工、建筑工人和网络技师的需求,在美国,这些岗位的薪水几乎翻倍,达到六位数年薪(超过10万美元)并不难 [7][18][19][46] - **提升专业服务业效率**:以医疗行业为例,AI并未取代放射科医生,反而通过接管看片子等重复性工作,让医生能更专注于诊断和与病人沟通,美国放射科医生的数量在过去十年有所增加 [8][21][47] - **缓解护士短缺**:美国短缺约500万名护士,AI接手约一半的病历文书工作后,让护士能更多时间照顾病人,提升了医院运营效率和对护士的需求 [21][48] - **区分工作“目的”与“任务”**:AI自动化的是工作中的“任务”,而人类更能专注于工作的“目的”,这通常能提升职业价值并扩大行业规模 [24][49] 全球AI发展策略与“AI主权” - **对发展中国家**:AI应像电力和道路一样成为国家基础设施的一部分,借助开源模型并结合本国语言文化数据训练,任何国家都能发展适合自身需求的AI,这有助于保护数字主权并缩小技术差距 [26][28][50] - **对欧洲**:欧洲拥有深厚的工业基础和顶尖科学实力,可以跳过“软件时代”,直接拥抱“物理AI”和机器人技术,用AI重新武装制造业和科学研究,但前提是必须解决充足且可持续的能源供应问题 [28][53][54] 英伟达的现状与行业风向标 - **GPU需求持续旺盛**:英伟达GPU在各大云平台供不应求,租赁现货价格持续上涨,包括前两代的旧型号,这表明AI需求真实且强劲 [5][30][54] - **研发预算转向AI**:以礼来公司为例,三年前其研发预算几乎全在传统实验室,现在大部分资金流向AI超级计算机和数字实验室,表明研发经费正大规模向AI倾斜 [31][54] - **来自中国科技巨头的需求**:有消息称,中国的阿里巴巴和字节跳动各自希望订购超过20万颗英伟达最新的H200芯片 [31]