OpenShell
搜索文档
黄仁勋深度访谈:“Token经济”爆发,AI计算占GDP比重将翻百倍,英伟达10万亿是必然
华尔街见闻· 2026-03-24 11:22
AI计算范式的根本性转变 - 计算的本质从“检索系统”转变为“生成系统”,计算机的角色从“仓库”变为直接创造收入的“工厂” [3] - AI代工厂正在制造名为“Token”的商品,这种商品已被细分和定价,例如有人愿意为每一百万个Token支付1000美元 [3] - 基于“Token工厂”模式,计算设备完成了从成本中心向利润中心的跨越 [3] 英伟达的增长前景与市场展望 - 公司CEO认为英伟达的增长极大概率会发生,是必然的,未来实现3万亿美元营收的体量并非不可能 [4] - 如果生产力大幅提升,全球GDP将加速增长,未来用于计算的GDP占比将是过去的100倍 [4] - 公司能否迈向10万亿美元市值是一个被讨论的数字,但增长是核心焦点 [4] AI扩展的瓶颈与电力解决方案 - 电力是AI扩张的一个担忧,但不是唯一担忧,解决方案包括提升能效和获取更多电力 [6] - 能效的关键指标是“每瓦每秒token数”,通过“极致协同设计”提升能效,使得token成本每年下降一个数量级 [6] - 电网99%的时间没有达到峰值负荷,大多数时候可能只在峰值的60%左右运行,存在闲置电力 [6] - 建议构建能够“优雅降级”的数据中心,当电网要求降低电力供应时,数据中心可以转移关键负载或降低计算速率 [6] 供应链管理与内存战略 - 面对ASML光刻机、台积电CoWoS先进封装等环节的产能担忧,公司并不焦虑,与供应商保持紧密沟通 [7] - 系统工程深刻改变了基础设施制造模式,例如一个Vera Rubin机架包含130万到150万个组件,背后汇聚了200家供应商 [7] - 公司将数据中心的“超算组装”前置到了供应链的“超算制造”环节,机架以整机(重两三吨)形式发货 [7] - 大约三年前,公司成功说服了多家内存大厂的CEO,让他们相信HBM(高带宽内存)将成为未来数据中心的主流,并推动产业链投资扩产 [7] - 公司还推动供应商将原本专属于手机的低功耗内存(LPDDR)改造并引入超算领域 [8] AI缩放定律与算力需求演进 - AI扩展被拆分为四条规律:预训练、后训练、测试时扩展、代理式扩展 [9] - 训练不再受数据限制,数据将受限于算力,很多训练数据会是合成数据 [9] - 推理就是思考,是算力密集型的,测试时扩展包含推理、规划、搜索等,会推动推理算力需求上升 [10] 公司的核心护城河与生态 - 公司最深的护城河是CUDA庞大的装机量与信任生态,这是由43000名员工共同推动建立的 [11] - 护城河建立在数百万开发者对公司持续优化底层的信任之上,并辅以横向整合进入全球各类云厂商、OEM和边缘设备的广泛生态 [11] 对工程领导力与行业创新的评价 - 高度评价马斯克旗下xAI仅用4个月建成拥有10万块GPU的Colossus超算中心,将其成功归结为第一性原理思维与极简主义 [11] - 马斯克被评价为能够质疑一切,直到把一切缩减到不能再减的最低必要限度,并且亲自出现在行动第一线 [11] - 公司的管理哲学强调“极限协同设计”,管理团队庞大,CEO有约60名直接下属,且几乎所有都是工程专家 [21][23] - 公司采用集体讨论而非一对一会议的模式来解决复杂的系统设计问题,确保所有相关专家都能参与并贡献 [25] - 领导力被描述为持续塑造员工和合作伙伴的信念系统,为重大决策铺平道路,使得宣布时大家已基本接受 [46][47][48] AI对就业与编程的影响 - 在招聘中,会优先雇佣“AI专家”,这一准则涵盖会计师、律师、销售人员、供应链经理、药剂师、电工和木匠等所有职业 [12] - 如果一个人的工作本质是一系列“任务”,则可能被AI颠覆;若工作有更深层的“目标”,则可以利用AI自动化常规琐事,成为“创新者” [12] - 公司软件工程师的数量将会增长而不是减少,如果编程的定义是“描述规范让计算机去构建”,那么能做到这一点的人数可能从3000万变成10亿 [13] - 对于AGI(通用人工智能),如果将其定义为一个能够自主开发应用并实现盈利的系统,那么AGI已经实现 [13] 公司发展历程与战略决策 - 公司从一家加速器公司起步,通过发明可编程像素着色器、引入单精度浮点数(FP32)、开发Cg和CUDA,逐步转型为计算公司 [29][30] - 将CUDA引入GeForce是一个关乎生死存亡的战略决策,当时极大地增加了GPU成本,完全吞噬了公司所有的毛利润,市值一度跌至约15亿美元 [31][37] - 该决策的核心理由是计算平台的核心是开发者,而开发者被装机量吸引,GeForce每年卖出数百万GPU,是培养装机量的起点 [33][35][36] - 公司坚持在GeForce上搭载CUDA,并认为英伟达是GeForce建立起来的殿堂,因为GeForce把CUDA带给了所有研究人员和科学家 [38][39] 极限协同设计与系统架构 - 极限协同设计是对从架构、芯片、系统、系统软件到算法和应用程序的整个软件栈进行优化 [22] - 协同设计之所以必要,是因为问题规模已无法装入单台计算机,需要分布式处理,而所有环节(计算、网络、CPU、GPU、交换机)都可能成为瓶颈 [18][20] - 公司架构设计反映其存在的环境,目标是成为产出成果的机器,直接决定了组织架构的设置 [22] - 系统架构快速演进以跟上算法发展,例如为混合专家模型(MoE)推出NVLink 72, Grace Blackwell机架专注于处理大语言模型,而新一代Vera Rubin机架则为了运行智能体 [63][64] 对全球创新生态的观察 - 全球大约50%的AI研究人员是华人,且大多仍在中国,中国的科技产业在移动云时代以软件贡献崛起,内部存在极其激烈的竞争 [116][117] - 中国的社会文化(家庭第一、朋友第二、公司第三)和开源交流习惯,加上激烈的竞争,使其成为当今世界上创新最快的国家之一 [117][118] - 公司开源AI模型(如Nemotron 3)的愿景包括:理解AI模型演变以进行协同设计、让AI渗透到每一个行业和国家、认识到AI不仅仅是语言而涵盖多种模态 [121][122]
NVIDIA Corporation (NVDA) Unveils Agent Toolkit For Creating Specialized AI Agents
Yahoo Finance· 2026-03-21 20:43
公司战略与定位 - 公司是人工智能计算领域的绝对领导者 提供涵盖硬件、软件和服务的全栈平台 用于AI开发、训练和推理 [5] - 公司已完成转型 从GPU制造商转变为AI基础设施公司 其技术正推动生成式AI、大语言模型和物理AI(机器人)的发展 [5] - 公司正积极拓展AI能力并巩固跨行业合作伙伴关系 旨在抓住预计到2027年将超过1万亿美元的计算需求 [4] 新产品发布 - 公司于3月16日发布了Agent Toolkit 这是一个新的开源软件平台 专为构建自主企业级AI智能体而设计 [1] - Agent Toolkit包含OpenShell开源运行时 提供基于策略的安全、网络和隐私控制 [1] - 该工具包包含开源模型和软件 例如NVIDIA Nemotron系列中的NVIDIA AI-Q和NVIDIA cuOpt 供企业和开发者构建可扩展生产力的工具 [3] - 开发者可利用该工具包创建能够自主行动的专业化AI智能体 NVIDIA AI-Q能帮助开发者构建感知、推理并基于企业知识采取行动的定制化AI智能体 [3] 市场拓展与合作 - 公司正与主要的汽车和云服务公司建立合作伙伴关系 以扩大市场覆盖范围 [4]
英伟达押注OpenClaw并添加安全层,详解NemoClaw工作原理
搜狐财经· 2026-03-18 06:02
核心观点 - 英伟达在GTC大会上宣布推出NemoClaw堆栈,旨在通过增强隐私和安全性来加强并推广OpenClaw智能体平台,将OpenClaw定位为个人AI的基础,并预示企业AI智能体的发展将加速软件和知识工作的代际转变 [2][4] - 公司同时成立了Nemotron联盟,联合多家AI实验室和开发者,通过共享资源与计算来推进开源AI模型的发展,旨在加速AI进展并加强开放的生态系统 [5][6] 产品发布:NemoClaw与OpenShell - NemoClaw是一个新的软件堆栈,专为加强OpenClaw智能体平台而构建,旨在解决OpenClaw因自主能力和访问用户信息而带来的重大安全风险问题 [2][6] - NemoClaw集成了英伟达新推出的开源运行时OpenShell,该运行时通过执行基于组织策略的防护措施、将模型沙盒化来增强数据隐私和智能体安全性,并提高智能体的可扩展性 [3][6] - OpenShell由英伟达与CrowdStrike、思科和微软安全等安全公司合作构建,以确保其与其他网络安全工具的兼容性 [3][7] - NemoClaw可通过单个命令安装,在任何平台上运行,并允许在本地系统上使用任何编码智能体,包括英伟达自己的Nemotron开放模型系列 [3] - 通过隐私路由器,NemoClaw允许智能体结合使用云端的前沿模型和本地模型,帮助在隐私防护措施内训练智能体完成任务 [3] 战略定位与行业愿景 - 英伟达将OpenClaw视为个人AI的基础,并与OpenClaw创始人合作,称该智能体平台是“历史上最重要的软件发布” [2] - 公司CEO黄仁勋提出,OpenClaw预示了一条新路径:智能体即服务,而非传统的软件即服务 [5] - 推进企业AI智能体将“加速软件和知识工作的代际转变”,企业软件的下一阶段将完全关于专业化智能体 [4] - 英伟达的新Vera Rubin基础设施旨在支持这种智能体AI驱动,据称将在过程中降低成本 [4] - 英伟达希望额外的安全性能让OpenClaw智能体更受欢迎、更易于访问,风险比目前更小,从而让企业更安心地使用AI智能体为员工完成以前不会采取的行动 [3] 生态合作与开发者支持 - 开发者即日起可访问英伟达的Agent Toolkit和OpenShell,可与LangChain一起使用,或直接从GitHub下载以在本地运行 [5] - 企业可以通过AWS、Google Cloud和Microsoft Azure等云提供商创建和部署AI智能体 [5] - 英伟达成立了Nemotron联盟,初始成员包括Thinking Machines Lab、Perplexity、Cursor、Mistral AI和Sarvam等模型开发者和AI实验室 [5][7] - 联盟旨在通过共享资源和计算推进开源AI,加速AI模型进展,将智能扩展到任何单一模型之外,并加强开放的生态系统 [6][7] - 作为合作首例,Mistral AI和英伟达将共同开发一个在英伟达DGX™云上训练的开放模型并开源结果,该模型也将成为英伟达即将推出的Nemotron 4模型系列的基础 [5]
“AI牛市叙事”再掀巨浪! 黄仁勋抛出万亿美元AI宏图,英伟达扬帆起航冲6万亿美元市值
智通财经· 2026-03-17 14:12
公司战略与愿景 - 公司正从单一的AI GPU供应商,彻底重构为“AI工厂”或“AI基础设施总包商”,其竞争单位已从单颗芯片升级为整座AI工厂 [1][4][9][11] - 公司CEO黄仁勋在GTC大会上将AI算力基础设施的营收机遇上调,预计到2027年至少达到1万亿美元,远高于此前提出的到2026年5000亿美元的目标 [1][4][10][13] - 公司旨在定义下一代“AI工厂”的生产函数,核心指标从训练峰值性能转向单位电力下的token产出、单token成本及首次生产时间 [4][5][10] 财务与市场预期 - 华尔街分析师平均目标价显示,公司股价未来12个月内有51%的上行潜力,目标价达273美元,对应市值约6.6万亿美元,最乐观目标价高达360美元 [1][12] - 高盛等机构认为,公司提出的万亿美元营收前景为市场提供了长周期需求背书,缓解了投资者对“AI资本开支可能在2026年见顶”的担忧 [13][14] - 截至新闻发布时,公司股价收于183.220美元,市值约4.45万亿美元,市场预期其市值将突破5万亿美元并迈向更高点位 [1][12] 产品与技术路线图 - 公司正式推出基于Blackwell架构的下一代平台Vera Rubin,并预告了Feynman架构的路线图,下一代平台将引入Rosa CPU、LP40 LPU等新组件 [5][7] - 在硬件层面,公司将CPU、GPU、LPU、DPU、网络交换芯片和存储架构整合成平台级系统,推出了Vera CPU、Rubin GPU、NVLink 6 Switch、Groq 3 LPU等产品 [6] - Vera Rubin NVL72平台相比Blackwell可实现最高10倍的每瓦推理吞吐,单token成本降至十分之一,训练大规模模型所需GPU数量可降至四分之一 [5] - 公司通过收购Groq获得技术授权,推出LPU AI推理算力基础设施系统,并将AI推理拆分为prefill(由Vera Rubin负责)和decode(由Groq AI芯片负责)两段,采用异构计算方案 [2][6][14] - 官方数据显示,Vera Rubin与LPX协同可实现最高35倍的每兆瓦推理吞吐,并为万亿参数模型带来最高10倍的营收机会 [14] 软件与生态系统 - 公司推出Dynamo 1.0,将其定义为AI工厂的推理操作系统,官方称其对Blackwell平台可带来最高7倍的推理性能提升 [7] - 在智能体(Agentic AI)方向,公司推出Agent Toolkit、OpenShell、NemoClaw等工具,并将OpenClaw上升为“个人AI的操作系统”式平台 [7] - 公司扩展了Nemotron、Cosmos、Isaac GR00T、BioNeMo、Earth-2等开放大模型家族,强化软件生态 [7] 市场定位与竞争格局 - 公司正从“训练霸主”进一步扩张为“AI算力推理基础设施总包商”,以应对在推理计算领域来自CPU及谷歌TPU等定制AI ASIC处理器的竞争 [2][10][14] - 公司强调“极限协同”设计理念,将计算、网络、存储、软件、供电和冷却作为一个整体进行优化,以在固定电力预算下实现最佳经济效益 [4][5] - 高盛认为,公司在电力受限、时延敏感的推理时代,拿出了更强的变现框架与更完整的异构算力答案,巩固了其护城河 [14] 业务扩展与新市场 - 公司将“物理AI”与“空间计算”纳入战略,IGX Thor已进入通用可用阶段,面向工业、医疗、机器人和轨道边缘计算 [8] - 公司推出Open Physical AI Data Factory Blueprint,用于加速机器人、视觉AI智能体和自动驾驶的数据生成与评估 [8] - 公司将Vera Rubin架构延伸至太空,Space-1 Vera Rubin Module相较H100可为太空推理带来最高25倍的AI算力 [8] - 公司正将“AI工厂”的范式从云数据中心扩展至跨云、边、端、车、机器人及太空的统一基础设施 [8][9] 行业影响与叙事 - 公司抛出的万亿美元AI算力宏图,旨在撑起资本市场的“AI牛市叙事”,并带动全球AI算力产业链迈向新一轮上行轨迹 [1] - 全球投资者将围绕公司、谷歌TPU集群与AMD的“AI牛市叙事”,继续锚定为全球股市中最具确定性的景气投资叙事之一 [1] - 电力、液冷散热系统、光互连供应链等与AI训练/推理密切相关的投资主题,将继续位列股票市场最火热的投资阵营 [1]