Nemotron 3 Ultra
搜索文档
硅谷大事件丨抢跑OpenAI,Anthropic秘密递交IPO申请;英伟达AI平台投产,组装速度提升95%;谷歌启动历史最大融资,800亿美元推进AI战略
雷峰网· 2026-06-02 08:33
Anthropic启动上市进程 - Anthropic已向美国SEC秘密提交S-1注册声明,正式启动上市流程[2] - 公司在三天前刚以约9650亿美元的估值完成融资,估值反超OpenAI登顶全球大模型公司[3] - Anthropic在模型迭代节点递表,被视为锁定长期资本优势、量化AI公司“进入壁垒”的强烈信号[4] NVIDIA发布多项产品与进展 - 在Computex上,NVIDIA宣布专为Agent AI推理设计的Vera Rubin多机架Pod级系统已全面投产[4] - 发布550B参数的推理优化模型Nemotron 3 Ultra[6] - 推出首批AI Agent PC产品DGX Spark,支持多节点本地集群,并同步发布开发者教程[6][7] - 与Hugging Face联合发布全球首个全开源物理AI基础模型Cosmos 3,支持多模态输入,用于机器人仿真、自动驾驶等场景[12] 主要科技公司AI战略与融资 - Alphabet计划筹集800亿美元用于AI数据中心建设、TPU研发和Gemini模型训练,加入“千亿级AI投资俱乐部”[9][10] - OpenAI宣布其前沿模型和Codex编程工具在Amazon Bedrock上全面可用,企业客户可跨云调用[8] - Perplexity推出Search as Code,允许AI Agent用Python代码直接调用其搜索引擎,向“Agent搜索基础设施”转型[10][12] - xAI在Grok Build平台推出面向长上下文任务的高速高智能模型Composer 2.5,持续构建“模型+平台”的开发者生态[12] AI安全与监管合作 - Anthropic向欧盟网络安全机构ENISA开放Mythos访问权限,参与欧盟AI监管框架建设,抢占AI安全话语权并获得监管博弈先发优势[7] - Anthropic发布Agent安全性定量研究,数据显示在安全机制介入前,浏览器Agent被劫持的成功率高达31.5%[13] 其他公司动态 - Tesla宣布FSD Supervised已完成多次从东海岸到西海岸的零人类输入驾驶,验证了其“连贯驾驶”能力[13] - Runway在伦敦设立欧洲总部和新的世界模型研究实验室,聚焦“通用世界模型”研究,寻求在视频生成赛道外的差异化[14]
腾讯研究院AI速递 20260602
腾讯研究院· 2026-06-02 00:05
生成式AI与智能体平台 - 英伟达发布专为智能体负载设计的Vera Rubin平台,同规模数据中心运行Agent任务效率达上代Grace Blackwell的十倍 [1] - 英伟达推出为智能体打造的Vera CPU,Agent负载执行速度达同期x86的一点八倍,并发布DGX Station for Windows桌面级超算 [1] - OpenAI在解散六年后重建机器人团队,长期目标是让每个人都拥有一台通用机器人,短期先造机器人协助基建技术工人 [1] 大模型与API动态 - 全球第九AI Lab Agnes宣布,自六月一日起其文本、图像、视频三款核心模型API面向全球开发者无限期免费开放 [2] - 腾讯混元为《和平精英》打造AI明星队友小田,该游戏AI队友玩法累计体验用户已突破一点一亿,单日活跃峰值达一千七百七十万 [3] - 小米公开MiMo-V2.5系列API永久降价百分之九十九的技术方案,经验证有效KV Cache容量提升近五倍,服务端缓存命中率平均达百分之九十三至九十五 [5] 世界模型与物理AI - 英伟达发布五千五百亿参数模型Nemotron 3 Ultra与物理AI模型Cosmos 3,把Agent能力从数字世界延伸至物理形态 [1] - VAST发布Project Eden世界模型,提出将状态推演与视觉呈现原生解耦的三层架构,使渲染成本由指数级降为线性级 [2] - 深度原理发布材料基座模型MPA,在四十个真实工业任务上拿下SOTA,并在其中三十五项物性预测中取得最佳性能 [5] 行业成本与商业模式变化 - 硅谷大厂开始限制员工Token用量,微软停止大部分员工Claude Code许可,Uber四个月花光全年AI预算 [3] - 研究显示企业每花一美元在Token上,约八成隐性损耗在修复bug、重写代码与审查延迟,重度AI使用者代码返工量是非AI用户的九点四倍 [4] - 行业厂商开始从按Token计费转向按结果计费,仅一成四的CFO能看到清晰回报 [4] 机器人硬件与平台 - 宇树发布人形机器人H2 Plus,身高一百八十二厘米、全身达七十五个自由度,搭载Jetson T5000高算力模组 [4] - 英伟达与宇树合作,基于H2 Plus发布Isaac GR00T参考人形机器人平台,整合灵巧手、板载计算与软件工作流,将于年底推向高校与科研市场 [4] - OpenAI机器人团队由DALL·E共同创造者领衔,核心押注仿真真实性与仿真到现实的迁移路线,意图用仿真自造数据补齐短板 [1]
黄仁勋对未来十年的完整判断,今天都讲明白了
虎嗅APP· 2026-06-01 21:57
聚焦前沿科技,抢先看到未来。 本文来自微信公众号: 字母AI ,作者:苗正,题图来自:视觉中国 "计算就是收入、瓦特就是收入、每一个token都是收入!" 以上言论,均出自黄仁勋在GTC 2026上的演讲。其内容堪称AI时代的"时间就是金钱"。 黄仁勋表示,每瓦特产生的token越多,收入就越多。 以下文章来源于字母AI ,作者苗正 字母AI . 他展示了一组数据,GitHub上的代码提交量在2026年前几个月增加了近三倍,全球3000万软件开发 者创造的3万亿美元薪酬价值正在产生接近9万亿美元的生产力。 在这场GTC大会上,黄仁勋带来了许多新玩意。 最重磅的无疑是英伟达与微软联手设计的AI PC,第二样是为Agent时代打造的Vera及其完整生态, 第三样是开源大模型Nemotron 3 Ultra,第四样是物理AI Cosmos 3以及基于它而诞生的参考人形机 器人Isaac。 这些东西串起来,拼成了黄仁勋对未来十年计算模式的完整判断。 重新定义AI PC 黄仁勋说,微软与英伟达的合作将会重新定义AI PC这个概念。 黄仁勋在台上展示了RTX Spark。 RTX Spark是一台笔记本电脑,芯片叫N1X ...
全线大涨!刚刚,直线狂飙!黄仁勋,彻底引爆!
券商中国· 2026-06-01 20:58
核心观点 - 英伟达在台北国际电脑展发布多项重磅新产品与新平台,包括下一代AI超级芯片平台Vera Rubin架构、面向AI PC的处理器、AI模型Nemotron 3 Ultra以及人形机器人参考平台等,全面布局AI计算、个人电脑、自动驾驶及机器人领域,旨在巩固并扩大其AI生态领导地位 [1] - 公司宣布进军基于Arm架构的Windows系统个人电脑市场,计划推出整合CPU、GPU与AI单元的SoC芯片,挑战英特尔主导地位,目标覆盖整个Windows阵营 [1][5][8] - 一系列新产品发布与市场战略调整刺激公司及其合作伙伴股价大涨,显示出市场对其技术路线与增长前景的积极反馈 [1] 新产品与平台发布 - **Vera Rubin AI超级芯片平台**:下一代AI超级芯片平台Vera Rubin架构已全面进入量产阶段,首批客户包括OpenAI、Anthropic和SpaceX [2] - **平台性能与规模**:与上一代Grace Blackwell平台相比,Vera Rubin的大规模智能体吞吐量提高了10倍 [2] - **供应链与生产**:凭借开源MGX设计,数百家合作伙伴正在30多个国家和地区的350多家工厂加速生产,供应链规模是Grace Blackwell的两倍 [2] - **平台构成**:该平台整合了NVIDIA Vera Rubin NVL72系统、NVIDIA Vera CPU、NVIDIA Groq 3 LPX、NVIDIA Vera BlueField-4 STX存储和NVIDIA Spectrum-6 SPX以太网机架 [3] - **发货时间**:Vera Rubin产品预计将于今年秋季开始发货 [4] 进军AI PC市场 - **新产品发布**:公司公布了面向Windows系统个人电脑的新款处理器,挑战英特尔主导地位 [5] - **产品细节**:全新的RTX Spark超级芯片将首次应用于戴尔、联想等主要PC厂商的笔记本和台式电脑,由联发科协助开发,用于运行基于Arm的微软Windows系统 [5][6] - **发布节奏**:公司将随每一代AI处理器同步推出新一代个人电脑芯片 [7] - **战略意图**:意图将CPU、GPU与AI单元整合为单颗SoC,向整机厂商输出完整核心计算平台,效仿苹果垂直整合路径,目标覆盖整个Windows阵营 [8] 自动驾驶与机器人布局 - **自动驾驶平台**:宣布DRIVE Hyperion成为全球自动驾驶出租车平台,中国主流车企如比亚迪、吉利、极氪、小米以及小马智行等均已采用或正基于该平台开发智驾 [9] - **新AI模型**:推出拥有320亿参数的Alpamayo 2 Super“视觉—语言—动作”模型,旨在助力企业研发安全的L4自动驾驶出租车 [10] - **人形机器人平台**:推出面向学术研究的NVIDIA Isaac GR00T人形机器人参考平台及大型开源智能体工具套件,与宇树科技合作,以H2 Plus为参考机型,提供从Jetson Thor计算芯片到软件的一站式开发框架 [1][10] 新AI模型发布 - **Nemotron 3 Ultra模型**:推出拥有5500亿参数的混合专家模型,适用于代码开发、科研及企业业务流程 [11] - **模型性能**:相较于同级别主流开源前沿模型,该模型推理速度最高提升5倍,使用成本最高降低30% [11] - **平台适配**:已完成适配主流智能体平台与调度框架的后置训练,涵盖Hermes Agent、LangChain Deep Agents等 [11] 市场反应 - **股价表现**:消息发布后,英伟达美股盘前股价一度大涨近3%,截至发稿涨幅为2.49% [1] - **合作伙伴股价**:芯片巨头Arm美股盘前涨幅扩大至13%,IBM涨超10%,微软、甲骨文、美光科技等涨超3% [1] - **供应链股价**:台股合作伙伴广达电脑、纬创、华硕大涨近10% [1]
【美股盘前】发布AI PC超级芯片,联手宇树科技布局人形机器人,英伟达涨超2%,Arm涨13%,高通跌9%;涨超5%,美光股价突破1000美元;伯克希尔拟斥资68亿美元收购住宅建造商Taylor Morrison
每日经济新闻· 2026-06-01 19:29
①【三大指数齐涨】道指期货涨0.72%,标普500指数期货涨0.22%,纳指期货涨0.36%。 ②【英伟达联手宇树科技布局人形机器人】6月1日,英伟达CEO黄仁勋宣布,该公司已与中国机器人初 创公司宇树科技合作,推出新一代人形机器人参考设计H2+,也被称为Isaac GR00T系统,以加速全球 人形机器人行业创新。 RTX Spark采用台积电3纳米工艺,集成700亿个晶体管,配备128GB统一内存,并搭载Blackwell RTX GPU与定制Grace CPU。英伟达表示,该平台能够运行完整AI软件栈,可支持数字生物学、计算机图 形、AI推理等多种工作负载。 黄仁勋在演讲中表示,"有用的AI已经到来,Agent AI正在成为新的计算范式。"他指出,未来用户不再 只是"点击软件",而是通过AI Agent完成研究、设计、内容生成及工具调用等复杂任务。 演讲现场,英伟达展示了本地运行AI Agent完成建筑设计的案例。Agent通过Open Shell控制框架调用 Claude模型,并自主操作Rhino、Blender等专业软件完成建模与渲染。Adobe等合作伙伴也已针对RTX Spark进行优化,Photo ...
COMPUTEX上的黄仁勋:Vera Rubin,下一代AI PC,Nemotron 3与Cosmos 3
硬AI· 2026-06-01 18:29
公司新产品与架构发布 - 英伟达创始人兼CEO黄仁勋在GTC台北2026主题演讲中发布了Vera Rubin架构、面向AI智能体的CPU Vera、AI模型Nemotron 3 Ultra以及AI工厂平台DSX等多项新产品与新平台[2] - Vera Rubin架构已全面进入量产阶段,OpenAI、Anthropic和SpaceX成为其首批客户[7][8] - 公司推出面向AI智能体的CPU Vera,并强调其BlueField-4 STX带来具备芯片级安全的代理型AI存储处理能力[10][11] - 公司宣布推出全新AI模型Nemotron 3 Ultra,该模型基于5500亿参数,在多项基准测试中表现优异,例如Agent Productivity为91%,Long-Horizon Planning为33%,Coding为54%,Instruction Following为82%[21][22] - 公司推出NVIDIA DSX平台,为基础设施构建者提供创建AI工厂的完整行动指南,可在不花一分钱的情况下对整个工厂进行模拟和验证性能[23] 下一代AI PC战略 - 英伟达公布面向WINDOWS系统个人电脑的新款处理器,挑战英特尔,剑指下一代AI PC入口[1][14] - 英伟达将与联发科合作开发RTX SPARK个人电脑芯片,并由台积电生产,该芯片将于今年秋季面市,适用于笔记本和台式机[15] - 公司意图将CPU、GPU与AI单元整合为单颗SoC,直接向戴尔、联想等整机厂商输出完整的核心计算平台,目标为整个Windows阵营[18] - 公司宣布与微软合作,彻底重塑PC的运行方式,推出全新的PC产品线,包括三款革命性的Windows设备,覆盖台式机、笔记本和工作站,且100%兼容Windows系统并支持CUDA和AI张量核心[79][82][83] 自动驾驶与机器人生态 - 英伟达在发布会透露,包括比亚迪、吉利、极氪、小米以及小马智行等在内的中国主流车企和自动驾驶公司,均已采用或正在基于NVIDIA Hyperion平台开发智驾[3][25] - 英伟达DRIVE Hyperion成为全球自动驾驶出租车平台,并推出用于自动驾驶出租车的Alpamayo 2超级开放推理模型[24][26] - 公司计划与宇树科技等全球人形机器人制造商合作开发机器人[6][19][20] - 公司推出面向学术研究的NVIDIA Isaac GR00T人形机器人参考平台及大型开源智能体工具与技能套件,选择宇树科技的H2 Plus作为参考机型[28][29] - 公司宣布推出NVIDIA Isaac Groot,一款全集成的人形机器人参考设计,拥有31个自由度,搭载全新的Thor芯片和完整的软件栈[91] 智能体AI与计算模式变革 - 黄仁勋表示,下一波AI是智能体AI,实用型AI已经到来,AI如今是利润和GDP生成器[32][35] - 智能体AI的计算模式由大型语言模型组成的智能代理运行在一个协调框架内,能够观察、推理、规划和使用工具[35][36] - 公司认为智能体将使用大量工具,CUDA X库作为智能体的工具将迎来黄金时期[37][38] - 智能体系统是解耦、分布式、异构的计算模型,公司开发的下一代Vera Rubin系统正是为此设计[40][41] - 为智能体设计的CPU Vera与为人类设计的传统CPU有根本区别,其需求包括极低延迟、高单线程性能、高带宽和高能效[61][62][64] AI工厂与基础设施战略 - 全球正竞相建设AI工厂,这是人类历史上规模最大的基础设施建设浪潮,AI工厂极为复杂,需端到端协同设计[43] - NVIDIA DSX是构建和运营AI工厂的蓝图与参考设计,DSX SIM可在服务器机架落地前设计并验证AI工厂,DSX OS负责基础设施的配置、运行、监控与修复[44] - 当前AI工厂的电源超额配置比例高达40%,而DSX Max LPS可让运营商在相同功率预算内安全部署更多GPU,带来数十亿美元的年营收增量[44] - 公司正从GPU公司转型为系统公司,并进一步成为AI基础设施公司,帮助客户打造AI工厂,其复杂性和资本成本极高[42][46][49] - AI工厂的核心经济指标是token(代币),算力即营收,每瓦性能即营收,公司系统的每瓦吞吐量处于世界顶尖水平[50][51] 市场影响与合作伙伴 - 英伟达美股夜盘股价上涨2.7%[4] - 公司生态系统庞大,在台湾拥有150家供应链合作伙伴,数百万平方英尺的工厂空间,Vera Rubin供应链规模是Grace Blackwell的两倍[31][53][57] - 公司合作伙伴包括CoreWeave(估值达500亿至700亿美元)、Nebius、n scale等AI云平台,服务于各行业客户[47][48] - 在AI模型领域,公司推出开源的Nemotron 3 Ultra模型,速度提升5倍,成本低30%,并开放所有训练数据[76][77] - 在物理AI领域,公司发布Cosmos 3,这是物理AI领域的前沿成果和基础模型[87][88]
英伟达(NVDA.US)再燃AI算力产业链牛市! 从Vera到RTX Spark再到DSX 黄仁勋抛出“全栈AI帝国”超级蓝图
智通财经网· 2026-06-01 16:56
公司战略与定位 - 公司正加速从“AI GPU供应商”向“AI数据中心全栈算力平台+个人电脑AI芯片+CPU处理器集成厂商+机器人AI基础设施+以CUDA为核心的AI软件运维系统”的综合型AI算力基础设施巨头转型 [1] - 公司致力于将人工智能算力集群从“AI GPU/ASIC加速器时代”推进至“AI工厂主导的全栈操作系统时代” [1] - 公司通过Vera Rubin、RTX Spark、DSX、Nemotron、Hyperion和Isaac GR00T等技术,构建了从数据中心、企业端、汽车端到机器人端的清晰AI技术路线 [6] - 公司正凭借一款新芯片加速进军个人电脑CPU市场,目标是削弱英特尔与AMD在x86领域的控制力,并推动PC面向AI时代实现现代化升级 [9] - 公司正在从“AI GPU龙头”升级为“数据中心GPU+CPU+网络基础设施+机架级系统+端侧AI底层算力架构+CUDA开发者软件生态”的AI基础设施平台公司 [22] 新产品发布与产能 1. **Vera Rubin平台**: - 下一代AI算力架构Vera Rubin已进入全面量产阶段,支持POD级别的超大规模部署 [14] - 该平台整合Vera CPU、Rubin GPU、BlueField‑4 STX DPU与Spectrum‑X光互连技术,旨在提高代理式AI推理与训练的能效和吞吐率 [14] - 该平台支持百万GPU级高速互连的AI工厂级部署,重塑了AI数据中心基础架构的能效与规模经济 [15] 2. **Vera CPU**: - 公司首款独立数据中心微处理器,将于今年第三季度全面投产 [7] - 性能较传统机架级CPU快约50%、能效约为2倍 [4] - 正切入规模约2000亿美元的数据中心CPU市场,将与英特尔Xeon、AMD Epyc及亚马逊Graviton等正面竞争 [4][8] - OpenAI、Anthropic和SpaceX将成为其首批大型用户 [4][7] 3. **RTX Spark超级芯片**: - 基于ARM架构的CPU/GPU一体化超级芯片,面向高端轻薄本、台式机和AI开发终端 [5] - 最高可配20个CPU核心、6144个Blackwell GPU核心、128GB LPDDR5X统一内存,可提供约1 petaflop的端侧AI性能 [5] - 设计目标是将个人电脑从“应用运行终端”改造为“本地智能体终端”,可在本地安全运行大模型、处理创作任务等 [5] - 首批合作伙伴包括微软、戴尔、惠普、华硕、联想等,搭载该芯片的笔记本电脑将于今年第四季度开始销售 [5][9] 4. **其他产品与平台**: - 推出面向Windows的Nvidia DGX Station,帮助企业迅速开发和部署人工智能软件 [9] - 更新并扩展了用于规划、部署和监控数据中心的软件产品DSX,据称可使数据中心在相同电力预算下使用多达40%更多的加速器芯片 [8] - 推出自研AI大模型Nemotron 3 Ultra,并持续发展Isaac GR00T机器人开发平台和Hyperion自动驾驶平台 [6][17] 市场影响与行业趋势 - AI算力基础设施需求未现退潮迹象,正从单一的AI GPU/ASIC加速器需求,扩张为数据中心CPU、GPU、网络、存储、电力、液冷等全栈基础设施层需求 [2][18] - AI超级牛市正从估值叙事走向盈利兑现与供应链广度扩散,下一阶段由芯片、先进封装、网络、光学互连、材料、散热、电力系统等共同决定 [3] - 华尔街预期AI算力基础设施进入更持久、更宽广的资本开支周期,摩根士丹利将2026年美国大型科技巨头资本开支预期从4330亿美元大幅上修至8050亿美元,2027年有望达到1.1万亿美元 [20][21] - 到2028年,预计接近3万亿美元AI相关基础设施投资将流经全球经济,且超过80%的支出仍在未来 [21] - AI算力军备竞赛进入系统级扩张阶段,需求呈现“无弹性”趋势,科技巨头持续加码建设AI数据中心 [20][21] 资本市场反应与估值 - 公司GTC活动点燃AI算力牛市,其HBM提供商三星电子股价收涨超10%,带动韩国综合指数再创新高,该指数今年以来涨幅高达100% [4] - Arm公司(Vera CPU采用其架构)美股盘前涨超8%,今年以来股价涨幅已超220% [4] - 日本MLCC巨头股价涨超8%,今年以来涨幅同样超过220%,软银市值已超越丰田成为日本市值最高公司 [4] - 华尔街分析师对公司看涨情绪狂热,61位分析师给出的12个月内平均目标价为296.81美元,对应约7.24万亿美元市值,较当前潜在上行空间超过40% [24] - 华尔街最高目标价达500美元,对应约12.2万亿美元市值,较当前有约136.8%的潜在上行空间,意味着市值潜在增加约7.0万亿美元 [24]
英伟达正式发布Arm PC芯片,黄仁勋台北演讲:计算产业变天了!
半导体芯闻· 2026-06-01 16:32
文章核心观点 - 智能体AI(Agentic AI)已真正到来并进入实用化阶段,其将重塑计算模式、应用形态和整个计算机产业,算力需求成为唯一的限制 [1] - NVIDIA的角色已从GPU芯片公司演变为AI时代计算基础设施的定义者,其产品战略围绕支持Agentic AI的全栈系统展开 [6][100] 行业根本性变革与新模式 - 过去六个月计算机产业发生根本变化,Agent与前沿模型融合使AI能完成真正有用的工作,未来十年Agentic AI将成为新的应用和计算模式 [3] - 新的计算模式是:模型负责思考,harness负责编排,工具和skills负责执行,runtime负责承载系统,这种模式将在云端、本地、PC、机器人、汽车等各个场景重复 [3] - AI现在是利润和GDP生成器,Token已成为能够直接盈利的收入单元,驱动算力需求暴涨 [7] 生产力提升与市场影响 - Agentic AI对生产力有巨大拉动效应:全球代码提交量从2023年的3亿次,增长至2024年的4亿次、2025年的5亿次,2026年前几个月已接近2025年全年的三倍 [5] - 全球约3000万至4000万名专业软件工程师正接受AI智能体辅助,在Agentic AI加持下,全球约3万亿美元的软件工程师薪酬成本,正在创造出接近3倍的产出,相当于实现价值9万亿美元的生产力提升 [5] - AI不会减少工作岗位,反而促使企业雇用更多软件工程师,因为借助AI能创造巨大生产力 [7] Agentic AI 技术架构 - Agent是一种新的应用形态,由一个或多个大语言模型组成,运行在编排框架(harness)中,由框架调度其完成生产性工作 [7] - Agent会处理短期记忆和长期记忆,记忆管理系统变得非常重要,大语言模型负责思考,harness像操作系统一样连接所有部分 [8] - 现场演示显示,用户只需用自然语言解释意图,AI智能体就能瞬间调用工具生成复杂代码、GIF动图或3D打印工程文件 [9] - 未来计算机运行方式将彻底改变,不再需要复杂点击和键入,而是向AI阐述意图,由AI智能体生成代码或操作工具 [12] 全新硬件系统:Vera Rubin - Vera Rubin不是一颗芯片或GPU,而是一个为运行Agent打造的、端到端解耦、分布式且异构的超大规模系统 [3][20][21] - Vera Rubin是NVIDIA历史上最具雄心的工程之一,有6万亿个晶体管,采用台积电3nm工艺与CoWoS封装,超过4万名工程师参与 [23] - 从Grace Blackwell到Vera Rubin,系统尺度扩大,Vera Rubin被定位为面向Agentic AI的多机架、POD级系统 [23] - Vera Rubin NVL72是无线缆、无软管、无风扇的液冷系统,装配时间从过去约2小时缩短至5分钟,提升了制造吞吐、系统可靠性和韧性 [23] 1. 系统构成包括:Vera Rubin NVLink 72、Groq LPX、Vera CPU Rack、Vera BlueField存储处理系统及Mellanox网络系统,共同构成面向AI Agent的超级计算机 [24] - Vera Rubin已全面量产,微软和戴尔已率先部署工程样机 [27] 面向Agent的CPU:Vera CPU - 过去的CPU是为人类设计的,而未来的CPU要为没有耐心、需要低延迟、高带宽、高能效的Agent设计 [3][39] - NVIDIA提出新比喻:CPU是指挥家,GPU是管弦乐队,并为此打造了专为智能体定制的Vera CPU [39] - Vera CPU彻底抛弃传统设计惯例,关注低延迟、单线程性能、每核心带宽、总体带宽和能效 [41] - Vera CPU使用NVIDIA Olympus Core,通过第二代可扩展一致性互连fabric连接88个核心,核心间通信速度比传统CPU更快,支持PCIe Gen 6,内存带宽达每秒1.2TB,内部fabric带宽达每秒3.6TB [43] - 性能表现:相比x86 CPU,峰值内存延迟降低40%,核心到核心通信快50%,Agentic Sandbox性能达x86 CPU的1.8倍,SQL数据库运行速度提升3倍,处理纽约证券交易所金融遥测数据时吞吐量达传统架构的6倍 [45][47][48] - Vera CPU正在打开为Agent构建CPU的全新市场,未来Agent数量将远超人类,该市场规模将比上一个更大 [52][53] - 随着数以百万计的Vera芯片铺向全球,NVIDIA已演变成全球最大的CPU制造商之一 [53] AI工厂与基础设施平台DSX - 世界正在竞相建设AI工厂,这是人类历史上最大规模的基础设施建设,吉瓦级AI工厂建造成本已从200亿~300亿美元暴涨至800亿~1000亿美元 [29] - NVIDIA推出基础设施级蓝图DSX,用于帮助客户设计、仿真、建设和运营AI工厂,通过Omniverse和DSX可在动工前完成布局、电力、冷却等验证 [29] - 在AI工厂中,Token就是收入,算力就是利润,关键指标是“每瓦特产生的代币数量”和“每瓦特带来的营收” [34] - NVIDIA凭借全栈集成与协同设计,帮助客户缩短“首次推理时间”与“首字延迟”,并帮助众多区域型、全球型AI云服务商实现增长,例如估值达500~700亿美元的CoreWeave [36][37] 软件生态与开发工具 - Agentic AI时代是成为软件公司的绝佳时代,NVIDIA的CUDA-X函数库可直接交付给AI智能体调用,效率甚至比人类高 [14] - NVIDIA推出面向企业AI的Agent Toolkit,包括开放模型、可运行Agent的harness、CUDA-X工具库及OpenShell runtime [57] - 每家公司未来都会运行Agent并成为Agent公司,需要一整套安全、可控、可扩展的Agentic AI技术栈 [59] - 与EDA巨头Cadence联合打造的芯片设计超级智能体,可将需要数周的芯片验证与Debug流程缩短至数小时,验证效率暴增40倍 [60][62] 开源模型Nemotron 3 Ultra - 现场首发Nemotron 3 Ultra开源大模型,是全球首款采用SSM与MoE混合架构的前沿大模型 [63] - 该模型运行速度比同级别前沿开源模型快5倍,总体推理成本便宜30%,并向全球开发者开放全部训练脚本及长周期工具调用数据集 [63] - NVIDIA的开放模型策略是让企业可以拿走模型,加入自己的数据和知识,将其变成自己的专有Agent [68] 重塑PC:RTX Spark与全新产品线 - Microsoft和NVIDIA正在重新发明PC,旨在彻底颠覆Windows 40年软件形态 [71][84] - 推出NVIDIA RTX Spark PC生态芯片,由NVIDIA与MediaTek合作打造,拥有RTX GPU、1 PFLOP AI性能、20核NVIDIA Grace CPU、128GB统一内存,采用台积电3纳米制程,共700亿晶体管 [74] - 该芯片让PC首次具备全天候在本地运行“主权智能体沙盒”的能力,现场演示了本地智能体驱动设计工具自动完成工作并修正错误 [77][78] - Adobe针对RTX Spark重新设计Photoshop和Premiere核心架构,速度提升2倍,并通过MCP Server让应用可与笔记本上的Agent交互 [80] - 除笔记本电脑外,还联合微星等推出桌面级Desktop及面向开发者的DGX Station for Windows工作站,后者具备768GB统一内存、20 Petaflops算力和高达8 TB/s的内存带宽 [83] - Microsoft和NVIDIA正在推出一整条100%兼容Windows、CUDA和NVIDIA AI Tensor Core的新PC产品线,覆盖桌面电脑、笔记本电脑和工作站 [84] 物理AI与具身智能 - Agentic AI正从数字世界走向物理世界,本质上是一种数字机器人,未来将有数百亿甚至数千亿个Agentic System运行在世界各地 [85] - Physical AI的核心难题是如何获取、生成和转换物理世界数据,NVIDIA的路径是从人类遥操作示范开始,再进入Omniverse仿真,最终获得能从任意视角理解物理世界的World Foundation Model [88] - 发布Cosmos 3,定位为Physical AI的前沿开放模型,基于Mixture of Transformers架构,能处理像素、动作、声音和语言 [88] - 作为Cosmos 3技术的延伸,发布全球首款具备原生“推理/长考能力”的第二代自动驾驶大模型Alpamayo 2 [92] - 基于NVIDIA Hyperion算力平台与Kalos车载操作系统构建汽车的车企,已占全球汽车总产量的80%;全球97%的智能移动出行服务商已完成与英伟达端到端智能车生态的深度锚定 [94] - 发布专为人形机器人打造的通用基座大模型与全栈参考平台NVIDIA Isaac GR00T,覆盖模型、数据生成、仿真、runtime和操作系统 [96] - Isaac GR00T参考机器人平台面向高校和研究机构,机器人双手每只手有25个自由度,整机有31个自由度,身高约6英尺,体重约150磅,运行Thor计算平台 [98]
两大芯片巨头互攻:英伟达杀入PC市场,英特尔将推更便宜的AI芯片
新浪财经· 2026-06-01 15:26
英伟达与英特尔战略互攻 - 2026年6月1日,英伟达高调进军英特尔深耕数十年的PC芯片市场,同时英特尔强势加码英伟达主导的数据中心与AI芯片赛道,两大芯片巨头战略互攻对方核心业务腹地 [1][5] - 此举标志着全球芯片产业格局正经历深度重构,将推动从PC到数据中心、从硬件到软件的全产业链创新周期 [4][9] 英伟达动态:进军PC芯片与AI生态扩张 - 在台北国际电脑展上,英伟达发布面向Windows PC的全新超级芯片RTX Spark,正式进军个人电脑核心处理器市场,直接挑战英特尔与AMD的行业格局 [1][6] - RTX Spark芯片由英伟达联合联发科设计,采用台积电3纳米制程,集成Blackwell RTX GPU与20核心Grace CPU,拥有6144个CUDA核心和第五代Tensor Core,适配基于微软Arm架构的Windows系统 [1][6] - 该芯片图形处理能力对标RTX 5070移动GPU,CPU性能据称达到Windows平台顶级水准,戴尔、联想、华硕等主流PC厂商计划从今年秋季起陆续推出搭载此芯片的笔记本与台式机产品 [1][6] - 英伟达CEO黄仁勋表示,公司与微软正“重新发明”个人电脑,旨在让本地PC具备独立AI智能代理能力,推动人工智能终端化落地 [2][6] - 行业观点认为,RTX Spark是英伟达将CPU、GPU与本地AI计算深度融合的战略布局,可能从底层架构撼动英特尔在PC x86市场的传统优势,推动PC产业向AI原生计算全面转型 [2][7] - 除PC芯片外,英伟达同日发布新一代AI平台Vera Rubin,该平台已全面投产,采用美光、SK海力士和三星的HBM,提供机柜级一体化AI工厂底座 [5][10] - 英伟达为Vera Rubin搭建的供应链规模是上一代Blackwell平台的“两倍大”,其机架组装时间从Blackwell所需的两个小时大幅缩短至5分钟 [5][10] - 英伟达同时推出新一代开源AI模型与技术组合Nemotron 3 Ultra,配套提供训练数据与开发工具,以降低开发者构建AI智能体的门槛,壮大自身AI生态版图 [5][10] 英特尔动态:强化数据中心与切入AI推理 - 作为对英伟达挑战的回应,英特尔同步推出全新至强6+处理器,这是其首款采用Intel 18A制程开发的数据中心CPU,针对云原生、智能体AI及网络密集型工作负载优化,在性能密度、能效与运营扩展性上实现升级 [2][7] - 英特尔公司高管表示,AI规模化发展是系统层面的协同运作,CPU始终是现代AI基础设施的核心控制平面 [2][7] - 英特尔披露明确的AI芯片规划,计划在2026年年底前推出名为“Crescent Island”的全新AI芯片,该芯片聚焦AI推理任务加速,采用成本更低的内存配置与风冷散热技术 [3][8] - 相较于英伟达和AMD的同类产品,“Crescent Island”有望大幅降低硬件部署与运维成本,英特尔意图凭借性价比优势抢占中端AI推理市场份额,实现差异化竞争 [3][8] - 英特尔发力数据中心CPU与平价AI芯片,对内是完善产品矩阵、巩固数据中心基本盘的选择,对外则是直面英伟达跨界挑战的战略反击 [3][9] 行业影响与格局演变 - PC芯片市场方面,英伟达的进入将打破英特尔与AMD的双强垄断格局,Arm架构芯片借助AI加速渗透,x86与Arm架构的市场博弈将更激烈,终端厂商拥有更多芯片选择,可能推动AI PC产品加速普及 [4][9] - AI算力市场方面,英特尔凭借制程优势、生态积淀与成本控制能力,有望分流AI算力及高端推理市场份额,帮助云服务商与企业用户降低算力采购成本 [4][10] - 巨头跨界竞争将带动产业链上下游协同升级,从制程工艺、芯片架构到整机制造、AI软件开发,整个产业或将迎来新一轮创新周期 [4][10] - 长期来看,英特尔依靠PC芯片和数据中心CPU稳居行业龙头,而英伟达凭借AI GPU崛起并蚕食高端算力市场,此次相互进入对方核心领域,将倒逼双方加速架构革新与技术迭代 [3][9]
刚刚,黄仁勋宣布 Rubin 全面投产,4万名工程师参与构建!史上最强CPU同步亮相
AI前线· 2026-06-01 15:07
文章核心观点 - 英伟达CEO黄仁勋在GTC大会上提出,AI发展已进入“实用AI”时代,AI正从技术展示转变为直接创造经济价值的生产工具 [2][3] - AI的发展范式正从“应用程序时代”转向“智能体(Agent)时代”,计算基础设施、商业模式和软件形态将随之发生根本性变革 [12][20] - 英伟达的战略定位已从GPU芯片供应商,全面升级为提供全栈技术、助力客户构建“AI工厂”生态的AI基础设施公司 [28][35] 行业趋势与宏观判断 - **实用AI时代的经济影响**:AI已成为真正的生产工具,直接影响经济活动。全球约3000万至4000万名专业软件工程师创造约3万亿美元的薪酬价值,其开发的软件支撑着全球接近100万亿美元规模的经济活动 [3][5] - **AI提升生产力与就业**:AI辅助编程工具显著提升软件开发效率。GitHub代码提交量从2023年的3亿次,增长至2024年的4亿次,2025年达到5亿次,2026年前几个月的数据已接近此前水平的数倍增长 [5][7]。AI不会减少就业,反而会因单位劳动力创造价值的能力提升而刺激企业招聘更多开发者 [5][6][8] - **Token成为新盈利单位**:行业关注点从模型能力转向Token(产出)能力。Token已成为能够直接创造收入的盈利单位,驱动全球数据中心建设热潮和算力需求增长 [8][9] - **计算范式变革**:从传统的“应用程序 → 代码 → 操作系统”架构,转向“智能体(Agent) → 大语言模型 → 工具系统”的新架构。未来用户只需向AI解释意图,由AI自动编写代码、调用工具并完成任务 [12][15] 英伟达的战略与产品布局 - **公司定位:全栈AI基础设施公司**:英伟达强调其本质是一家软件公司,并已转型为提供硬件、软件、库及连接全球开发者生态的全栈AI基础设施公司 [22][34][35] - **核心产品:Vera Rubin平台**:该平台是一套面向智能体时代设计的端到端革命性系统,而不仅仅是单一芯片。它整合了GPU、Vera CPU、NVLink 72互连、革命性存储系统、CX-9硬件、DOCA软件栈及安全处理器,现已进入全面量产阶段 [26][37][44] - **供应链与产能**:Vera Rubin平台对应的供应链规模已达上一代Grace Blackwell平台的两倍。组装一套Grace Blackwell机架的时间从约两小时缩短至五分钟,产能和交付速度大幅提升 [39][41] - **Vera CPU**:专为智能体时代设计,针对智能体推理、工具调用、数据库访问等任务优化。在企业SQL数据库处理场景中,性能达到现有平台的约3倍;在实时流处理场景下,性能提升最高可达6倍 [50][52][54] - **开源模型Nemotron 3 Ultra**:推出5500亿参数的开源大模型,采用全球首个SSM与MoE相结合的混合架构。相比现有主流开源模型,其推理速度提升5倍,总体运行成本降低30% [56][58] - **与微软合作重新定义PC**:双方合作三年,旨在重新设计PC底层架构以适应智能体时代。未来PC将内置能理解用户、对话并自主完成任务的AI智能体,大语言模型将成为PC的核心基础组件 [63][65][69] 智能体(Agent)生态与机遇 - **智能体架构**:完整的AI智能体由模型、框架、工具、技能及运行时五大核心部分构成,以解耦、分布式、异构的方式运行 [23] - **催生新软件需求**:智能体时代将催生数量远超今天的软件系统,因为每个企业流程、业务环节甚至个人任务都可能拥有专属智能体。软件不会消失,而是需要以“AI可调用”的形式重新存在,这是软件行业最好的时代之一 [16][17][18] - **CUDA生态的新机会**:英伟达的CUDA库能力可直接被智能体调用,成为Agent执行任务时的工具集。CUDA X库已升级并配套专属AI技能手册,供智能体自主学习以提升解决行业难题的能力 [19][24] - **AI工厂生态**:英伟达提出“AI工厂生态新范式”,其发展重心从传统计算生态升级为服务AI基建的工厂化生态体系。目标是帮助客户搭建超复杂、超大规模的AI工厂基础设施,而不仅是输出GPU或算力系统 [27][28] - **AI工厂的规模与复杂度**:单座1吉瓦(GW)级别的AI工厂建设成本持续攀升,从最初的200亿至400亿美元,上涨至500亿至600亿美元,未来很快将突破800亿甚至1000亿美元 [29] - **赋能合作伙伴与案例**:通过DSX等平台赋能中小企业快速搭建AI云服务能力。案例显示,接入英伟达生态的企业如CoreWeave估值已攀升至500亿至700亿美元区间,并保持高速增长 [30][31][32]