Workflow
NVIDIA Rubin平台
icon
搜索文档
“世界前所未见”!芯片,突传重磅!黄仁勋最新发声
证券时报· 2026-02-19 17:57
文章核心观点 - 英伟达将在GTC 2026大会上发布全新芯片,旨在巩固其在AI基础设施领域的领先地位,并将技术推向物理极限 [1][3] - 尽管面临市场“AI焦虑”和股价波动,但科技巨头持续高额的资本开支表明,AI“上游卖铲子”的产业叙事阶段仍未结束,英伟达作为核心供应商将持续受益 [10][11][12][13] GTC 2026大会与新品预告 - 英伟达GTC 2026大会将于3月16日至19日在圣何塞举行,核心聚焦AI基础设施竞赛 [1] - 首席执行官黄仁勋预告将揭晓“世界前所未见”的全新芯片,基于Rubin架构的可能性很高 [1][3] - 新芯片旨在将当前技术物理极限推向极致 [3] Rubin平台的技术优势与行业支持 - 英伟达于1月5日正式发布NVIDIA Rubin平台,该平台由六款专为AI超级计算机设计的新芯片组成 [5] - 平台引入五项创新技术,能以Blackwell平台低至十分之一的token成本加速AI发展,在MoE模型训练中使用的GPU数量仅为前代的四分之一 [5] - 多位科技领袖为Rubin平台站台,认可其效率与性能提升 [6] - OpenAI首席执行官Sam Altman认为该平台有助于让先进智能惠及所有人 [6] - Anthropic联合创始人Dario Amodei认为其效率提升是基础设施的重大进步 [6] - 微软、联想等公司计划采用Rubin平台,微软将部署NVIDIA Vera Rubin NVL72系统作为其AI数据中心的一部分 [7][8] - Rubin平台已全面量产,2026年首批云提供商包括AWS、Google Cloud、微软、OCI及多家NVIDIA云合作伙伴 [7] 市场表现与产业叙事分析 - 自2025年10月底高点至2026年2月18日,英伟达股价下跌6.49%,期间最大回撤超20% [11] - 黄仁勋指出“AI末日论”等悲观叙事正在影响现实世界,抑制了部分投资意向 [11] - 华福证券研报指出,“上游卖铲子”阶段叙事仍未结束,2026年中美科技巨头资本开支预计保持高位 [12][13] - 以亚马逊、谷歌、微软、阿里巴巴、腾讯、百度为样本,彭博一致预期其2026年合计资本开支为4044.88亿美元,同比增长约18% [12] - 除腾讯外,其余公司资本开支占经营性现金流比重均超过50% [12] - 科技巨头与英伟达合作深化,例如Meta计划在其数据中心部署数百万颗英伟达芯片,包括Blackwell、下一代Rubin GPU及Grace CPU [12] - AI产业叙事仍处于“上游卖铲子”向“技术新需求”的过渡阶段,尚未完全进入“赋能全行业”的第三阶段 [13]
CES大会Rubin完整发布,科技巨头芯片模型持续迭代
平安证券· 2026-01-14 12:11
行业投资评级 - 强于大市(维持)[1] 报告核心观点 - 在AI模型尺寸和token消耗量持续高速增长的背景下,对AI基础设施的需求持续增加,以英伟达为首的科技巨头通过产品迭代赋能AI发展并享受产业红利 [3][46] - 以Kimi K2 Thinking、DeepSeek V3.2为代表的国产大模型持续迭代,能力提升,正推动国产大模型从“可用”到“好用”,加速在千行百业的应用落地和产业发展 [3][46] - 国产大模型的迭代升级及应用的普及,将带来国产AI算力市场的持续高景气,坚定看好中国AI产业发展前景 [3][46] 英伟达:Rubin平台完整发布与自动驾驶、机器人新进展 - **Rubin平台完整发布**:在CES 2026上,英伟达完整发布了NVIDIA Rubin平台,该平台由Vera CPU、Rubin GPU等六款芯片极致协同设计,旨在打造超凡AI超级计算机 [2][4] - **显著降本增效**:Rubin平台推理token成本最多可降低至Blackwell平台的十分之一,MoE模型训练所需GPU数量仅为Blackwell平台的四分之一 [2][4] - **关键芯片性能大幅提升**: - **Vera CPU**:采用88颗定制核心,系统内存达1.5TB,是Grace CPU的3倍,内存带宽1.2TB/s,数据处理性能翻倍 [12] - **Rubin GPU**:引入Transformer引擎,NVFP4推理性能高达50 PFLOPS,是Blackwell GPU的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍;支持HBM4,带宽达22TB/s,是Blackwell的2.8倍;晶体管数目达3360亿个,是Blackwell的1.6倍 [16] - **NVLink 6 Switch**:每颗GPU实现3.6TB/s的全互连带宽,是上一代的2倍 [18] - **BlueField-4 DPU**:计算性能是上一代的6倍,内存带宽达3倍,GPU访问数据存储速度提升至2倍 [21] - **推出新型AI原生存储**:全新推出搭载BlueField-4 DPU的NVIDIA推理上下文记忆存储平台,专为扩展GPU内存容量和加速代理式AI推理设计,可将每秒处理的token数量和能效提升高达5倍,预计2026年下半年上市 [2][22] - **以太网CPO技术**:NVIDIA Spectrum-X以太网硅CPO交换机系统可将能效和持续运行时间提高5倍,从而降低数据中心总拥有成本(TCO) [2][27] - **自动驾驶领域突破**:发布业界首款面向辅助驾驶的思维链VLA推理模型Alpamayo 1,拥有100亿参数,可部署于车端或作为基础架构 [2][30] - **机器人领域进展**:推出用于物理AI的全新开源模型(如Cosmos系列、Isaac GR00T N1.6),CEO黄仁勋称“机器人开发的ChatGPT时刻已然到来” [2][34] - **机器人硬件升级**:推出全新Jetson T4000模组,将Blackwell架构引入机器人领域,千片单价1999美元,性能较上一代提升至4倍 [37] AMD:推出Helios AI计算机架与未来路线图 - **推出Helios AI计算机架**:在CES 2026上,AMD推出面向Yotta级AI算力需求的新一代机架级平台Helios,采用全液冷设计,重近7000磅 [41] - **Helios强大性能**:每个机架拥有4600个“Zen 6”CPU核心和18000个GPU计算单元,提供2.9 exaflops的AI计算能力,配备31TB HBM4显存,提供260TB/s的纵向扩展带宽和43TB/s的横向扩展带宽 [41] - **核心芯片MI455X GPU**:性能比MI355X提高了10倍,拥有3200亿个晶体管(比MI355多70%),包含12个2纳米和3纳米制程的Chiplet及432 GB的HBM4显存 [43] - **EPYC Venice CPU**:性能和效率将提升70%以上,线程密度提高30%以上 [43] - **未来路线图**:计划于2027年推出下一代MI500系列GPU,将基于CDNA 6架构,采用HBM4E显存和2纳米制程工艺,AMD有望在四年内实现1000倍的AI性能提升 [2][46] 投资建议与关注标的 - **建议持续关注AI主题投资机会** [3][46] - **AI算法和应用标的**: - 强烈推荐:恒生电子、中科创达、盛视科技 [3][46] - 推荐:道通科技、金山办公、科大讯飞、福昕软件、万兴科技、彩讯股份、同花顺、宇信科技 [3][46] - 建议关注:合合信息、鼎捷数智、汉得信息、赛意信息、索辰科技、普联软件、泛微网络、致远互联 [3][46] - **AI算力标的**: - 推荐:海光信息、龙芯中科、工业富联、浪潮信息、紫光股份、神州数码、深信服 [3][46] - 建议关注:协创数据、寒武纪、摩尔线程、沐曦股份、华勤技术、软通动力、拓维信息、中际旭创、新易盛、天孚通信、光库科技、东田微 [3][46] - **自动驾驶标的**: - 推荐:德赛西威 [3][46] - 建议关注:光庭信息、经纬恒润 [3][46]
今日A股三大指数均涨超1% AI概念股爆发 GEO成焦点
搜狐财经· 2026-01-12 18:31
市场行情表现 - 2025年1月12日A股市场强势上扬,三大指数涨幅均超1%,其中沪指上涨1.09%,深证成指涨1.75%,创业板指涨1.82% [1] - AI应用及营销相关概念股集体走高,蓝色光标、汉得信息等多只个股涨停,全市场超200只个股封板 [1] - 此轮行情与近期“生成式引擎优化”(GEO)概念的快速升温密切相关 [1] 生成式引擎优化(GEO)概念 - GEO即Generative Engine Optimization,旨在通过优化内容的语义结构、可信度与多模态适配性,提升品牌信息在AI搜索结果中的引用率与可见度 [3] - 随着豆包、通义千问、元宝等国产生成式AI产品逐渐成为用户获取信息的新入口,传统流量逻辑正在重构,催生新型营销范式 [3] 政策支持与导向 - 工业和信息化部部长李乐成近日表示,智能化是当前信息化与工业化融合的核心驱动力 [3] - 我国将深入实施“人工智能+制造”专项行动,统筹发展通用大模型与行业大模型,培育重点行业智能体和智能原生企业,推动AI在制造业等领域的场景化落地 [3] 技术演进与产业支撑 - 在CES 2026展会上,英伟达宣布其新一代NVIDIA Rubin平台已全面量产,基于该平台的产品将于2026年下半年由合作伙伴推出 [3] - AMD则发布了“Helios”平台及完整的Instinct MI400系列加速器,并预览MI500系列GPU,全球AI算力基础设施持续升级 [3] 大模型与智能体发展趋势 - 大模型竞争正从参数比拼转向实际任务执行能力 [4] - 行业已进入“智能体”(Agent)阶段,强调模型在真实环境中完成复杂任务的能力 [4] - 市场普遍认为,2026年将是AI从“可用”迈向“好用”并实现商业闭环的关键之年 [4]
马斯克:X平台将开源新算法 软件ETF基金(561010)涨停
21世纪经济报道· 2026-01-12 16:46
市场表现与交易数据 - 1月12日市场震荡拉升,三大指数均涨超1%,沪深两市成交额达3.6万亿元 [1] - 软件ETF基金(561010)涨停,上涨9.97%,盘中换手率30.33%,成交额4955万元,市场交投活跃 [1] - 该ETF成分股中,拓尔思、新点软件、科大国创、万兴科技、金现代、星环科技、福昕软件、中科星图等出现20CM涨停 [1] 全球AI算力与算法开源动态 - 马斯克宣布将在一周内正式开源X平台最新的内容推荐算法,覆盖所有用于决定向用户推荐自然内容和广告内容的代码,并计划每四周重复此开源过程 [1] - 在CES 2026展会上,英伟达发布全面量产的NVIDIA Rubin平台,AMD公布"Helios"平台并首次公开MI400系列加速器产品组合,预示全球AI算力基础设施正加速迭代 [1] - 全球AI算力平台能力持续提升的趋势,与大模型持续升级形成共振,将推动AI产业蓬勃发展 [1] 中国AI模型与产业发展 - 以Kimi K2 Thinking、DeepSeek V3.2为代表的国产大模型能力不断提升,有望加快在千行百业的落地进程,进一步促进我国AI产业发展 [1] - DeepSeek计划于2月中旬发布的V4模型在编程任务表现上已超越主流模型,在处理极长代码提示词方面有显著提升,其底层架构创新mHC解决了训练不稳定性问题,为后续应用繁荣提供支撑 [2] AI应用商业化与生态布局 - 互联网大厂加速布局AI应用入口,阿里推出"千问"APP致力于打造个人AI助手,蚂蚁发布全模态助手"灵光",字节跳动旗下豆包日活已过亿 [2] - 火山引擎成为2026年春晚独家AI云合作伙伴,标志着AI应用正从技术探索走向规模化落地阶段,相关产业链将迎来发展契机 [2] 软件ETF基金产品信息 - 软件ETF基金(561010)紧密跟踪中证全指软件开发指数 [2] - 中证全指行业指数将中证全指指数样本按中证行业分类分为11个一级行业、35个二级行业、90余个三级行业及200余个四级行业,再以进入各层级行业的全部证券作为样本编制指数 [2] - 该ETF设有场外联接基金,A类代码020729,C类代码020730 [2]
见证历史!A股,全线爆发!AI,彻底刷屏!还能“嗨”多久?
券商中国· 2026-01-12 15:56
市场表现与交易数据 - 2026年1月12日,A股三大指数集体上涨,沪指涨1.09%收获17连阳,深证成指、创业板指分别收涨1.75%、1.82% [1] - A股市场单日成交额超3.6万亿元,创历史新高 [1] - AI概念股全线爆发,A股市场涨停或涨幅超过10%的AI概念股数量超过150只 [1] - AI营销指数大涨超10%,智谱AI、多模态AI、ChatGPT指数涨超8%,AIGC、AI智能体指数涨超7% [2] - 个股方面,卓易信息、易点天下、蓝色光标等近40只相关概念股收获20%涨停 [2] - 蓝色光标在最近8个交易日内股价涨幅接近130% [2] - 港股AI应用板块也大幅走高,智谱涨近40%,MINIMAX-WP涨近30% [1] 政策与产业催化 - 工信部部长李乐成表示,将深入实施“人工智能+制造”专项行动,统筹布局通用大模型和行业大模型,培育一批重点行业智能体、智能原生企业 [1][2] - 政策旨在加快制造业智能化升级,广泛挖掘人工智能应用场景,以推动制造业高质量发展 [2] - 由清华大学基础模型北京市重点实验室、智谱AI发起的AGI—Next前沿峰会引发市场关注,会议认为大模型竞争已转向能够进入真实环境、完成复杂任务的智能体(Agent)阶段 [2] 行业趋势与机构观点 - 行业普遍预计,2026年将不再是“更强模型之年”,而是模型真正跑通业务流程、创造商业价值的关键年份 [2] - 东方证券指出,2026年AI将从技术革新迈向产业应用落地,其中跨境电商、电商服务率先受益,AI智能眼镜、AI智能硬件等同样受益 [3] - 平安证券表示,全球AI算力平台能力持续提升,与全球大模型持续迭代升级共振,将推动全球AI产业持续蓬勃发展 [6] - 以Kimi K2 Thinking、DeepSeek V3.2等为代表的国产大模型持续迭代,能力提升,正从“可用”向“好用”迈进,加快在千行百业应用场景的落地 [6] - 智谱、MINIMAX等我国大模型算法公司陆续登陆资本市场,未来发展有望加速,大模型商业化进程有望进一步加快 [6] 技术进展与全球动态 - 在CES 2026展会上,英伟达发布NVIDIA Rubin平台并宣布全面量产,基于Rubin的产品将在2026年下半年通过合作伙伴提供 [5] - AMD公布了“Helios”平台并首次公开完整的AMD Instinct MI400系列加速器产品组合,同时预览了新一代MI500系列GPU [5] - 从CES 2026发布的产品看,全球AI算力平台的能力持续提升 [5][6] 具体应用方向展望 - 华源证券认为应重视产品落地且有收入结构的应用方向,包括:AI营销(GEO有望适配AI新入口时代的新型营销范式)、AI短剧和优质内容生成、AI电商、AI陪伴+游戏化方向 [7] - 华创证券指出,2026年将正式迎来端侧AI“GPT4时刻”,AI应用或将在智能驾驶、具身机器人、智能穿戴、赛博宠物以及辅助医疗等领域广泛落地发展 [7]
软件暴力拉升,GEO概念活跃,软件ETF(159852)一键布局AI软件投资机遇
新浪财经· 2026-01-12 11:53
市场表现 - 2026年1月12日早盘,互联网服务、软件开发板块及GEO概念表现活跃,截至11:05,中证软件服务指数强势上涨6.43% [1] - 指数成分股中,中科星图上涨16.05%,合合信息上涨14.97%,卫宁健康上涨14.89%,用友网络、深信服等个股跟涨 [1] - 截至2025年12月31日,中证软件服务指数前十大权重股合计占比60.89%,包括科大讯飞、金山办公、同花顺、指南针、恒生电子、拓维信息、润和软件、三六零、软通动力、深信服 [2] 行业驱动因素 - 全球AI算力基础设施能力持续提升,CES 2026展会上英伟达发布已量产的NVIDIA Rubin平台,AMD公布“Helios”平台并预览新一代MI500系列GPU [1] - 全球AI算力平台能力的提高与大模型迭代升级形成共振,将推动AI产业蓬勃发展 [1] - 以Kimi K2 Thinking、DeepSeek V3.2为代表的国产大模型能力不断提升,加速在千行百业落地应用,我国大模型商业化进程有望进一步加快 [1] 公司分析与比较 - 以MiniMax为代表的中国独立第三方模型厂商在商业化进展上,相比美国领先玩家有较多潜力 [2] - 相比OpenAI的120亿美元年度经常性收入对应5000亿美元估值、Anthropic的50亿美元对应1830亿美元估值,MiniMax在2025年前三季度的5344万美元收入意味着未来在收入端有跨数量级的潜力 [2] - 相比腾讯、阿里、字节从成立到千亿美元市值分别耗时15年、15年、8年,新一代AI企业将有望加速这一进程 [2] 投资工具 - 软件ETF(159852)跟踪中证软件服务指数,是掘金计算机软件行业的便利工具 [2] - 场外投资者还可以通过软件ETF联接基金(012620)布局AI软件投资机遇 [2]
财信证券晨会纪要-20260107
财信证券· 2026-01-07 07:30
市场策略与资金面 - 2026年1月6日,A股市场放量普涨,万得全A指数上涨1.59%,收于6641.77点,全市场成交额达28322.78亿元,较前一交易日增加2650.38亿元 [7][8] - 上证指数上涨1.50%,收于4083.67点,成功突破前高并逼近4100点,连续两个交易日超4000家个股上涨 [7][8] - 分市场看,硬科技板块表现居前,科创50指数上涨1.84%,收于1429.3点,而创新成长板块表现靠后,创业板指数上涨0.75%,收于3319.29点 [7] - 分规模看,中盘股表现居前,中证500指数上涨2.13%,收于7814.14点,而小微盘股表现居后,中证2000指数上涨1.22%,收于3296.8点 [8] - 分行业看,有色金属、非银金融、基础化工板块领涨,而银行、美容护理、通信板块表现靠后 [8] - 市场上涨主要受海外流动性宽松预期升温、全球风险资产回暖以及国内PMI数据边际改善提振信心等因素驱动 [8] - 有色金属板块走强,受伦敦基本金属全线上涨提振,其中LME期锡涨5.32%、LME期铜涨4.96% [8] - 大金融板块(保险、券商、金融科技)拉升,直接受益于市场情绪高涨、活跃度提升及增量资金加快入场 [9] - 短期策略建议投资者提升风险偏好,积极参与“春季躁动”行情,关注大金融、周期(有色、化工)及科技成长(AI应用、半导体、商业航天、机器人)等方向 [10] 基金与债券市场动态 - 1月6日,万得LOF基金价格指数上涨0.94%,万得ETF基金价格指数上涨1.41%,中证REITs全收益指数上涨0.73% [12] - 主要宽基ETF中,华夏上证50ETF上涨1.92%,华泰柏瑞沪深300ETF上涨1.55%,南方中证500ETF上涨2.17% [12] - 商品类ETF表现分化,华安黄金ETF上涨0.86%,国投瑞银白银期货A大幅上涨9.53% [12] - 当日两市ETF总成交额约4979.3亿元,卫星、航天、有色、金融科技、证券等ETF品种表现相对突出 [12] - 债券市场方面,1月6日,10年期国债到期收益率上行2.45个基点至1.88%,10年期国债期货主力合约下跌0.13% [14] 重要宏观经济与政策资讯 - 2026年中国人民银行工作会议召开,强调将继续实施适度宽松的货币政策,加大逆周期和跨周期调节力度,为经济稳定增长和金融市场稳定运行营造良好货币金融环境 [16][17] - 1月6日,央行开展162亿元7天期逆回购操作,操作利率1.40%,鉴于当日有3125亿元逆回购到期,实现单日净回笼2963亿元 [19] - 商务部发布公告,决定禁止所有两用物项向日本军事用户、军事用途及有助于提升日本军事实力的其他最终用户用途出口 [22] - 上海发布《上海市鼓励外商投资企业境内再投资若干措施》,从四个维度提出20条措施,鼓励外商投资企业扩大境内再投资 [23] - 2025年,中国民航全年完成运输总周转量1640.8亿吨公里,同比增长10.5%,旅客运输量7.7亿人次,同比增长5.5%,其中国际航班恢复至2019年90%以上 [25] 行业动态 - **钠离子电池**:2025年全球钠离子电池出货量达9GWh,同比大幅增长150%,应用场景以储能、轻型电动车、启停电源等为主导,中国企业主导全球产业发展,出货量TOP1企业为维科技术 [27] - **人工智能**:英伟达发布全新NVIDIA Rubin平台,该平台由六款专为AI超级计算机设计的芯片组成,引入五项创新技术,可将Token成本降至前代NVIDIA Blackwell平台的十分之一,并已于2026年1月全面量产 [29][31] 公司动态 - **海思科**:公司创新药HSK39297片的上市申请获国家药监局受理,该药为国内第一梯队的针对阵发性睡眠性血红蛋白尿症的CFB抑制剂,并被纳入优先审评审批程序 [33] - **美亚光电**:公司在一起侵害商业秘密纠纷案件中赢得终审判决,获判赔经济损失1.98亿元及维权合理开支95.854万元 [35] - **益生股份**:2025年12月,公司销售白羽肉鸡苗6174.34万只,同比增长39.55%,销售收入约3.00亿元,同比增长43.32%,主要受春节错位影响;同期种猪销售数量为3345头,同比下滑42.85% [37] - **神农集团**:2025年全年,公司共销售生猪307.42万头,实现销售收入47.29亿元,其中12月销售生猪31.41万头,销售收入4.28亿元,商品猪销售均价为11.08元/公斤 [39] - **涛涛车业**:公司发布2025年业绩预告,预计实现归母净利润8.00-8.50亿元,同比增长85.50%-97.10% [41] - **绿联科技**:公司发布2025年业绩预告,预计实现归母净利润6.53-7.33亿元,同比增长41.26%-58.56% [43] 湖南地区经济与公司动态 - **方盛制药**:公司公告2025年特别分红方案,拟向全体股东每股派发现金红利0.15元(含税),合计拟派发现金红利约6586.22万元,占2025年前三季度归母净利润的24.55% [45] - **湖南省重大项目投资**:2025年,湖南省304个省重点建设项目、2372个中央投资项目累计完成投资超5300亿元,其中“三个高地”标志性工程重大项目完成年度投资1418亿元,投资计划完成率达103.3% [47][48]
黄仁勋“带货”Rubin,A股谁有望受益?
天天基金网· 2026-01-06 13:18
英伟达下一代Rubin平台技术细节与量产计划 - 英伟达在CES 2026上披露了下一代计算架构NVIDIA Rubin平台的技术细节[4] - Rubin平台通过六款全新芯片(NVIDIA Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet Switch)的协同设计,旨在缩短训练时间并降低推理成本[4] - 平台引入五项创新,包括最新一代NVLink互连技术、Transformer引擎、机密计算、RAS引擎以及NVIDIA Vera CPU[4] - NVIDIA Rubin已进入全面量产阶段,预计在2026年下半年上市[2][5] - 相比上一代Blackwell平台,Rubin可以将Token成本降低高达10倍[2][5] - 训练混合专家(MoE)模型所需的GPU数量比前代产品减少了4倍[5] Rubin平台的性能提升与合作伙伴 - Rubin平台引入了面向千亿级推理上下文规模设计的NVIDIA推理上下文内存存储平台,由BlueField-4驱动,旨在提高响应能力、吞吐量和能效友好的扩展[5] - 首批计划在2026年部署基于Vera Rubin实例的云服务提供商包括AWS、Google Cloud、微软、OCI以及CoreWeave、Lambda、Nebius、Nscale等英伟达云合作伙伴[5] - 思科、戴尔、HPE、联想和Supermicro预计将推出基于Rubin产品的服务器[6] - 包括Anthropic、Meta、Mistral AI、OpenAI、xAI在内的多家AI实验室正寻求利用Rubin平台来训练更大、功能更强的模型,并以更低的延迟和成本运行长上下文、多模态系统[6][7] 高速互连与光模块产业链布局 - Vera Rubin平台采用NVLink 6高速网络技术,可将GPU互连带宽提升至3.6 TB/s(双向)[9] - 每台NVLink 6交换机的带宽高达28 TB/s,每套Vera Rubin NVL72机柜配备9台此类交换机,总带宽可达260 TB/s[9] - 为扩展机柜,英伟达推出了采用共封装光学器件的Spectrum-X以太网交换机,基于Spectrum-6芯片构建,每颗芯片提供102.4 Tb/s的带宽[9] - 中际旭创表示,自2025年三季度起,重点客户已开始部署1.6T光模块并持续增加订单,预计2026至2027年其他重点客户也将大规模部署[10] - 新易盛表示,公司在手订单充足,预计1.6T产品在2025年第四季度至2026年将处于持续放量阶段,同时3.2T产品处于预研阶段[10] - 天孚通信在CPO相关配套产品方面有较早布局,相关技术持续迭代升级[10] 高功耗带来的散热与供电需求 - 市场普遍估计Rubin GPU的热设计功耗将提升至约1800瓦,这将推高对供电及散热系统的要求[10] - 科华数据具备风冷、液冷、风液融合、UPS及高压直流等数据中心产品解决方案,能满足多种数据中心应用场景[11] - 根据Omdia统计,科华数据位列2024年全球工业UPS第四以及亚太工业UPS市场排名第一[11] - 麦格米特推出了800V Sider car rack方案,单柜功率570kW[11] - 英维克致力于为云计算数据中心、算力设备提供设备散热解决方案,已实现从冷板、快速接头到冷源等“端到端”的产品覆盖[11] - 英维克的UQU快接头产品已成为英伟达MGX生态合作伙伴,并在2025年OCP全球峰会展示了按谷歌规格设计的CDU产品[11] 物理AI与开源生态进展 - 英伟达CEO黄仁勋称“物理AI的ChatGPT时刻已经到来”,公司更注重解决“AI如何走进物理世界”的问题[2][12][13] - 英伟达推出了开源的物理AI世界基础模型Cosmos,该模型已用海量视频、真实驾驶与机器人数据以及3D模拟做过预训练,能理解世界运行规律并关联语言、图像、3D和动作[13] - 在自动驾驶领域,英伟达发布了NVIDIA Alpamayo系列开源AI模型、仿真工具及数据集,引入了基于思维链推理的视觉语言动作模型[13] - 包括Lucid、捷豹路虎、Uber和Berkeley DeepDrive在内的出行领军者对利用Alpamayo开发L4级自动驾驶技术栈表示兴趣[14] - 在机器人领域,包括Boston Dynamics、Franka Robotics、LG Electronics等全球机器人领军企业正基于英伟达Isaac平台和GR00T基础模型开发产品,覆盖工业、手术、人形及消费级机器人[15] - 黄仁勋强调开源AI生态的重要性,以DeepSeek R1为例,指出开源模型的扩散速度极快,尽管能力比最前沿模型慢约半年,但每隔六个月就会追近一次,且下载和使用量呈爆发式增长[15]
黄仁勋CES放出大杀器:下一代Rubin架构推理成本降10倍
机器之心· 2026-01-06 08:31
文章核心观点 - 英伟达在CES 2026上发布了下一代全栈AI技术平台,旨在引领计算行业革新,其核心包括全新的Rubin AI超级计算平台、面向自动驾驶的开源视觉-语言-动作模型Alpamayo 1,以及针对物理人工智能(机器人)的全套开源模型与框架 [1][5][33] 下一代AI超级计算平台:Rubin - 推出全新NVIDIA Rubin平台,包含六款协同设计的芯片:Vera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9 SuperNIC、BlueField-4 DPU和Spectrum-6 Ethernet Switch,目标是构建成本、性能与安全性全面领先的AI超级计算机 [8] - Rubin平台引入五项创新,包括第六代NVLink、Transformer引擎、机密计算、RAS引擎和Vera CPU,其每Token推理成本比前代Blackwell平台低高达10倍,训练MoE模型所需的GPU数量减少4倍 [13] - 平台提供两种主要形态:Vera Rubin NVL72机架级解决方案(集成72个Rubin GPU和36个Vera CPU)和HGX Rubin NVL8服务器主板(通过NVLink连接8个Rubin GPU)[18] - 第六代NVLink每个GPU提供3.6TB/s带宽,Vera Rubin NVL72机架总带宽高达260TB/s;Rubin GPU为AI推理提供50 petaflops的NVFP4计算能力;机架模块化设计使组装维护速度比Blackwell快高达18倍 [17] - Rubin平台已全面投产,基于该平台的产品将于2026年下半年通过合作伙伴上市;首批云服务提供商包括AWS、Google Cloud、微软、OCI及CoreWeave等;服务器合作伙伴包括思科、戴尔、HPE等;Anthropic、Meta、OpenAI等AI实验室计划利用该平台 [19][20] 面向自动驾驶的开源模型与生态:Alpamayo - 发布NVIDIA Alpamayo系列开源AI模型、仿真工具及数据集,旨在加速下一代基于推理的L4级自动驾驶汽车开发 [21][23] - Alpamayo 1是全球首个面向自动驾驶的开源大规模推理视觉语言动作模型,拥有100亿参数,通过视频输入生成行驶轨迹及展示决策逻辑的推理痕迹 [30] - 该模型并非直接车端运行,而是作为“教师模型”供开发者微调和蒸馏,以融入其自动驾驶技术栈;模型权重和推理脚本已开源 [30][31] - 配套开源工具包括:完全开源的端到端高保真仿真框架AlpaSim,以及超过1700小时驾驶数据的物理AI开源数据集,涵盖广泛地域和稀有复杂场景 [31] - 该生态已获得行业支持,包括Lucid、捷豹路虎、Uber等出行领军者;英伟达演示了奔驰新款CLA在旧金山的全自动驾驶,并提及吉利和小米等国内厂商将接入其智能驾驶模型 [32] 物理人工智能与机器人开源生态 - 推出针对物理人工智能的全新开源模型、框架及AI基础设施,旨在加速机器人开发全生命周期,推动构建能快速学习多项任务的通用型专家机器人 [35][36] - 发布多款开源模型,包括:世界模型Cosmos Transfer 2.5与Predict 2.5、推理视觉语言模型Cosmos Reason 2、以及专为人形机器人设计的推理视觉语言动作模型Isaac GR00T N1.6 [40][41] - 发布全新开源框架以简化机器人开发流程:Isaac Lab-Arena框架用于模拟环境中大规模机器人策略评估和基准测试;云原生编排框架OSMO用于统一管理从合成数据生成到测试的工作流 [43][45] - 与Hugging Face合作,将Isaac和GR00T技术集成到LeRobot开源机器人框架中,连接英伟达的200万机器人开发者与Hugging Face的1300万AI构建者 [48] - 多家人形机器人开发商已采用NVIDIA Jetson Thor机器人计算机,包括NEURA Robotics、Richtech Robotics、逐际动力、LG电子、波士顿动力等,以增强机器人导航和操作能力 [50][51]