Vera Rubin架构
搜索文档
AI智能体退烧、国产硬核突围,英伟达再定行业格局
36氪· 2026-03-26 10:33
文章核心观点 科技产业正从“概念炒作”向“价值落地”加速切换,AI智能体热度降温,国产硬核科技实现里程碑式突破,英伟达GTC大会定义了AI产业新方向,生成式AI、航天与能源领域也取得显著进展,行业竞争焦点转向技术创新与场景落地[1][19] AI智能体:从热潮到理性回归 - 行业热度显著降温,OpenClaw(“龙虾”)的GitHub日下载量维持在10万+级别,但“花钱卸载”的用户反馈增多,暴露了稳定性不足、实用性脱节等核心短板[2] - 大厂竞速博弈,字节ArkClaw、腾讯WorkBuddy、阿里CoPaw、智谱AutoClaw等产品密集上线,但许多项目仍停留在“玩具”阶段,难以在ToB领域形成真正的业务价值闭环[4] - 部分产品实现场景落地,字节火山引擎的ArkClaw已服务于头部游戏公司和物流企业,某头部游戏公司用其处理日均超1000万次客服对话,效率提升3倍;欧坚网络实现报关单自动化处理,准确率提升至99.8%[5] - Meta收购的AI智能体公司Manus实现年化营收1.25亿美元,但仍面临“技术适配”挑战[5] 国产硬核科技突破 - 国产侵入式脑机接口NEO系统获国家药监局批准三类医疗器械证,打破国外垄断,进入商业化临床阶段[6] - NEO系统采用硬脑膜外微创植入与无线供能通信技术,信号精度和响应速度量级提升,已在全国11家医院完成32例临床植入,所有患者均实现脑控抓握,22例患者经过6个月训练后自主手部运动功能明显改善[8] - 上海“洪荒70”全高温超导托卡马克实现1337秒稳态运行,刷新商业核聚变世界纪录,国产化率超96%[8] - 解放军总医院与MIT联合研发的磁控纳米机器人完成全球首例无创溶栓临床应用,直径仅200纳米的机器人可在15分钟内精准清除血栓[8] - 阿里达摩院玄铁C950 RISC-V芯片实现5nm工艺突破,单核性能破70分,综合性能较上代提升3倍[8] NVIDIA GTC 2026与AI产业方向 - 英伟达GTC 2026大会以“Physical AI(物理世界AI)、AI Factories(AI工厂)、Agentic AI”为核心主题,展现其向“全链路AI生态”的转型[9] - 大会发布Vera Rubin架构路线图,涵盖Vera CPU、Rubin GPU等六款新芯片,组成“AI超级计算机”,行业预测2027年基于该架构的芯片订单规模有望突破万亿美元[11] - 英伟达与Oracle达成深度合作,通过GPU加速技术优化Oracle云服务,扩大在AI推理与边缘计算领域的优势[11] - 英伟达3月下旬股价维持在175-180美元区间,总市值达4.34万亿美元[11] 生成式AI的迭代与竞争 - 行业竞争从“参数规模”转向“效率提升”与“场景适配”[13] - Luma AI推出的Uni-1模型采用单解码器自回归Transformer架构,在RISEBench推理基准测试中整体得分超越谷歌Nano Banana 2,空间推理能力提升23%,逻辑推理能力达到竞品的2倍,同时将2K图像生成成本降低25%[13] - 依托Uni-1构建的Luma Agents智能创意平台已与阳狮集团、阿迪达斯等企业合作,将原本需要1年、耗资1500万美元的广告campaign压缩至40小时完成,成本不到2万美元,效率提升超200倍[13] - OpenAI推进GPT-5.4优化,其100万token+原生Agent能力成为重要里程碑[14] - AI教父安德烈·卡帕西的工作流已“完全代理化”,通过AI智能体完成编程、调研等核心工作[14] - 生成式AI在ToB落地中仍面临“数据治理混乱、价值难以衡量”的问题[14] 航天与能源领域进展 - 3月26日,太原卫星发射中心用长征二号丁运载火箭成功发射四维高景二号05/06星,进一步完善我国高分辨率商业遥感星座[16] - 欧核中心首次用卡车成功运输反质子,打破了反质子运输的技术瓶颈,为反物质研究与应用开辟新路径[18]
英伟达可能被迫重新设计Feynman人工智能芯片平台
新浪财经· 2026-03-23 21:03
行业供应链瓶颈 - 半导体供应链正变得越来越紧张,制造产能而非需求正成为人工智能发展的主要瓶颈 [2][4] - 对先进2纳米制程电路的需求极为旺盛,台积电的产能至少到2028年已被完全预订 [1][3] - 英伟达和Meta等大型人工智能公司都在争夺同一批尖端生产线,这使得人工智能产品的供应全面趋紧 [1][3] 公司产品与计划 - 英伟达可能被迫重新设计其下一代Feynman人工智能芯片平台 [1][3] - Feynman平台于2025年首次亮相,计划于2028年发布,旨在取代英伟达的Vera Rubin架构 [1][3] - 任何设计变更都可能影响该平台的性能目标、发布时间或成本结构 [1][3] 行业成本与定价 - 由于需求旺盛,台积电还可能提高价格 [1][3] - 价格上涨将给已在应对不断攀升的人工智能基础设施成本的芯片制造商带来更大压力 [1][3] 市场关注点 - 随着英伟达为其下一个重要平台发布做准备,投资者可能会密切关注有关其制造计划和合作伙伴关系的消息 [2][4]
英伟达龙虾登场!黄仁勋暴论频出,「人车家天地芯」冲击万亿收入
36氪· 2026-03-17 17:47
文章核心观点 - 英伟达在GTC 2026上宣布其战略重心全面转向智能体(Agentic AI)时代,并发布了专为此设计的Vera Rubin架构及一系列芯片、系统和软件,旨在构建一个从底层硬件到上层应用、从地面到太空的完整智能体生态系统,巩固并扩大其在AI时代的统治地位 [6][8][39][96] 英伟达Vera Rubin架构发布 - 发布专为智能体AI和强化学习时代打造的全新Vera CPU,其效率是传统机架式CPU的两倍,速度提升50% [16] - Vera Rubin架构包含七款芯片:Vera CPU、Rubin GPU、NVLink™ 6交换机、ConnectX-9超级网卡、BlueField-4 DPU、Spectrum™-6以太网交换机及新集成的Groq 3 LPU [17] - 包含五套机架系统:Vera Rubin NVL72机架、Vera CPU机架、Groq 3 LPU机架、BlueField-4 STX存储机架及Spectrum-6 SPX以太网机架 [17] - Rubin GPU单片芯片拥有高达288GB的海量内存,用于装载超大语言模型和处理海量上下文KV缓存 [19] - 新一代NVLink带宽翻倍至260TB/s,并推出全新Kyber机架,在一个NVLink域内直接互联144张GPU [20] 智能体操作系统与开源生态 - 黄仁勋判断开源项目OpenClaw将堪比这个时代的Linux或HTML,是一套能调用大模型、管理任务、协调子智能体并进行多模态沟通的智能体操作系统 [28] - 每一家SaaS公司最终都将转变为“智能体即服务”(AgaaS)公司,CEO必须思考自己的OpenClaw战略 [31] - 为解决企业安全顾虑,英伟达联合推出NeMoClaw参考架构,内置OpenShell等技术,让企业能在私有环境中安全运行智能体系统 [33][35] - 英伟达提供一整条开源模型产品线,包括Nemotron(语言推理)、Cosmos(世界建模)、Groot(通用机器人)、Alpha Mayo(自动驾驶)、BioNeMo(数字生物学)、Earth-2(AI物理仿真),并将持续迭代更新 [37] - 宣布与Black Forest Labs、Cursor、LangChain、Mistral、Perplexity、Sarvam及Thinking Machines等合作伙伴共同推进Nemotron 4研发 [37] 算力架构创新与性能突破 - 为应对智能体对极致低延迟的需求,英伟达通过Dynamo软件首创“解耦推理”,将推理任务的前段Prefill和Attention交给Vera Rubin处理,后半段Decode卸载给Groq LPU以降低延迟 [24][30] - 在高阶推理层级,这种组合使性能提升35倍,每兆瓦吞吐量也提升35倍 [26] - Grace Blackwell NVLink 72的实际每瓦性能提升达到50倍,远超摩尔定律预期的约1.5倍 [74] - 通过更新算法与软件,Fireworks等服务商的token生成速度从每秒700个跃升至接近5000个,提升7倍 [80] 重塑数据处理与数据中心 - 英伟达发布底层杀器cuDF,用GPU并行算力直接处理结构化数据,绕过传统CPU [59] - 发布针对向量数据库和非结构化数据的cuVS,旨在用AI方式重新定义企业数据处理方式 [61] - 雀巢公司采用英伟达加速的IBM Watsonx.data后,处理全球供应链数据的速度提升5倍,成本降低83% [61] - 英伟达通过深度嵌入云端的算法库,使云服务巨头(Google Cloud、AWS、微软Azure、Oracle)成为其算力和框架的分销渠道 [62] - 发布NVIDIA DSX平台,基于Omniverse数字孪生技术,在虚拟空间中仿真整座AI工厂以优化设计,配合Max-Q技术动态调节功耗与算力 [76][77] 市场前景与收入预测 - 根据黄仁勋判断,到2027年底,其Blackwell和Rubin芯片将至少创造1万亿美元收入,且实际需求可能远超此保守估计 [69] - 高难度推理被视为AI领域最重要且最难的事,因为它直接带来收入增长,英伟达为此彻底改变架构并优化整个技术栈 [71][72] - 未来每一家公司都会认真思考其“token工厂”的效率问题,因为算力即收入本身 [80] 垂直整合与生态构建 - 英伟达自称为世界上第一家“垂直整合,却又水平开放”的公司,向下自造芯片和系统,向上深入理解各行业应用场景 [63][64] - 其业务覆盖金融量化交易、医疗研发、电信边缘计算等多个行业,并通过机密计算技术打消企业数据安全顾虑 [65] - 公司通过将自身封装成底层算法库,像水电一样接入全球基础设施,看似分享利润,实则掌握AI时代命脉 [67] 物理AI与自动驾驶布局 - 黄仁勋宣告自动驾驶的“ChatGPT时刻”已经到来 [85] - RoboTaxi Ready平台新增比亚迪、吉利、五十铃、日产四位伙伴,这四家车企年产量合计约1800万辆,加上已有的梅赛德斯、丰田和通用,覆盖全球重要整车制造商 [86] - 与Uber签署协议,计划将无人出租车部署至多个城市并接入其全球出行网络 [88] - 在工业机器人领域与ABB、Universal Robots、库卡等合作,卡特彼勒的加入意味着重型工程机械走向智能化 [88] 前沿探索与未来愿景 - 英伟达Thor芯片已通过抗辐射认证并应用于卫星,正与合作伙伴研发名为NVIDIA Space-1 Vera Rubin的新型计算机,目标是在太空中建设数据中心 [81] - 与迪士尼、Google DeepMind联合研发的Newton物理引擎,用于在Omniverse中训练机器人(如雪宝),使其适应现实物理规律,未来迪士尼乐园角色将拥有真正智能并与游客互动 [91] - 从游戏显卡到AI算力,英伟达用20年时间“造了一台造风机”,如今已化身为永不停歇的Token生产厂,算力即权力,生态即壁垒 [47][96]
黄仁勋狂扔“王炸”:1万亿营收、太空芯片、一键“养虾”…李彦宏牵头的AI生命科学公司被曝赴港上市;永辉公开喊话山姆丨邦早报
创业邦· 2026-03-17 08:09
AI行业战略与产品发布 - 英伟达CEO黄仁勋在GTC大会上宣布,计算需求进入“百万倍增长”阶段,并将2027年前算力需求预测从**5000亿美元翻倍至1万亿美元**,提出“代币工厂”概念,认为未来数据中心将生产智能代币 [2] - 英伟达发布下一代**Vera Rubin**架构,采用全液冷设计及Vera CPU,整合Groq确定性流处理器技术,通过Dynamo软件实现“解耦推理”,使吉瓦级工厂代币生成速度提升**350倍** [3] - 英伟达推出开源项目**OpenClaw**,将其定义为AI时代的Linux,是支持AI智能体自主调用工具、执行代码的操作系统级框架,并推出NeMo Claw参考设计,推动软件产业从SaaS向AaaS转型 [3] - 英伟达披露下一代GPU架构**Feynman**,将搭载LP 40处理器和Rosa CPU,支持共封装光学技术,并宣布进军太空计算,研发Vera Rubin Space-1计算机 [4] - 英伟达发布**DLSS 5**,引入全新的实时神经渲染模型,黄仁勋称其为图形学领域的“GPT时刻”,将手工渲染与生成式AI融合 [22] - 智谱宣布推出面向OpenClaw龙虾场景的基座模型**GLM-5-Turbo**,并上调新模型API价格**20%**,粗略计算2026年第一季度智谱API价格已涨**83%** [11] - 智谱在海外官推宣布将发布首个专为龙虾OpenClaw场景深度优化的通用大模型**GLM-5-Turbo**,受此消息影响公司股价开盘大涨**10个点** [25] - 马斯克的AI初创公司**xAI**正在招聘银行家和私募信贷人员,以提升其Grok聊天机器人在金融策略方面的能力 [14] 公司组织与战略调整 - **阿里巴巴**正式成立Alibaba Token Hub事业群,建立以“创造Token、输送Token、应用Token”为核心目标的新组织,由CEO吴彦宏直接负责,覆盖从基础模型研发到个人与企业端AI应用的完整布局 [4] - **Meta**计划大规模裁员,员工规模或缩减**20%**,以抵消人工智能基础设施的巨额投入 [4] - **OpenAI**与TPG、贝恩资本等多家私募股权公司深入洽谈,拟成立一家合资企业,将其企业产品进行推广,该拟议交易的投前估值约为**100亿美元**,私募股权投资者将投入约**40亿美元** [12] - **安能物流**发布声明,否认网传“中通快运将并购安能”的消息,称相关内容失实 [12] - 前金立集团全球副总裁**俞雷**已正式入职MOVA,任手机和AI硬件业务负责人 [9] - **许思敏**接手杭州娃哈哈保健食品公司,宗庆后卸任法定代表人、董事长 [12] - **郭德纲**名下的上海魔德文化传媒工作室登记状态由存续变更为注销 [16] 资本市场与融资动态 - 由百度支持、李彦宏牵头创立的生命科学AI大模型公司**百图生科**被曝已秘密向香港联交所递交上市申请,有望筹集**数亿美元**资金 [5] - **Meta**与AI云公司Nebius签署新的五年期AI基础设施供应协议,协议总价值最高可达近**270亿美元**,其中**120亿美元**为专用计算能力,Meta承诺在五年内购买最高**150亿美元**的剩余可用计算能力 [5][6] - **蚂蚁集团**发起的对耀才证券的要约收购已获中国有关部门批准,预计将于3月30日完成交割,交易总金额为**28.14亿港元** [11] - **地瓜机器人**完成**1.2亿美元** B1轮融资,A轮与B轮两轮融资总额达到**2.2亿美元**,新进资方超过15家 [20] - **汇天**完成了近**2亿美元**的新一轮股权融资,此轮融资后历史股权融资总额约**10亿美元** [20] - **蓝芯算力**连续完成A轮系列融资,总金额达**数亿元人民币**,其自研的RISC-V+AI融合架构智算服务器CPU已成功点亮 [20] - **天鹜科技**完成超**2亿元**的A+轮融资,本轮由中国石油昆仑资本等机构联合领投 [20] - **中科融合**宣布完成新一轮近**亿元**融资 [22] - **佰特微医疗**完成近**亿元** B轮融资 [22] 行业合作与商业进展 - 英伟达自动驾驶平台**NVIDIA RoboTaxi Ready**新增比亚迪、现代等合作伙伴,覆盖年**1800万辆**新车,并与Uber达成部署协议 [3] - 八家科技巨头包括**谷歌、亚马逊和OpenAI**签署新的《反网络诈骗服务协议》,承诺共享有关诈骗者滥用其服务的威胁情报 [19] - **自变量机器人**与58集团合作,全球首个机器人保洁员在深圳正式“上岗”,由58到家平台调度阿姨与机器人组成搭档提供服务 [24] - **拓竹科技**与泡泡玛特就IP版权相关问题达成和解,相关问题内容已全面下架 [8] - **字节跳动**因版权纠纷暂停在全球推出其最新视频生成模型**Seedance 2.0** [11] 市场数据与产品销售 - 2026年2月,中国国内游戏市场实际销售收入为**332.31亿元**,同比增长**18.96%**,同比增速创近10个月新高 [25] - 2026年2月,中国客户端游戏市场实际销售收入达**88.7亿元**,同比增长**56.75%** [25] - 2026年2月,中国移动游戏市场实际销售收入达**227.29亿元**,同比增长**9.05%** [25] - 2026年2月,中国自主研发游戏在海外市场的实际销售收入达到**21.14亿美元**,同比增长**40.46%** [25] - 2026年2月份皮卡市场销售**4.1万辆**,同比下降**13.2%** [25] - **苹果公司**宣布推出Airpods MAX 2,将于3月25日起接受订购 [25] 企业运营与公关事件 - **永辉超市**自有品牌发布致山姆的公开信,呼吁山姆不要让供应商“二选一”,反对不正当竞争 [6] - **刘文祥麻辣烫**针对多地门店存在食材问题发布致歉信,宣布对涉事门店立即停止合作,全国门店开展自查自纠 [6] - **哈啰租电动车**平台在315晚会曝光违规解除限速后,已下架所有租赁电动车,并启动内部自查 [11] - 央视315晚会曝光的**乖媳妇鸡爪**关联公司,其股东名下关联8家企业,其中4家已注销或被吊销 [11] - **乐刻健身**就“安心付”、退款违约金存在隐形条款一事道歉,称已启动全面排查与整改工作 [14] - **黄天鹅**董事长冯斌直播回应“角黄素”质疑,称给鸡喂万寿菊是为了天然地让鸡蛋更好看,公司声明检出的角黄素含量为**0.399mg/kg**,属于天然本底水平 [19]
深度|黄仁勋对话Cisco CEO:未来十年算力将提升100万倍;写代码只是打字,领域知识才是你的“超级力量”
搜狐财经· 2026-02-15 17:00
AI计算范式重构 - 行业正经历60年来首次计算范式的重塑,从显式编程转向隐式编程,用户只需向计算机传达意图,计算机将自动解决问题[4][5] - 整个计算堆栈正在被重新发明,从通用计算转向人工智能[5] - AI的进步速度远超摩尔定律,摩尔定律10年提升100倍,而AI 10年提升100万倍[4][20] AI工厂与战略合作 - 英伟达提出了“AI工厂”的概念,并与思科等合作伙伴共同推进[4] - 思科将整合英伟达的AI网络技术到其Nexus平台,以提供高性能AI能力,同时保留思科的可控性、安全性和可管理性[15] - 双方在计算、网络和安全等计算支柱领域进行深度合作,旨在重塑企业计算[15] 企业AI转型路径与心态 - 企业应假设算力是无限且光速的,并以此心态去重新解决公司内部最有影响力、最困难的核心工作[4][20][21] - 在技术部署初期,不应过度纠结于精确的ROI论证,而应允许员工在安全环境下进行广泛实验,实行“让百花齐放”的策略[4][16][17] - 创新并不总是在受控状态下发生,企业应施加影响而非强加控制,过早修剪(集中资源)可能会选错方向[4][16][17][18] AI驱动的核心价值与护城河 - 企业真正的护城河在于理解客户、理解问题的“领域专业知识”,这是AI无法凭空产生的最高价值,而写代码只是一种会被AI取代的“商品”[4][40] - 公司应利用AI彻底改变其核心工作,例如芯片设计、软件工程和系统工程[19] - AI降低了获得智能的成本,创造了智能的“丰饶”,过去需要一年的工作,现在可能一天就能完成[20] 智能的构成与AI演进 - 智能由感知、推理和计划三部分组成,感知是第一步,涉及理解多模态的上下文[24][25] - 计算机视觉(如AlexNet)的突破是AI发展的关键里程碑,它证明了深度学习可以解决没有原则性算法的复杂问题[25][26] - 自监督学习的突破使AI能够自我学习,不再受限于人工标注,推动了模型参数从几亿扩展到几万亿的规模爆炸[26] 从检索式到生成式的软件未来 - 软件正从“预录制”(检索式)时代转向“生成式”未来,因为每个语境、用户和提示都不同,每一秒的软件都是不同的[29] - 生成式AI意味着输出是实时、动态且前所未有的,如同当前的对话序列[29] 物理AI与未来机遇 - 下一代“物理AI”将需要理解物理世界、因果关系(如重力、质量)的模型,这与当前大型语言模型的知识不同[38] - AI的最新突破之一是“工具使用”,AI应学会使用现有工具,而非重新发明物理定律[37] - 自动驾驶汽车等“数字劳动力”代表了一个比传统IT行业(约一万亿美元)大得多的市场机遇,全球经济总量约为一百万亿美元[39] 企业AI部署与数据主权 - 企业对于AI部署应采取混合策略,既租用云端资源,也拥有部分本地基础设施,特别是涉及数据主权和专有信息的部分[42] - 公司最宝贵的知识产权往往是其“问题”,而非答案,因此许多内部对话和问题应保持私密,不适合完全放在云端[43][44] - 企业应将“AI in the loop”融入流程,使其捕捉员工的生命经验,使公司每天都变得更聪明,并将这些经验沉淀为公司的永久知识产权,而非坚持“Human in the loop”[4][45] 行业定位与公司转型 - 所有公司都有机会应用AI技术成为技术公司,技术应成为其超级能力,而原有领域只是应用场景[39] - 公司应摆脱受原子(物理)限制的思维,转向处理电子(数字)的“电子公司”模式,以实现价值的大幅增长[39][40] - 领域专业知识是企业的核心优势,现在可以通过隐式编程(用自然语言表达意图)让计算机执行任务,而将写代码这类商品化工作交给AI[40]
深度|黄仁勋对话Cisco CEO:未来十年算力将提升100万倍;写代码只是打字,领域知识才是你的“超级力量”
Z Potentials· 2026-02-15 11:06
文章核心观点 文章记录了NVIDIA创始人黄仁勋在思科AI峰会上的对谈,核心观点是计算范式正在发生60年来的根本性重塑,从“显式编程”转向“隐式编程”,人工智能将彻底改变企业运营、创新方式和价值创造[10][31]。企业应拥抱这一变革,将AI深度融入核心流程,利用其“丰饶”的智能来重塑最具影响力的工作,并在此过程中构建以领域专业知识为核心的、可持续的竞争优势[6][24][44]。 计算范式重构 - **从“显式编程”到“隐式编程”**:计算范式正经历60年来首次根本性重塑,从编写具体指令的“显式编程”转向向计算机传达意图、由其自动解决问题的“隐式编程”[6][10] - **从“预录制”到“生成式”**:传统软件是“预录制”的、静态的,而未来的软件将是“生成式”的,根据不同的上下文、用户和提示实时生成,每一次交互都是独特的[33] - **软件栈全面革新**:整个计算堆栈(Computing Stack)正在被重新发明,以支持新的人工智能范式[10] 人工智能的发展与影响 - **性能提升速度**:摩尔定律在10年内带来100倍的性能提升,而人工智能在10年内带来了100万倍的提升,创造了智能的“丰饶”[6][25] - **智能的核心要素**:智能由感知、推理和计划三部分组成,当前AI的突破在于从仅依赖记忆和泛化,发展到能够使用工具、进行调研和制定计划来解决问题[11][12][29] - **Physical AI的机遇**:下一代“物理AI”将能理解物理世界、因果关系和工具使用,其潜在市场(TAM)将远超万亿美元规模的IT行业,触及百万亿美元规模的全球经济[42][43] 企业AI转型策略 - **超越早期ROI论证**:在技术部署初期,很难用传统电子表格精确计算投资回报率,企业不应过度纠结于此而错失机遇[6][21] - **“让百花齐放”的创新文化**:鼓励员工在安全环境下广泛实验各种AI模型和应用,允许一定程度的“失控”,以激发创新,之后再适时进行整合与聚焦[6][21][22] - **聚焦核心,应用“丰饶”思维**:企业应识别并聚焦于内部最有影响力、最困难的核心工作,并假设算力是无限且光速的,以此心态去重新思考和解决这些问题[6][25][26] - **从“Human in the loop”到“AI in the loop”**:不应仅将AI视为工具,而应将其深度融入业务流程。AI将捕捉员工的经验,使公司日益智能化,并最终将这些经验沉淀为公司永久的知识产权[6][49] 未来的价值与护城河 - **领域专业知识是终极价值**:写代码(编程)将变成一种可被AI替代的“商品”,企业真正的护城河在于理解客户、理解问题的“领域专业知识”,这是AI无法凭空产生的最高价值[6][44] - **问题比答案更珍贵**:对公司而言,最宝贵的知识产权往往不是答案,而是所提出的问题,这代表了公司的思考方向和关注的优先级[48] - **数据主权与部署策略**:出于隐私和主权考虑,公司的专有信息和对话应保持私密。企业应采用混合策略,结合云端和本地(On-prem)部署,尤其对于敏感核心部分,应考虑构建自有AI能力[47][48] - **成为“电子公司”**:各行各业都应利用AI技术成为技术公司,将技术作为超级能力,而原本的业务领域作为应用场景。摆脱“原子”(物理)的限制,拥抱“电子”(数字)的无限性,能带来价值的大幅跃升[43][44]
黄仁勋来华,英伟达牵手“钻石”材料破解 AI 算力散热难题
DT新材料· 2026-01-31 00:06
文章核心观点 - 在AI算力爆炸时代,高功率电子器件的热管理已成为制约性能的关键瓶颈,以金刚石及其复合材料为代表的高导热材料是解决该问题的核心方向,并已正式切入全球AI算力核心供应链 [2][4] - 英伟达与台积电等业界领导者正通过材料创新(如金刚石、碳化硅)与先进封装/冷却技术(如微通道盖、直接液体冷却)的协同设计,推动热管理从“辅助工程”向定义算力天花板的“核心变量”演变,目标是实现“零界面”热阻以支持未来功耗高达2000W-5000W的AI芯片 [25][33][49][50] 金刚石热管理材料体系 - **单晶金刚石**:热导率高达2000~2200 W/m·K,是铜(约400 W/m·K)的5倍以上,被誉为热管理“终极材料”,在AI数据中心、激光器热沉等领域潜力巨大,但面临成本高、制备尺寸受限及界面传热效率等产业化挑战 [6][7] - **金刚石-铜复合材料**:典型热导率可达450-600 W/m·K,通过将金刚石颗粒引入铜基体实现高导热与良好加工性的平衡,热膨胀系数接近SiC,适用于芯片散热、高功率半导体封装等领域,但界面热阻和成本是关键挑战 [9][10][13] - **金刚石-铝复合材料**:典型热导率约440-530 W/m·K,密度(3.1-3.2 g/cm³)低于金刚石/铜,实现了轻量化与高导热的结合,适合航空航天、便携式高功率设备等对重量敏感的应用 [9][14] - **金刚石/SiC复合基板**:具备高导热、热膨胀匹配等优点,是理想的电子封装材料,例如Coherent Corp在2025年推出的专利材料热导率超过800 W/m·K,是铜的两倍,专为AI数据中心和高性能计算系统设计 [16][17] 金刚石半导体封装热管理解决方案 - **散热需求与材料优势**:常见半导体材料(如Si、SiC、GaN)热导率通常不超过500 W/m·K,而大功率器件功率密度可达1000 W/cm²,局部热点功率密度甚至是平均值的5~10倍,金刚石作为最高热导率的热沉材料,是提高散热能力的未来方案 [18] - **直接连接工艺**:旨在充分发挥金刚石高导热性,主要方式包括在半导体上直接沉积金刚石膜,或通过低温键合将半导体外延层与金刚石衬底结合,后者降低了制备难度,但对表面平整度(粗糙度<1 nm)要求极高,目前仅在毫米尺度芯片上成功,难以大规模应用 [21][22] - **间接连接封装**:作为成熟工艺,使用焊料、低熔点中间层或纳米银低温烧结等方式进行芯片与基板间的连接,其中纳米银烧结技术的研究热点在于实现硅芯片的大面积低温无压/低压连接 [23][24] 未来散热终极方案:台积电与英伟达的战略路线 - **散热挑战**:英伟达Blackwell B300的TDP已达1400W,未来Rubin架构功耗将逼近2000W-5000W,在CoWoS等先进封装中,热量需穿越多个功能层和界面,分层热界面导致热量无法100%有效传递,形成局部热点,累积热阻是限制芯片最大功率输出的主要因素之一 [25][27][31][33] - **材料解决方案**:核心是引入高导热材料以缩短热路径并降低界面热阻,具体包括:1) SiC衬底,导热系数~370–490 W/m·K;2) 金刚石薄膜/CVD金刚石,导热系数1000–2200 W/m·K,适合>500 W/cm²的热通量场景;3) 铜-金刚石复合材料,通过液固分离技术实现极高导热性 [35][36][42] - **结构创新与冷却技术**:通过增加热交换表面积来增强散热,主要方向包括:1) 微通道盖(MCL),英伟达预估下一代Vera Rubin架构可能搭载;2) 直接液体冷却(DLC),台积电将微流控结构直接集成到芯片背面;3) 热界面材料(TIM)向“零界面”热阻的终极目标演变 [44][46][48] - **协同设计范式**:台积电专注于发展TIM、硅集成微流控技术及引入SiC/金刚石衬底,英伟达强调MLCP、系统级液体冷却及散热与封装架构的共同设计,两者目标趋同于降低热阻和增加有效散热面积,标志着散热解决方案从系统层面向芯片/封装层面集成的范式转变 [49][50]
JPM2026|英伟达与礼来宣布共建AI联合创新实验室,加速重塑药物研发范式
GLP1减重宝典· 2026-01-14 23:14
合作概述 - 英伟达与礼来在2026年摩根大通全球医疗健康峰会上宣布,将合作成立一家面向未来的AI联合创新实验室 [4] - 该实验室旨在通过人工智能、加速计算与自动化技术,系统性解决制药行业在药物发现、开发及制造过程中的核心瓶颈 [4] - 双方计划在未来五年内,在人才引进、基础设施建设及算力资源等方面联合投入最高可达10亿美元 [4] 实验室定位与目标 - 实验室将组建世界一流的跨学科团队,汇聚顶尖科学家、生物学家、化学家、AI研究人员与工程师 [4] - 目标是探索人工智能在生命科学领域的下一阶段应用 [4] - 实验室设立于旧金山湾区,采用共址办公模式,以深度融合礼来的药物研发专业能力与英伟达的AI及计算优势 [6] - 双方希望通过高频协作与实时反馈,共同推进新一代药物研发工具和工作流程的落地 [6] 技术架构与核心平台 - 实验室将以英伟达BioNeMo平台为核心,结合英伟达下一代Vera Rubin架构,构建面向生命科学的先进AI基础设施 [6] - 团队将通过持续生成和利用大规模高质量数据,训练覆盖生物学与化学领域的基础模型和前沿模型 [6] - 此举旨在显著加速新分子的发现、优化与验证过程 [6] - 英伟达创始人黄仁勋表示,合作旨在计算环境中大规模探索生物学与化学空间,使科学家能在实际合成分子前更高效评估潜在路径 [6] 合作愿景与战略意义 - 礼来董事长戴文睿指出,合作将礼来近150年积累的专有数据和科学洞察与英伟达的计算能力和模型工程经验结合 [7] - 合作有望从根本上改变传统药物研发的节奏和方式 [7] - 通过在协同环境中汇聚全球顶尖人才,双方将突破单一组织能力的边界,探索前所未有的创新空间 [7] 研发体系与工作模式 - 合作初期将重点打造一个贯穿实验与计算的持续学习系统,将礼来的智能湿实验室与计算驱动的干实验室紧密连接 [8] - 该系统旨在实现全天候AI辅助实验,将实验设计、数据生成与模型训练纳入持续迭代的闭环 [8] - 生物学家和化学家将能在AI支持下快速调整假设、优化实验路径 [8] - 项目将拓展礼来此前公布的AI超级计算机计划,并引入包括英伟达Vera Rubin在内的最新硬件架构 [8] 应用扩展至全价值链 - 除药物发现外,合作计划将人工智能进一步引入临床开发、生产制造及商业运营环节 [9] - 将探索多模态模型、代理式AI、机器人技术与数字孪生在制药全价值链中的应用 [9] - 通过在AI工厂中引入物理AI和机器人系统,礼来旨在提升高需求药品的生产能力并增强供应链稳定性 [9] - 借助英伟达Omniverse平台与RTX PRO服务器,礼来可构建生产线与供应链的数字孪生模型进行模拟与优化 [9] 生态建设与行业影响 - 联合创新实验室将成为双方创新生态的重要支点,为科研人员和初创企业提供深度专业支持与大规模计算资源 [10] - 英伟达通过Inception项目为初创企业提供技术指导及算力支持 [10] - 礼来的Lilly TuneLab平台基于公司数十年专有数据为生物技术企业提供定制化药物发现模型,未来将整合英伟达Clara生命科学开源模型 [10] - 相关研发工作预计将于今年年初在南旧金山正式启动 [10]
四大芯片巨头现身联想大会,杨元庆黄仁勋宣布新合作
观察者网· 2026-01-07 17:51
联想与英伟达深化合作推出AI云超级工厂 - 联想集团与英伟达在CES 2026上共同宣布,将携手推出“联想人工智能云超级工厂”,旨在深化双方合作伙伴关系 [1] 合作计划的核心目标与架构支持 - 该计划旨在赋能AI云服务商更快上线下一代AI工作负载与应用,推动客户大规模从研发迈向生产 [4] - 计划将AI工厂的边界拓展至吉瓦级,以简化云级基础设施部署,用更高的效率和可预测性加速AI进入生产环节 [4] - 该计划不仅支持英伟达Blackwell架构,还将支持其最新发布的Vera Rubin架构 [4] 英伟达Vera Rubin架构的技术细节 - 英伟达为Rubin平台重新设计了6款芯片,包括Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9超级网卡、BlueField-4 DPU及Spectrum-6以太网交换机 [4] - Rubin GPU芯片搭载第三代Transformer引擎,其NVFP4推理算力达到50 PFLOPS,是Blackwell架构的5倍,目前已进入量产 [4] - 通过六款新芯片的协同设计,大幅缩短了训练时间并降低了推理token成本 [4] 合作提供的全栈能力与预期效益 - 双方将携手交付全栈计算平台,为Agentic AI系统提供动力,覆盖从云端、本地数据中心到边缘及机器人系统的各个领域 [7] - 该计划将帮助云服务提供商极大缩短“time to first token”的AI部署时间,并可迅速扩展规模至十万台GPU,支持万亿参数级别的智能体和大语言模型 [7] 双方对AI发展趋势的判断与合作规模预期 - 联想集团与英伟达管理层认为,下一阶段人工智能发展有两大趋势:企业级AI将成为核心战场,混合式AI是关键突破点;AI将全面渗透至实体经济各领域,带来巨大市场机遇 [7] - 过去数年,两家公司在AI领域的合作规模已经增长了5倍,英伟达CEO预计未来两年完全有能力再翻五倍 [7]
黄仁勋2026第一场演讲,点赞中国3个大模型
36氪· 2026-01-07 11:24
文章核心观点 - 英伟达CEO黄仁勋在CES演讲中,将焦点从消费级显卡转向物理AI,并宣布了公司在开源模型、自动驾驶及下一代计算架构方面的重大进展,标志着AI正从数字世界走向物理世界,并进入大规模产业部署阶段 [1][5][17] 开源模型的崛起与影响 - 开源模型的崛起彻底改变了人工智能,成为全球创新的催化剂,其中DeepSeek R1的出现意外推动了整个行业的变革进程 [2] - 全球开源模型性能正快速逼近顶尖水平,目前仍落后最顶尖的闭源模型约6个月,但差距在逐步缩短 [4] - 演讲中展示了多款开源大模型,其中包括三款中国大模型:Kimi K2、DeepSeek V3.2和Qwen(千问)[2][6] 物理AI与自动驾驶进展 - 物理AI被定义为AI发展的第四阶段,它能够在物理世界中学会思考物理因果关系,其“ChatGPT时刻”已经到来 [8] - 英伟达发布全球首个开源自动驾驶推理模型Alpamayo,与特斯拉FSD展开竞争,该模型引入视觉-语言-行动模型,首创“决策——因果——推理”因果链,能生成自然语言解释决策逻辑 [8] - 搭载Alpamayo技术的奔驰CLA,将在今年第一季度在美国上市,之后逐步进入欧洲和亚洲市场 [8] - 公司认为,在接下来的10年里,世界上很大一部分汽车将是自动驾驶的、高度自动驾驶的 [9] - 特斯拉CEO马斯克指出,达到99%的准确率很容易,但要解决分布的长尾部分(如极端天气、突发障碍物)超级难,而特斯拉FSD凭借海量真实驾驶数据拥有优势 [9][10] 下一代计算架构Rubin - 英伟达下一代超级计算架构Vera Rubin正式登场,其创新在于“六款芯片协同设计”,共同执行计算、思考、数据处理、网络通信等任务 [11][13] - 在推理任务下,Rubin GPU性能达到50 PFLOPS(每秒5000万亿次运算),是Blackwell的5倍;训练性能达到35 PFLOPS,是Blackwell的3.5倍 [13] - 对比H100的性能约4 PFLOPS,Rubin有巨大提升 [14] - Rubin推理成本降低了10倍,花更少钱、用更少的时间,干更多的活 [15] - 上一代Blackwell需要一个月完成Alpamayo模型的训练,Rubin仅需一周;在Rubin上跑Alpamayo,推理延迟降低至1毫秒 [15] - Vera Rubin架构已经全面进入量产阶段 [16] 行业趋势与意义 - 中国开源大模型的崛起,让大模型不再是少数巨头的游戏 [17] - 物理AI的突破,让AI从虚拟走向实体 [17] - Rubin架构的诞生,让高效能、低成本的智能部署成为可能 [17] - 三者交织之下,AI正从实验室走向工厂、道路、社区,成为重塑产业、改变生活的核心力量 [17]