协同设计
搜索文档
黄仁勋三万字采访:展望10万亿市值,3万亿营收
半导体行业观察· 2026-03-24 11:20
公司核心战略与成功之道 - 公司的成功很大程度上归功于其领导者作为工程师和创新者所展现出的强大意志力和卓越决策 [2] - 公司的目标已从打造最好的GPU扩展到对GPU、CPU、内存、网络、存储、电源散热、软件、机架乃至整个数据中心进行极致的协同设计和机架级工程 [2] - 极致协同设计的必要性源于需要解决的问题已无法用单台计算机或单个GPU加速解决 目标是实现比单纯增加计算机数量更快的速度提升 例如增加1万台计算机但希望速度提升一百万倍 [2] - 极致协同设计涉及对整个软件栈进行优化 从架构、芯片、系统、系统软件、算法到应用程序 同时还需协同设计CPU、GPU、网络芯片、交换机、电源和散热等所有组件 [4] - 公司的组织架构直接反映了其产品目标和所处的技术环境 旨在成为生产产品的机器和系统 [4] - 公司采用独特的协作模式 领导者有约60名直接下属且几乎都与工程相关 会议避免一对一 而是集体讨论解决问题 任何关于特定组件的讨论都向所有相关专家开放 鼓励跨领域提出意见 [5] 从加速器到计算平台的演进 - 公司最初是一家加速器公司 但意识到高度专业化会限制市场规模和研发能力 从而影响在计算领域的影响力 [6] - 公司战略是找到一条狭窄的道路 逐步拓展计算能力 同时不放弃核心的专业优势 [6] - 迈向计算平台的关键第一步是发明了可编程像素着色器 第二步是创建了符合IEEE标准的FP32着色器 这吸引了流处理器等领域的开发者 [7] - 为了成为一家计算机公司并建立自己的计算架构 公司做出了一个关键的战略决策:将CUDA集成到面向消费市场的GeForce显卡中 尽管这大幅增加了成本并侵蚀了利润 [7] - 将CUDA集成到GeForce的决定使公司市值从约80亿美元一度跌至15亿美元左右 但最终被证明是公司历史上最英明的决定之一 为人工智能基础设施奠定了基石 [10] - 该决策基于一个核心洞察:计算平台的成功关键在于安装基础(用户群)而非单纯的架构优劣 CUDA通过GeForce建立了庞大的用户基础 [8][9] - 公司通过向大学赠书、开课等方式推广CUDA 最终研究人员和科学家在GeForce显卡上发现了CUDA 并利用其搭建集群 为深度学习革命奠定了基础 [10] 领导力与决策哲学 - 领导者的许多想法源于好奇心 会形成一套逻辑体系让自己确信某个未来一定会发生 并坚信不疑 [11] - 领导者不采用突然宣布重大变革的方式 而是通过日常沟通 利用外部信息、新见解和工程突破 逐步塑造董事会、管理团队和员工的信念体系 当正式宣布时 大家已基本认同 [12] - 这种“幕后领导”的方式也应用于影响行业合作伙伴 例如在GTC主题演讲中塑造行业信念 为产品发布铺平道路 [13] - 公司是一家计算平台公司 采用垂直整合方式设计优化 但将平台的每一层都开放给其他公司集成 因此需要先说服合作伙伴才能开展工作 [14] - 领导者采用名为“光速”的思维方法论 在做任何事前先确定所有事物的物理极限 并用这些极限来测试和权衡设计 追求从第一性原理出发 而非仅仅持续改进 [40][41] 人工智能扩展定律与未来展望 - 公司相信并持续关注多个维度的扩展定律 包括训练前、训练后、测试时间和智能体扩展 [14][15] - 最初人们担心高质量数据量会限制预训练扩展 但公司认为用于训练的数据量将持续扩大 其中很多将是合成数据 最终训练将受限于计算能力而非数据 [15][16] - 公司认为推理(测试时间)是比预训练更困难的计算任务 涉及思考、推理、计划和搜索 因此需要巨大的计算量 [17] - 下一个扩展定律是智能体扩展定律 智能体系统可以派生出大量子智能体 产生更多数据和经验 形成从数据到预训练、后训练、测试再到应用的循环 智能发展的根本限制是计算能力 [18][19] - 为了预测硬件需求 公司进行内部研究和模型开发 并与全球所有人工智能公司合作 了解挑战 同时保持CUDA架构在专业化和灵活性之间的平衡以适应算法变化 [19][20] - 公司快速迭代硬件架构以跟上算法发展 例如为混合专家模型推出NVLink 72 Grace Blackwell机架专为处理LLM设计 而一年后的Vera Rubin机架则专为运行智能体及与工具交互设计 [21] 供应链、能源与工程挑战 - 公司历史上在保持增长的同时还能加速增长 在人工智能计算领域的市场份额正在扩大 因此供应链(包括上游和下游)至关重要 [28] - 领导者花费大量时间与IT行业上下游基础设施公司的CEO们沟通 解释增长动力和未来方向 以指导他们的投资决策 [28] - 公司成功说服了DRAM行业的CEO投资研发HBM内存 尽管其最初使用率很低 并推动将手机低功耗存储器改造用于数据中心超级计算机 [29][30] - 公司最新的机架系统包含130万个组件 由约200家供应商提供技术支持 [30] - 随着系统架构演进 公司将数据中心的超级计算机集成转移到了供应链中的制造环节 这要求供应链增加电力供应以完成制造和测试 [31] - 公司认为电网在99%的时间里有过剩的闲置电力 提议通过设计能够优雅降级的数据中心 利用这些剩余电力 在电网需要时降低数据中心负载 [34][35] - 解决电力瓶颈需要提高每瓦每秒产生的token数量以提升效率 同时公司也致力于降低token成本 其每年下降一个数量级 [28] 竞争护城河与生态系统 - 公司最重要的资产是其计算平台的安装基础 尤其是CUDA的安装基础 这源于公司长期持续的投入、数百万开发者的信任以及庞大的软件库 [56] - 开发者选择CUDA是因为其能带来显著的性能提升(例如十倍) 并能触及数亿用户和计算机 遍布所有云平台、计算机公司、行业和国家 [56] - 公司不仅垂直整合了复杂的系统 还将其水平整合到每一家公司的计算机中 与谷歌云、亚马逊云、Azure、CoreWeave等广泛合作 生态系统覆盖几乎所有行业 [57] - 公司的业务单元已从GPU演进到计算机、集群 再到完整的AI工厂 领导者对未来产品的构想是巨型千兆瓦级装置 [58] - 公司已开始涉足太空计算 GPU已进入太空 用于卫星边缘的AI成像处理 [60] 市场前景与增长潜力 - 计算范式已从基于检索的文件系统转变为基于生成的、需要实时处理token的上下文感知系统 新范式需要比旧世界多得多的处理能力 [63] - 计算机正从“仓库”转变为“工厂” 其产出的token是能创造收入和利润的商品 智能成为一种可扩展的产品 不同价值的token将出现细分市场 [64] - 有人愿意为每百万个token支付1000美元的想法指日可待 [65] - 世界GDP将因生产力提高而加速增长 用于计算的GDP占比可能比过去增长100倍 因为计算已成为产品创造而不仅仅是存储 [65] - 公司有可能在不久的将来成为一家年收入3万亿美元的公司 这不受物理限制 且其供应链生态系统有能力支持这种规模扩张 [66] - 公司增长的最大挑战在于其并非从竞争对手那里抢占市场份额 而是在开拓一个全新的、巨大的市场 这需要行业对未来的想象力 [66]
黄仁勋抛出万亿美元收入预期
第一财经· 2026-03-17 09:21
新芯片平台与产品发布 - 公司推出全新的Rubin芯片平台,该平台包含7颗芯片(包括首次亮相的Groq 3 LPU)和5个机架,共同构成一台AI超级计算机[5][6] - Groq 3 LPU芯片正在由三星全力生产,计划于今年下半年发货[6] - 平台中的Vera CPU是全球首款专为智能体AI和强化学习打造的处理器,效率是传统机架级CPU的两倍,计划部署于阿里巴巴、字节跳动、Cloudflare等云服务提供商[6] - 采用共封装光学器件的Spectrum-X以太网交换机正在全力生产,其相比传统可插拔光学器件,光功率效率提高5倍,容错能力提高10倍[9] - 集成72个Rubin GPU和36个Vera CPU的Vera Rubin NVL72系统,训练大型混合专家模型所需GPU数量是Blackwell平台的1/4,每瓦推理吞吐量提高10倍,每token成本降低至1/10[9] - 公司已建立供应链,每周可生产数千个Rubin系统,用于吉瓦级数据中心[9] - 公司展示了Rubin之后的下一代架构Rubin Ultra,其新机架将通过新的NVLink连接144个GPU[9] 财务预测与市场机遇 - 公司CEO预测,来自Blackwell和Rubin两大芯片平台的收入,在2025年至2027年间将达到1万亿美元,较一年前对2025-2026年的5000亿美元预测翻倍[10] - 公司收入构成中,60%来自超大规模云服务商,40%来自广泛的AI需求,包括区域云、企业云、工业AI、机器人、边缘AI等[10] - 过去两年,AI工作负载所需的计算需求增加了1万倍[13] - 2024年,AI原生初创企业吸引了约1500亿美元的投资,创下历史记录,投资规模已从数百万美元增长至数亿甚至数十亿美元[13] 战略定位与业务生态 - 公司强调其通过协同设计与垂直整合,实现了全球最低的每token成本,并认为未来每家计算机公司和云厂商都会考虑token生产效率[12] - 公司业务覆盖自动驾驶、金融服务、健康与生命科学、工业、娱乐、量子计算、机器人和电信等多个领域,拥有庞大的上下游生态系统[12] - 在汽车领域,公司宣布新增比亚迪、吉利、五十铃和日产四个客户,共同开发基于DRIVE Hyperion平台的L4级别车辆,并与Uber合作将Robotaxi接入其网络[14] - 公司认为自动驾驶汽车的“OpenAI时刻”已经到来,未来Robotaxi的数量将非常庞大[14] 软件、模型与新兴领域布局 - 公司推出开源模型Nemotron 3系列,并与Cursor、LangChain、Mistral AI等成立Nemotron联盟,共同开发开放式前沿基础模型[15] - 在机器人领域,公司推出Isaac仿真框架、Cosmos和Isaac GROOT等新开源模型,其中Cosmos 3是首个统一合成世界生成、物理AI推理和动作模拟的世界基础模型[15] - 在自动驾驶领域,公司推出用于增强推理能力的视觉动作语言模型Alpamayo 1.5[15] - 在医疗领域,公司推出了用于蛋白质结合剂设计的生成模型Protein-Complexa等基础模型和数据集[15] - 针对智能体应用,公司推出集成Nemotron模型和OpenShell运行环境的NemoClaw软件栈,以提供开放模型和隔离沙箱[15] - 在太空计算领域,公司发布Vera Rubin太空模块,其上的Rubin GPU能为天基推理提供比H100高25倍的AI算力[14]
年末 AI 回顾:从模型到应用,从技术到商战,拽住洪流中的意义之线(上)
新浪财经· 2026-02-12 20:12
模型 - 2025年是Agentic Model能力提升的关键一年,大模型的推理、编程和多模态能力持续进步,为复杂智能体应用奠定了能力基础,2025年普遍被认为是Agent应用元年 [27][64] - 推理模型在2025年崛起,标志性事件是DeepSeek-R1于2025年1月20日发布,其影响力远超同日发布的Kimi K1.5和更早的OpenAI o1,成为全球首个在大参数规模上复现o1的推理模型 [7][59] - DeepSeek-R1的成功得益于三个关键因素:完全开源最强旗舰版本、技术报告极其详细、以及高亮了仅557万美元的最后一次训练成本,极低的成本引发了美国政商界广泛关注 [7][59] - 推理模型的效果提升主要体现为多步推理能力,背后的新技术范式是“测试时计算”的扩展,即将更多算力放在模型推理阶段 [9][61] - 编程能力成为支撑通用智能体的关键,Anthropic在2025年2月发布的Claude Code本质上是一个通用智能体,领先于3月初发布的“世界首个通用Agent”Manus,OpenAI、x.ai和Google等巨头也在2025年相继发布了各自的编程应用 [10][62] - 多模态模型已演进为原生多模态,即用单一模型处理文字、图片、语音等信息,代表模型包括2024年的OpenAI 4o、Gemini 1.5以及2025年的Gemini 3和Kimi 2.5,同时中国公司在视频生成模型领域表现突出 [11][63] - 模型竞争的底层是研发组织方式的竞争,“协同设计”成为巨头关键战略,即从芯片、基础设施、算法到应用的垂直整合与优化,Google、阿里和腾讯均在推进此类整合 [13][14][65][66] - DeepSeek展示了极致的工程优化能力,其开源周披露的推理成本引发行业争议,数据显示在24小时内用1800多张GPU卡支持了6000多亿输入Token和近1700亿输出Token,据此计算的毛利率高达84.5% [15][16][67][68] - 算力发展的趋势从比拼单颗芯片性能转向优化多芯片互联系统,华为的384 Matrix超节点和英伟达的NVL72均体现了这一思路 [22][74] - AI研究界已开始深度思考下一代学习范式,认为当前基于海量数据预训练和后训练的方法将触达瓶颈,新的研究方向包括持续学习、在线学习和世界模型等,旨在实现更接近人类的高效、节能学习方式 [23][24][75][76] 应用 - 2025年是智能体应用大规模爆发的元年,主要分为两条主线:以编程能力为核心的通用智能体,以及深入特定行业的垂直智能体 [29][81] - 通用智能体的核心转变是编程从目的变为手段,代表产品包括Anthropic的Claude Code、Claude Cowork、近期风靡的OpenClaw,以及字节跳动的Trae Solo模式、蚂蚁灵光、马卡龙等,它们旨在满足个人工作与生活的自动化需求 [30][31][82][83] - 智能体生态催生了工具链的繁荣,基础设施层出现细分机会,涵盖语音与多模态交互、记忆管理、评估测评等方向,美国硅谷的软件水平分工为此提供了成熟土壤 [40][41][42][43][92][93][94][95][96] - 智能体数量激增后,分发与交易成为新需求,Youware和MuleRun等公司尝试构建社区化平台或交易市场,但目前正从平台模式转向强化工具属性以降低使用门槛 [34][86] - 通用智能体正向移动端渗透,引发手机厂商、超级App与AI公司之间的三方博弈,例如字节豆包手机预览版的自动回微信、比价点外卖功能曾遭微信、美团等超级App封禁 [35][87] - 不同场景的App受智能体影响程度不同,点外卖、订机票等提效需求强的场景受影响更大,但超级App出于广告收入和数据安全考虑对开放接口持谨慎态度,而抖音、小红书等娱乐内容平台受影响较小 [36][88] - 垂直领域智能体正改变商业模式,从“卖服务”转向“为结果收费”,例如法律领域的艾语智能直接承接金融机构案件并按最终收回款项收费,教育领域的爱为舞则将AI老师嵌入在线大班课商业模式 [38][39][90][91] - Sora App代表了AI在非提效类消费端场景的新尝试,其核心功能Cameo允许用户生成数字角色进行创作或合拍,发布初期热度高但留存挑战大,30天留存率低于8%,远低于TikTok的42%和Instagram的38% [44][45][97][98] - 特定创作者群体正在Sora App上沉淀,例如日本创作者Matsumaru利用该工具探索二次元与视觉特效,粉丝量已突破10万 [46][99] - 传统消费端场景也在被AI重塑,例如聊天应用Intent利用大模型实现“默认全局翻译”,语音输入应用Typeless凭借更精准的识别和语境理解脱颖而出 [48][101] - AI for Science领域存在多种探索路径:一是利用机器学习加速第一性原理计算,如深势科技的DeePMD;二是利用生成式AI解决特定科学问题,如AlphaFold;三是发展能够覆盖完整科研流程的科研智能体,迈向“AI发明家”时代 [49][50][51][102][103][104]
英伟达最新动作!10亿美元入股诺基亚 称能看见超5000亿美元芯片收入
第一财经· 2025-10-29 07:33
英伟达与诺基亚战略合作 - 英伟达宣布对诺基亚进行10亿美元股权投资,以每股6.01美元认购166,389,351股新股,获得诺基亚2.9%的股份 [4] - 合作旨在加速AI-RAN创新,推动5G向6G过渡,双方将调整5G和6G软件以在英伟达芯片上运行,并探索在AI基础设施中使用诺基亚数据中心技术 [4] - 合作将基于加速计算和人工智能改变价值3万亿美元的电信产业,升级全球数百万个基站 [2][5] 英伟达新产品与技术发布 - 推出支持6G的加速计算平台Arc Aerial RAN Computer,该平台将作为诺基亚未来的基站架构,并与现有AirScale架构兼容 [4][5] - 宣布推出NVDIA NVQLink技术,支持量子计算机控制、校准和纠错,已有17家量子计算公司支持该技术 [10] - 扩展CUDA-Q以同时支持GPU和QPU,实现微秒级的数据“移动” [10] - 介绍新自动驾驶开发平台DRIVE Hyperion,并与Uber合作将其驱动的车辆连接到全球网络 [12] 英伟达芯片业务进展与财务预测 - Blackwell芯片已进入全面生产,下一代Rubin架构芯片预计明年10月或更早进入生产 [8] - 预计Blackwell和Rubin架构芯片在2024年至2026年期间将带来超过5000亿美元收入,是前代Hopper架构芯片同期收入的5倍 [8] - 该收入预测基于2000万颗GPU的总需求,目前已完成出货600万颗 [8] 英伟达近期其他重大投资 - 近期频繁进行大额投资,包括9月宣布50亿美元入股CPU厂商英特尔,以及计划向OpenAI投资最多1000亿美元 [7] - 对OpenAI的投资合作内容包括部署至少10吉瓦的AI数据中心,这些数据中心将包含数百万块英伟达GPU [7] 市场反应与行业趋势 - 投资与合作消息公布后,诺基亚股价盘中涨超26%,英伟达股价涨超5%,盘中股价超202美元/股,市值达4.92万亿美元创历史新高 [7] - 云服务提供商正投入大量资本开支,推动通用计算平台向加速计算平台转变 [10] - AI产业进入增长循环,使用越多则利润越多,进而推动更多计算资源投入,行业重点是通过协同设计降低AI计算成本 [11]
英伟达最新动作!10亿美元入股诺基亚,称能看见超5000亿美元芯片收入
第一财经· 2025-10-29 07:27
英伟达与诺基亚战略合作 - 英伟达投资诺基亚10亿美元,以每股6.01美元认购166,389,351股新股,获得诺基亚2.9%的股份 [3] - 双方合作旨在加速AI原生移动网络和AI网络基础设施的开发和部署,推动5G向6G过渡 [1][3] - 合作内容包括诺基亚调整其5G和6G软件以在英伟达芯片上运行,英伟达探索在AI基础设施中使用诺基亚数据中心技术 [3] 英伟达新产品与技术发布 - 推出支持6G的加速计算平台Arc Aerial RAN Computer,诺基亚将把NVIDIA-ARC作为未来基站架构 [1][3][4] - 推出NVDIA NVQLink技术,支持量子计算机控制、校准和纠错,已有17家量子计算公司支持该技术 [9] - 推出新自动驾驶开发平台DRIVE Hyperion,并与Uber合作将自动驾驶汽车连接到全球网络 [11] 英伟达芯片业务进展与预测 - Blackwell芯片正在全面生产,下一代架构Rubin芯片预计明年10月或更早进入生产 [7] - 预计Blackwell和Rubin架构在2026年前可带来超过5000亿美元收入,是前代Hopper架构收入的5倍 [7] - 该收入预期基于2000万颗GPU的出货量,目前已完成出货600万颗 [7] 英伟达近期其他重大投资 - 9月宣布50亿美元入股CPU厂商英特尔,双方合作定制芯片 [5] - 9月宣布将向OpenAI投资最多1000亿美元,合作部署至少10吉瓦的AI数据中心,内含数百万块英伟达GPU [5] 行业趋势与公司战略 - 云服务提供商正进行大量资本开支,通用计算平台向加速计算平台转变 [9] - AI思考给基础设施带来巨大计算负载,公司通过协同设计计算机架构、芯片、系统、模型和应用来降低AI计算成本 [10][11] - 全球电信产业规模达3万亿美元,拥有数百万个基站,合作旨在基于加速计算和人工智能改变行业 [1][4]