CUDNN
搜索文档
AI的三个万亿市场 !黄仁勋与红杉资本最新论道: 人工智能的过去、现在与未来 (万字实录全文)
美股IPO· 2025-10-15 20:32
公司创立与战略蓝图 - 公司创立于1993年,基于一个反向洞察:随着晶体管缩小的物理极限临近,世界需要全新的计算方法——加速计算,以解决通用计算不擅长的困难问题 [4][18][19] - 公司面临“先有鸡还是先有蛋”的难题,即新计算架构需要大型市场,而该市场因架构不存在而不存在,因此决定“必须同时发明技术和市场” [5][23][24] - 被创造出的技术是GPU,而被凭空创造的市场是现代3D图形视频游戏,这个价值万亿的娱乐产业为加速计算平台提供了最初的“杀手级应用” [5][25] CUDA平台的诞生与演进 - 在2000年代初,公司意识到GPU处理图形所依赖的物理模拟和线性代数本质是通用数学运算,思考如何将这种强大算力开放给更广阔的科学计算领域 [7][21] - CUDA平台应运而生,它像一座桥梁,让科学家和研究人员能利用GPU的并行计算能力解决复杂问题,极大地缓解了摩尔定律放缓带来的计算瓶颈 [7][28] - 发明一个能与ARM和x86并驾齐驱的全新计算平台极为艰难,花费了近30年时间 [7][28] 引爆AI革命的关键决策 - 2012年深度学习里程碑AlexNet基于GPU取得突破,公司得出结论:深度学习是一个“通用的函数逼近器”,能学习几乎任何函数,解决任何问题 [8][31] - 基于第一性原理判断,公司将整个未来全部押注在深度学习上,结论是计算堆栈的每一层都可以被重新发明 [8][31] - 2016年发布了世界上第一台专为AI设计的超级计算机DGX-1,并将其交付给OpenAI,标志着公司从AI革命的“赋能者”成为“核心基础设施”的建造者 [8][32][34] AI工厂:新一代计算基础设施 - 未来的数据中心将不再是存储信息的仓库,而是生产智能的“AI工厂”,客户从中赚钱 [9][36][37] - 衡量基础设施价值的核心指标变为单位能源所能产生的计算吞吐量,如果每瓦能效提升三倍,公司就能在工厂中产生三倍的收入 [9][36] - Meta等巨头基于GPU的AI推荐系统重建了业务,市值从低谷反弹超过万亿美元,证明了AI工厂是直接的收入引擎而非成本中心 [9][42] AI的下一波浪潮:数字劳动力与物理AI - 第一波是**数字劳动力**,即代理AI,技术将首次直接进入“劳动力”这个从未被软件触及的行业,未来企业将由人类和“数字人类”共同组成 [10][41][46] - 第二波是**物理AI**,即机器人技术,其背后是同一种智能在不同“载体”中的体现,自动驾驶汽车、机械臂或人形机器人均属此类 [10][50][53] - 实现这一未来需要三台计算机:用于训练的AI工厂、用于模拟学习的虚拟世界,以及机器人本身搭载的“大脑”,公司为所有三个环节提供完整计算平台 [10][61] 计算范式的根本转变 - 未来计算的范式将从“检索式”转变为“生成式”,信息不再是被检索,而是被实时生成,从根本上改变了人机交互模式 [11][76][80] - 以Perplexity为例,其提供的所有内容都是完全生成的,而非检索预先编写的内容,这种转变的终极形态是人类自身的实时生成式交互 [11][76][80] - 在这个生成式未来里,与计算机的交互不再是单向命令与执行,而是一种共同创作,计算的终局是无限的生成 [11][80][81] 投资回报与市场规模 - AI投资回报已经显现,Meta在苹果隐私政策冲击后,通过GPU驱动的AI推荐系统重建业务,市值从低谷反弹超过万亿美元 [42] - 对2025年的AI投资落地估计可能高达5000亿美元,AI制造(模型制造者)和应用层蕴含数万亿美元机遇 [40][46] - 企业级代理人工智能增强劳动力,以及物理人工智能,这两个行业约占全球经济的100万亿美元,技术首次能够增强这一领域 [41][46] 技术平台与创新速度 - 公司提供的AI工厂平台包含CPU、GPU、网络处理器、三种类型的交换机以及大量的软件,可构建机架规模乃至建筑规模的系统 [35][37][38] - 公司创新速度快的原因在于协同设计:同时改变算法、软件、网络、CPU和GPU,从而突破放缓的摩尔定律,代际性能提高约10倍 [35][36] - 软件兼容性(如CUDA)是关键优势,使得生态系统能够快速演进,客户可以随心所欲地快速制造芯片 [35][36] 新兴前沿市场与主权AI - 数字生物学是新兴前沿,公司正取得快速进展,例如与Arc合作开发用于细胞表征的基础模型Evo 2,未来可与细胞“对话” [63] - 主权AI趋势明显,各国政府意识到不能外包所有国家数据,每个国家都可能进口、购买并构建自己的主权人工智能 [64][65][66] - 在电信领域,5G和6G将因AI而彻底变革;在量子计算领域,通过创建量子GPU混合计算系统CUDA-Q,可将量子计算机的时间表提前约十年 [63] 被低估的技术与指标 - 华尔街低估的关键绩效指标是AI工厂的单位能源吞吐量,它直接决定了客户的收入,而不仅仅是芯片性能 [83] - 公司平台最被低估的部分是CUDA之上的库,如CUDNN,它可能是人类历史上创建的最重要的库之一,公司约有350个这样的库 [83][84][85] - 用于物理AI学习的虚拟世界Omniverse被严重低估,它正席卷整个机器人行业,是公司大约十年前开始研究的有远见的技术 [85]
英伟达加速布局欧洲,黄仁勋力推“主权AI”想“搞票大的”
21世纪经济报道· 2025-06-16 20:50
英伟达欧洲AI战略布局 - 英伟达计划与德国电信合作开发欧洲首个工业人工智能云,提供1万枚Blackwell GPU [1] - 公司将在英国设立人工智能实验室,在法国建设配备1.8万个Blackwell GPU的计算中心 [8] - 未来两年计划在欧洲筹建超过20个"AI超级工厂",算力提升10倍 [1] 欧洲AI发展现状 - 欧盟用户严重依赖非欧盟基础设施,可用数据中心容量落后于美国和中国 [3] - 欧洲算力需求基本得到满足,但高度依赖亚马逊、谷歌、微软等美国云服务商 [4] - 2024年欧洲AI融资额达135亿美元,同比增长22%,接近亚洲137亿美元的规模 [7] 欧洲AI自主化需求 - 欧盟提出"人工智能大陆行动计划",计划建设"人工智能工厂"网络 [7] - 欧洲需要自主可控的算力设施,以应对数据主权和地区安全问题 [4][6] - 欧盟宣布"投资AI"倡议,计划调动2000亿欧元用于AI发展 [7] 英伟达的商业模式 - 公司从单纯卖芯片转向提供软硬件捆绑的整体解决方案 [13] - 推出"主权AI"概念,帮助各国建立可控的AI模型体系 [6] - 通过CUDA、CUDNN等工具库支持欧洲开发"自主模型" [10] 实施挑战 - 数据中心建设面临能源短缺、电力人才不足和电网建设流程冗长等问题 [13] - 欧洲AI生态存在资源协调机制低效的短板 [12] - 英伟达缺乏计算服务和传统制造领域经验 [13] 长期影响 - 可能形成以欧洲自主为导向的算力云生态 [14] - 需要同步强化模型、数据和人才等关键能力才能缩小与中美差距 [14] - 算力基建合作是欧洲AI自主的重要起点 [14]