生成式计算
搜索文档
马斯克对话黄仁勋,“吵起来了”
搜狐财经· 2025-11-21 13:21
核心观点 - 埃隆·马斯克与黄仁勋在美沙投资论坛上就AI与未来社会展开对谈,马斯克预言AI和机器人将带来物质极大丰富,使货币和工作变得无关紧要,而黄仁勋则认为AI将改变而非消除工作,并推动生产力提升和更繁忙的创新活动 [1][2][3] - 沙特正通过大规模建设“AI工厂”等超级算力基础设施,崛起为全球AI计算新高地,这反映了全球AI算力竞赛的加剧和计算范式的转变 [4][5][6] - 黄仁勋从技术演进角度分析,认为当前AI热潮由数据处理需求、生成式AI取代推荐系统、自主智能体兴起三大要素驱动,需求真实可持续,有别于泡沫 [8][9][10] - 中沙在AI领域存在合作机遇,但面临地缘政治、技术差距等挑战,沙特在美中之间寻求平衡以最大化自身利益 [11][12][13] 未来社会与工作的展望 - 埃隆·马斯克预计在10到20年内,工作对人类将不再是谋生手段,而变成一种可选的爱好,货币将变得无用 [1][2] - 马斯克认为,通过大规模应用AI和机器人(如Tesla Optimus),可以消除贫困,实现人人富足,使人类从繁重劳动中解放 [2] - 黄仁勋持不同观点,认为在可见的未来,人类不会因AI而无事可做,AI提高了生产力,人们会涌现更多想法和目标,可能比以前更忙 [2][3] - 黄仁勋相信AI不会让工作消失,但每一份工作的内容都将不同于过去 [3] 沙特AI基础设施与全球算力竞赛 - 沙特AI公司HUMAIN宣布将与马斯克旗下的xAI共同在沙特建设多个超级数据中心,其中包括一座规划容量高达500兆瓦的巨型设施 [4] - HUMAIN计划为这些项目采购60万颗英伟达GPU,规模已属于“AI超级工厂” [4] - 沙特具备土地、能源和资本优势,能源成本低于全球主要经济体,正将算力视为继石油后的新战略资源 [5] - HUMAIN计划2026年投产首批100兆瓦数据中心,2030年前将总规模提升至1.9吉瓦 [5] - 到2030年,沙特一国的AI算力计划规模(1.9吉瓦)预计将达到OpenAI和微软“Stargate”计划(约4.5吉瓦)的三分之一左右 [5] - 黄仁勋将超级数据中心称为“AI工厂”,即输出“智能”的新型工厂,其使命从提供通用计算转向大规模生产AI模型与内容 [5][6] - 生成式AI正在取代过去的推荐算法模式,成为驱动算力需求暴增的核心因素,倒逼全球科技公司建设自有GPU超级计算集群 [6] - 从美国微软、谷歌,到亚洲韩国电信,再到中东沙特、阿联酋,各国都在兴建自己的AI超级中心 [6] - 除英伟达外,AMD已宣布与HUMAIN合作,英特尔CEO也造访利雅得探讨在半导体和AI领域的合作机会 [6] AI热潮的驱动因素与可持续性分析 - 黄仁勋指出支撑AI高速发展的三大要素:其一,全球每年处理原始数据的计算量庞大,耗费数千亿美元,传统CPU无法高效应对,推动全行业转向并行加速计算 [9] - 其二,生成式AI开始替代旧有的推荐算法模式,无论是聊天对话、内容创作还是智能搜索,都需要大规模的GPU算力支持,远超以往需求 [9] - 其三,更具主动性和决策能力的自主智能体(如Grok、GPT-4、Gemini)的兴起,进一步推高了算力需求 [9] - 黄仁勋认为当前市场对AI算力的巨大需求“并没有想象中那么夸张,而且这一切都是有充分理由的”,AI热潮建立在计算技术长期演进和真实需求增长的基础上 [10] - 尽管存在资本市场对“AI概念股”的过度追捧等狂热苗头,但黄仁勋倾向于认为眼下的热潮有别于上世纪末的网络泡沫,需求是真实且可持续的 [10] 中沙AI合作的机遇与挑战 - 在2024年以前,沙特多数新建的数据中心都是通过与中国的合作落地,华为、阿里巴巴、腾讯云等中国企业已参与沙特的云服务和数据中心建设 [11] - 中国企业在通信基础设施、云计算部署方面经验丰富,成本竞争力强,对沙特有吸引力 [11] - 沙特主权基金对中国AI创业公司进行了大额投资,例如参与了智谱AI的融资 [11] - 挑战之一是美国收紧对高端AI芯片出口中东国家的管制,地缘政治因素可能阻碍中沙技术合作 [12] - 挑战之二是技术差距,尖端AI芯片和大模型算法供应商主要来自美国,中沙在高性能计算层面的合作可能需聚焦于中国擅长的应用层和系统集成层面 [13] - 美方凭借前沿技术和财力优势短期占上风,中方则通过长期基础设施投入和政府合作稳步推进,沙特在美中之间寻求平衡以实现利益最大化 [13]
黄仁勋说英伟达在中国的市场份额从95%变成了0
36氪· 2025-10-17 19:21
英伟达的战略愿景与计算范式演进 - 公司创始人提出"未来的计算将是百分之百的生成式",标志着计算范式从检索式向生成式的根本性转变 [2][21] - 生成式AI代表人类首次让机器具备想象力,能够创造内容而非仅仅查找信息,例如生成视频和搜索内容 [21][22] - 这一转变被类比为工业革命中力量的解放,而生成革命则是想象力的解放 [23] 公司发展历程与战略转折点 - 1993年公司采取反主流策略,专注于开发针对极难问题的计算加速器,而非通用处理器 [4][5][6] - 公司将GPU定位为"专业匠人",与作为"通用工人"的CPU形成互补,采用工业革命语言阐述算力逻辑 [7] - 早期通过与游戏公司合作创造3D游戏市场来证明GPU价值,采用先造生态再等市场的策略 [8] - 2000年代推出CUDA平台,将GPU转变为通用计算平台,为AI发展提供土壤 [9][10] - 2012年通过开发cuDNN加速库显著提升神经网络训练速度,推动AlexNet在图像识别领域取得突破 [11][12] AI工厂概念与基础设施战略 - AI工厂核心功能是生产智能而非储存信息,每次训练和推理均属于制造过程 [13] - 公司从设计GPU扩展至设计完整生产体系,涵盖芯片、网络、服务器、软件和算法的一体化协同 [14] - 该概念被类比为工业革命中的蒸汽机厂,AI工厂提供认知动力,成为新工业体系的底层基础设施 [15] 未来企业组织形态与AI管理 - 未来企业将存在人类与AI两类员工,AI作为数字劳动力需要被训练和文化化 [16][17] - 首席信息官角色将转变为AI的HR部门,负责管理AI员工的入职和培训流程 [17] - 企业需要学会管理AI劳动力,重新定义组织边界,这标志着组织革命的开始 [18] 全球市场与地缘政治影响 - 公司在中国市场份额从95%降至0%,出口管制导致完全退出该市场 [19] - 政策制定被指可能导致美国失去全球第二大计算市场,产生伤敌一千自损八百的效果 [19] - 超过一半的AI研究者位于中国,限制其使用美国技术被视为战略性错误 [19] - 技术制裁相当于退出新兴工业秩序,公司尝试用商业逻辑向政策层传递地缘政治观点 [20] 资本动员与行业定位 - 演讲面向掌控全球数万亿美元资金的华尔街投资者,旨在引导资本流向 [1][24][29] - 公司定位为AI时代变革的"炼钢厂",提供算力新资源和生成系统等生产资料 [26][28][30] - 通过构建"AI世界的经济学"框架,将算力定义为新能源,算法为新机器,数据为新原材料 [25][26][27] - 演讲本质是一次资本动员,旨在让投资者将AI视为趋势而非工具,作为新的生产资料进行投资 [30][37]
AI的三个万亿市场 !黄仁勋与红杉资本最新论道: 人工智能的过去、现在与未来 (万字实录全文)
美股IPO· 2025-10-15 20:32
公司创立与战略蓝图 - 公司创立于1993年,基于一个反向洞察:随着晶体管缩小的物理极限临近,世界需要全新的计算方法——加速计算,以解决通用计算不擅长的困难问题 [4][18][19] - 公司面临“先有鸡还是先有蛋”的难题,即新计算架构需要大型市场,而该市场因架构不存在而不存在,因此决定“必须同时发明技术和市场” [5][23][24] - 被创造出的技术是GPU,而被凭空创造的市场是现代3D图形视频游戏,这个价值万亿的娱乐产业为加速计算平台提供了最初的“杀手级应用” [5][25] CUDA平台的诞生与演进 - 在2000年代初,公司意识到GPU处理图形所依赖的物理模拟和线性代数本质是通用数学运算,思考如何将这种强大算力开放给更广阔的科学计算领域 [7][21] - CUDA平台应运而生,它像一座桥梁,让科学家和研究人员能利用GPU的并行计算能力解决复杂问题,极大地缓解了摩尔定律放缓带来的计算瓶颈 [7][28] - 发明一个能与ARM和x86并驾齐驱的全新计算平台极为艰难,花费了近30年时间 [7][28] 引爆AI革命的关键决策 - 2012年深度学习里程碑AlexNet基于GPU取得突破,公司得出结论:深度学习是一个“通用的函数逼近器”,能学习几乎任何函数,解决任何问题 [8][31] - 基于第一性原理判断,公司将整个未来全部押注在深度学习上,结论是计算堆栈的每一层都可以被重新发明 [8][31] - 2016年发布了世界上第一台专为AI设计的超级计算机DGX-1,并将其交付给OpenAI,标志着公司从AI革命的“赋能者”成为“核心基础设施”的建造者 [8][32][34] AI工厂:新一代计算基础设施 - 未来的数据中心将不再是存储信息的仓库,而是生产智能的“AI工厂”,客户从中赚钱 [9][36][37] - 衡量基础设施价值的核心指标变为单位能源所能产生的计算吞吐量,如果每瓦能效提升三倍,公司就能在工厂中产生三倍的收入 [9][36] - Meta等巨头基于GPU的AI推荐系统重建了业务,市值从低谷反弹超过万亿美元,证明了AI工厂是直接的收入引擎而非成本中心 [9][42] AI的下一波浪潮:数字劳动力与物理AI - 第一波是**数字劳动力**,即代理AI,技术将首次直接进入“劳动力”这个从未被软件触及的行业,未来企业将由人类和“数字人类”共同组成 [10][41][46] - 第二波是**物理AI**,即机器人技术,其背后是同一种智能在不同“载体”中的体现,自动驾驶汽车、机械臂或人形机器人均属此类 [10][50][53] - 实现这一未来需要三台计算机:用于训练的AI工厂、用于模拟学习的虚拟世界,以及机器人本身搭载的“大脑”,公司为所有三个环节提供完整计算平台 [10][61] 计算范式的根本转变 - 未来计算的范式将从“检索式”转变为“生成式”,信息不再是被检索,而是被实时生成,从根本上改变了人机交互模式 [11][76][80] - 以Perplexity为例,其提供的所有内容都是完全生成的,而非检索预先编写的内容,这种转变的终极形态是人类自身的实时生成式交互 [11][76][80] - 在这个生成式未来里,与计算机的交互不再是单向命令与执行,而是一种共同创作,计算的终局是无限的生成 [11][80][81] 投资回报与市场规模 - AI投资回报已经显现,Meta在苹果隐私政策冲击后,通过GPU驱动的AI推荐系统重建业务,市值从低谷反弹超过万亿美元 [42] - 对2025年的AI投资落地估计可能高达5000亿美元,AI制造(模型制造者)和应用层蕴含数万亿美元机遇 [40][46] - 企业级代理人工智能增强劳动力,以及物理人工智能,这两个行业约占全球经济的100万亿美元,技术首次能够增强这一领域 [41][46] 技术平台与创新速度 - 公司提供的AI工厂平台包含CPU、GPU、网络处理器、三种类型的交换机以及大量的软件,可构建机架规模乃至建筑规模的系统 [35][37][38] - 公司创新速度快的原因在于协同设计:同时改变算法、软件、网络、CPU和GPU,从而突破放缓的摩尔定律,代际性能提高约10倍 [35][36] - 软件兼容性(如CUDA)是关键优势,使得生态系统能够快速演进,客户可以随心所欲地快速制造芯片 [35][36] 新兴前沿市场与主权AI - 数字生物学是新兴前沿,公司正取得快速进展,例如与Arc合作开发用于细胞表征的基础模型Evo 2,未来可与细胞“对话” [63] - 主权AI趋势明显,各国政府意识到不能外包所有国家数据,每个国家都可能进口、购买并构建自己的主权人工智能 [64][65][66] - 在电信领域,5G和6G将因AI而彻底变革;在量子计算领域,通过创建量子GPU混合计算系统CUDA-Q,可将量子计算机的时间表提前约十年 [63] 被低估的技术与指标 - 华尔街低估的关键绩效指标是AI工厂的单位能源吞吐量,它直接决定了客户的收入,而不仅仅是芯片性能 [83] - 公司平台最被低估的部分是CUDA之上的库,如CUDNN,它可能是人类历史上创建的最重要的库之一,公司约有350个这样的库 [83][84][85] - 用于物理AI学习的虚拟世界Omniverse被严重低估,它正席卷整个机器人行业,是公司大约十年前开始研究的有远见的技术 [85]