生成式计算

搜索文档
黄仁勋说英伟达在中国的市场份额从95%变成了0
36氪· 2025-10-17 19:21
听完,我觉得,他像在讲人类的下一种生产方式。现在,请允许我,把理解后的内容,汇报给你。 黄仁勋这次演讲,质量有点高。 10月6日,他出现在纽约,美国城堡证券(Citadel Securities)举办的一场闭门对话,对话在10天后,也 就是昨天,被公布。 台下坐着华尔街最敏锐的一群人,掌控着全球数万亿美金的资金流;台上,黄仁勋穿着那件标志性的黑 皮夹克,讲了一个横跨30年的故事。 从显卡、到加速计算、再到AI工厂,他几乎重述了整部「人工智能的演化史」。 这场对话密度,像在听一位哲学家回顾工业革命,只不过他谈是算力。最让我印象深的,是他那句几乎 带点预言意味的话: The future of computation is 100% generated.;未来的计算,将是百分之百的生成式。 01 先说说他都说了什么吧;回到了1993年,那个互联网还没普及的年代。 那时所有投资都在押CPU,因为摩尔定律还在,晶体管越做越小,性能就能翻倍。所有人都在追「更通 用、更强大的处理器」。 但他看到的了极限,他说: 通用技术的最大问题,是它往往对「极难的问题',没那么好用」。 所以,他干了一件「反主流」的事,造一个专门为「难 ...
AI的三个万亿市场 !黄仁勋与红杉资本最新论道: 人工智能的过去、现在与未来 (万字实录全文)
美股IPO· 2025-10-15 20:32
公司创立与战略蓝图 - 公司创立于1993年,基于一个反向洞察:随着晶体管缩小的物理极限临近,世界需要全新的计算方法——加速计算,以解决通用计算不擅长的困难问题 [4][18][19] - 公司面临“先有鸡还是先有蛋”的难题,即新计算架构需要大型市场,而该市场因架构不存在而不存在,因此决定“必须同时发明技术和市场” [5][23][24] - 被创造出的技术是GPU,而被凭空创造的市场是现代3D图形视频游戏,这个价值万亿的娱乐产业为加速计算平台提供了最初的“杀手级应用” [5][25] CUDA平台的诞生与演进 - 在2000年代初,公司意识到GPU处理图形所依赖的物理模拟和线性代数本质是通用数学运算,思考如何将这种强大算力开放给更广阔的科学计算领域 [7][21] - CUDA平台应运而生,它像一座桥梁,让科学家和研究人员能利用GPU的并行计算能力解决复杂问题,极大地缓解了摩尔定律放缓带来的计算瓶颈 [7][28] - 发明一个能与ARM和x86并驾齐驱的全新计算平台极为艰难,花费了近30年时间 [7][28] 引爆AI革命的关键决策 - 2012年深度学习里程碑AlexNet基于GPU取得突破,公司得出结论:深度学习是一个“通用的函数逼近器”,能学习几乎任何函数,解决任何问题 [8][31] - 基于第一性原理判断,公司将整个未来全部押注在深度学习上,结论是计算堆栈的每一层都可以被重新发明 [8][31] - 2016年发布了世界上第一台专为AI设计的超级计算机DGX-1,并将其交付给OpenAI,标志着公司从AI革命的“赋能者”成为“核心基础设施”的建造者 [8][32][34] AI工厂:新一代计算基础设施 - 未来的数据中心将不再是存储信息的仓库,而是生产智能的“AI工厂”,客户从中赚钱 [9][36][37] - 衡量基础设施价值的核心指标变为单位能源所能产生的计算吞吐量,如果每瓦能效提升三倍,公司就能在工厂中产生三倍的收入 [9][36] - Meta等巨头基于GPU的AI推荐系统重建了业务,市值从低谷反弹超过万亿美元,证明了AI工厂是直接的收入引擎而非成本中心 [9][42] AI的下一波浪潮:数字劳动力与物理AI - 第一波是**数字劳动力**,即代理AI,技术将首次直接进入“劳动力”这个从未被软件触及的行业,未来企业将由人类和“数字人类”共同组成 [10][41][46] - 第二波是**物理AI**,即机器人技术,其背后是同一种智能在不同“载体”中的体现,自动驾驶汽车、机械臂或人形机器人均属此类 [10][50][53] - 实现这一未来需要三台计算机:用于训练的AI工厂、用于模拟学习的虚拟世界,以及机器人本身搭载的“大脑”,公司为所有三个环节提供完整计算平台 [10][61] 计算范式的根本转变 - 未来计算的范式将从“检索式”转变为“生成式”,信息不再是被检索,而是被实时生成,从根本上改变了人机交互模式 [11][76][80] - 以Perplexity为例,其提供的所有内容都是完全生成的,而非检索预先编写的内容,这种转变的终极形态是人类自身的实时生成式交互 [11][76][80] - 在这个生成式未来里,与计算机的交互不再是单向命令与执行,而是一种共同创作,计算的终局是无限的生成 [11][80][81] 投资回报与市场规模 - AI投资回报已经显现,Meta在苹果隐私政策冲击后,通过GPU驱动的AI推荐系统重建业务,市值从低谷反弹超过万亿美元 [42] - 对2025年的AI投资落地估计可能高达5000亿美元,AI制造(模型制造者)和应用层蕴含数万亿美元机遇 [40][46] - 企业级代理人工智能增强劳动力,以及物理人工智能,这两个行业约占全球经济的100万亿美元,技术首次能够增强这一领域 [41][46] 技术平台与创新速度 - 公司提供的AI工厂平台包含CPU、GPU、网络处理器、三种类型的交换机以及大量的软件,可构建机架规模乃至建筑规模的系统 [35][37][38] - 公司创新速度快的原因在于协同设计:同时改变算法、软件、网络、CPU和GPU,从而突破放缓的摩尔定律,代际性能提高约10倍 [35][36] - 软件兼容性(如CUDA)是关键优势,使得生态系统能够快速演进,客户可以随心所欲地快速制造芯片 [35][36] 新兴前沿市场与主权AI - 数字生物学是新兴前沿,公司正取得快速进展,例如与Arc合作开发用于细胞表征的基础模型Evo 2,未来可与细胞“对话” [63] - 主权AI趋势明显,各国政府意识到不能外包所有国家数据,每个国家都可能进口、购买并构建自己的主权人工智能 [64][65][66] - 在电信领域,5G和6G将因AI而彻底变革;在量子计算领域,通过创建量子GPU混合计算系统CUDA-Q,可将量子计算机的时间表提前约十年 [63] 被低估的技术与指标 - 华尔街低估的关键绩效指标是AI工厂的单位能源吞吐量,它直接决定了客户的收入,而不仅仅是芯片性能 [83] - 公司平台最被低估的部分是CUDA之上的库,如CUDNN,它可能是人类历史上创建的最重要的库之一,公司约有350个这样的库 [83][84][85] - 用于物理AI学习的虚拟世界Omniverse被严重低估,它正席卷整个机器人行业,是公司大约十年前开始研究的有远见的技术 [85]