Reasoning
搜索文档
NVIDIA (NasdaqGS:NVDA) Conference Transcript
2026-03-18 01:02
纪要涉及的行业或公司 * 公司为英伟达 (NVIDIA),行业涉及人工智能 (AI)、加速计算、半导体、云计算[4][5][6] * 讨论围绕英伟达的AI技术路线图、产品组合、市场战略和财务前景展开[6][14][15] 核心观点和论据 **1 技术拐点与产品路线图** * 当前AI发展处于第三个拐点,即“代理系统 (Agentic Systems)”阶段,其特点是能够自主执行任务,而不仅仅是回答问题[6] * 公司拥有对Blackwell和Rubin产品超过1万亿美元 (over $1 trillion plus) 的强劲需求和可见性,预计在2027年底前将持续获得、预订和交付更多业务[14][15] * 下一代Vera Rubin系统预计将在Groq之前开始发货[60][62] * 公司通过每年一次的产品发布节奏和全栈技术所有权(芯片、平台、软件、网络、存储),维持其竞争优势和快速交付能力[111][112][113] **2 商业模式与价值主张** * 客户购买计算机是为了生产“代币 (tokens)”,因此计算机的价值在于其生产代币的效率和成本,而非计算机本身的售价[17][18] * 公司通过每一代产品提供远超上一代的代币生产价值(每秒代币数、每瓦特代币数),使得客户宁愿以更高价格购买新一代产品,而非低价购买旧一代产品[18] * 公司与超大规模云服务提供商 (CSPs) 的关系是共生共赢:公司为CSPs带来客户(CUDA开发者、AI原生公司),是CSPs最好的销售力量之一[21][22][23] * 公司的业务构成可大致分为60%的超大规模云服务商和40%的区域云、工业、企业本地部署等,而后者完全离不开公司的全栈解决方案[23][24] **3 市场动态与增长驱动** * 2024年是“推理之年 (year of inference)”,公司展示了在推理领域的领导地位[19] * 公司覆盖的AI模型范围大幅扩大,包括OpenAI、开源模型、Anthropic、xAI等,这解释了公司在巨大体量下增速仍在加快[20][21] * 预计整个IT软件行业(约2万亿美元)将被AI改造和转型,未来的IT公司将通过集成AI模型并转售代币来改变商业模式,市场规模可能变得更大[39][40][41][45] * 随着市场成熟和细分,代币生产将出现不同层级和价格点,类似于iPhone或汽车行业的发展路径[68][75] * 物理AI(与实体世界交互)的拐点将在几年后到来,届时工业侧(目前占40%)的需求可能会增长,并最终超过数字AI相关的部分[51][52] **4 产品组合与架构演进** * Groq是一种专注于极低延迟、确定性响应的架构,其芯片上SRAM几乎占据整个芯片面积,但编程不易且不灵活[64][65] * 公司将Groq与Vera Rubin及GPU融合,用于处理自回归模型(如语言模型)的最后阶段,该阶段对带宽要求极高[66] * 增加Groq来处理25%的工作负载,将使客户在GPU计算上的支出增加约25%,这部分未包含在上述1万亿美元可见性中[89][90] * 与Grace Blackwell平台相比,Vera Rubin平台通过增加存储、CPU工具使用等,可能带来额外约50%的市场机会[91] * 公司是当今唯一能跨三种内存(HBM、LPDDR5、SRAM)优化AI工厂架构的公司[84] **5 财务与资本配置** * 公司目前每几天产生10亿美元现金 ($1 billion every couple of days)[93] * 现金使用的优先顺序是:1) 为增长提供资金,包括与供应链的长期合作和预付款;2) 投资生态系统(CUDA开发者、AI原生公司);3) 在完成前期投资承诺后,通过股票回购等方式回报股东[93][94][96][97] 其他重要内容 **关于训练与推理的展望** * 训练已从预训练 (pre-training) 发展到后训练 (post-training),后训练涉及的技能学习所需的计算强度可能是预训练的约100万倍[121] * 未来的预训练数据将主要来自合成数据,并且会加入多模态和物理交互[122] * 推理和训练之间的界限将变得越来越模糊,学习与应用将是连续的过程[123] * 公司的希望是未来99%甚至100%的计算资源用于产生经济价值的推理,而非训练[124] * 推理极其复杂且难度在不断上升,公司去年全力投入推理领域正是基于对此趋势的判断[125] **关于竞争与行业格局** * 公司的全栈能力(而不仅仅是芯片)是服务那40%非超大规模云客户的关键,这些客户购买的是平台而非芯片[24] * 公司根据客户意图将其分为三类:想自研芯片的(公司需与之竞争)、想在其云中托管英伟达客户的(公司为其带来客户)、需要购买完整系统的基础设施客户[105][106] * 公司认为其组织架构、使命和能力完全对齐于每年交付复杂AI工厂系统的承诺,这是其能够持续保持领先的原因[110][114] **具体数据与预测** * 工程师的“代币预算 (token budget)”已成为现实,公司认为雇佣年薪30万美元 ($300,000) 的工程师却不消耗代币是不合理的[7] * 有Reddit帖子提到某人的“Claw”一天消耗了5000万代币,成本约为50美元[53] * 公司希望日薪2000美元 ($2,000 a day) 的员工能每天消耗1000美元 ($1,000 a day) 的代币,因为这能极大提升生产力[54] * 当前代币的市场价格点大约在每百万代币6美元 ($6 per million tokens) 左右,但公司认为对于超大型、超快模型,客户愿意支付高得多的价格(如每百万代币50美元)[74] * AI公司(如Anthropic, OpenAI)正以史无前例的速度增长,营收每周增加10亿或20亿美元 ($1 billion or $2 billion a week)[39]
从AlphaGo到DeepSeek R1,推理的未来将走向何方?
机器之心· 2026-02-20 07:43
文章核心观点 - 人工智能正从模仿语言的统计机器,迈向能够进行系统性思考的理解与逻辑操纵系统,这标志着人类社会生产力、组织形态乃至权力结构将面临重构[1] - 机器现已相当擅长编程和思考,通用思考机器能够使用计算机解决几乎任何短周期的数字化问题,这正在开启一个几乎所有计算机科学问题都变得可处理的黄金时代[4][9][13] - 以DeepSeek-R1为代表的新一代推理模型,通过结合强大的基座模型、在线策略强化学习和基于规则的奖励等关键条件,成功实现了推理能力的规模化,其范式已变得相当简单且强大[31][32][38] - 自动化研究和思考将引爆对推理算力的天文级需求,其规模将远超当前水平,并成为未来生产力的核心驱动力[43][44] 人工智能能力演进:从编程到通用思考 - 现代编程智能体(如Claude Code)已能完全替代人类手动编写代码,具备从零实现复杂项目(如AlphaGo、完整网页浏览器)、运行研究实验、优化自身代码乃至尝试证明未解数学问题的能力[5][10][11][12][13] - 这些智能体的优秀调试和问题解决能力源自其推理能力,进而解锁了执着追求目标的能力,使得代码REPL智能体被迅速采用[13] - 进步速度是关键,编程助手将很快强大到可以毫不费力地生成任何数字系统,工程师只需指令AI即可完整复刻一家SaaS公司的所有前端、后端、API和服务[15] 推理的技术本质与发展路径 - 推理可分为演绎推理(从前提必然推导结论)和归纳推理(做出概率性判断),但纯粹的符号推理或贝叶斯网络在现实世界中面临计算成本高、不确定性传播导致结果模糊等问题[18][19][20] - AlphaGo是早期成功结合演绎搜索与深度学习归纳推理的系统,但其应用高度依赖于围棋简单固定的规则集,无法直接应用于语言等模糊领域[22][23][24] - 大语言模型的推理能力发展经历了几个阶段:2022年思维链提示的出现是早期突破;2023年的提示词工程被证明无法让模型从根本上变聪明;2024年初结合树搜索的方法未成主流,瓶颈始终在于模型内部的推理电路本身[26][27][28][29] 新一代推理模型(如DeepSeek-R1)的成功范式 - 核心逻辑简单:从一个强大的基座模型开始,使用在线策略强化学习,针对基于规则的奖励(如数学题、编程测试套件)进行优化,同时设定格式奖励以确保推理过程规范化[31][38] - 该方案成功需要四个关键条件:1) 足够强大的基座模型以采样连贯推理轨迹;2) 使用在线策略RL而非仅监督微调,以在紧密反馈循环中强化“幸运电路”;3) 使用基于规则的奖励而非人类反馈训练的奖励模型;4) 推理算力必须扩大规模以支撑大量长上下文采样[33][34][35] - 一个关键启示是:一个算法在弱初始状态下不起作用,并不意味着在强初始状态下也会得到相同的结果[36] 推理的未来发展方向与行业影响 - 算法仍有简化空间,随着“会思考的LLM”普及,过程奖励模型和基于推理序列的教师强制方法可能卷土重来[40] - 序列化推理计算可能不局限于自回归Token生成,未来可能出现在单次前向传播的各层之间,架构设计可能模糊前向传播、反向传播、自回归解码和离散扩散之间的界限[40][41] - 自动化研究将很快成为高产实验室的标准工作流,使用AI智能体的研究员其生产力将远超手动工作者,“每FLOP的信息增益”极高[43] - 现代编程智能体在教学和沟通方面意义深远,未来每个代码库都可能拥有帮助贡献者快速上手的智能教学命令[43] - 自动化思考将引爆对推理算力的天文级需求,其规模将比当前使用ChatGPT的算力高出好几个数量级,为了满足所有数字愿望将面临巨大的算力短缺[43][44]
智谱创始人唐杰谈DeepSeek:很震撼,开启了“AI做事”新范式
新浪财经· 2026-01-10 21:54
行业范式转变 - DeepSeek在2025年初的横空出世对研究界和产业界产生了震撼性影响,促使行业重新思考发展方向 [2][5] - 行业认为以Chat为代表的对话范式可能已接近发展瓶颈,未来更多是工程和技术优化,而非范式突破 [2][5] - 行业探索的新范式是从“对话”转向“做事”,即让AI能够实际执行任务,这标志着新范式的开启 [2][5] 公司战略方向 - 智谱AI经过思考后,选择了将AI编程、智能体与推理三大能力进行整合的发展战略 [2][5] - 公司致力于让三大能力相对平衡地发展,而非将它们拆分进行单独研究 [2][5] - 公司于2025年7月28日发布的GLM-4.5模型整合了代码、推理和智能体三项能力 [3][6] 产品与技术进展 - GLM-4.5模型在发布后取得了12项基准测试的国内领先成绩 [3][6] - 公司近期发布的GLM-4.7模型,相比之前的GLM-4.6和GLM-4.5,在智能体和编程能力上实现了大幅度提升 [3][6]
喝点VC|红杉美国对谈OpenAI前研究主管:预训练已经进入边际效益递减阶段,其真正杠杆在于架构的改进
Z Potentials· 2025-07-04 11:56
AI技术发展现状与趋势 - 预训练、后训练和推理构成AI发展的"三位一体"框架 预训练已进入边际效益递减阶段 真正杠杆在于架构改进 后训练聚焦模型个性与智能表现 推理能力训练则引导AI自主摸索链式思维[4][8] - 2025年成为"推理之年" 各大实验室重点转向推理优化 但后续进展将越来越困难[5][7] - 预训练收益递减源于基本规律 模型智能水平与计算资源呈对数线性增长 提升智能需指数级增加计算资源[7][8] Agent商业模式与竞争格局 - Agent价格将趋近计算使用成本 普适性和性价比将颠覆传统人力密集型领域[6][18] - 简单重复性任务由AI完成 复杂需人类理解的服务保持价值稀缺性[19][26] - 创业公司机会在于构建网络效应和规模经济 而非依赖高价Agent[21][26] 机器人技术突破与商业化 - LLMs为机器人提供低成本语言接口 结合强大视觉编码器 赋予处理通用任务的先发优势[24][25] - 机器人领域正处于研究最后阶段 距离商业化仅数月到数年时间[22][25] - 技术突破使机器人能快速解决多样化任务 如叠衣服、搬运纸箱等[25] 编程领域变革与未来趋势 - 编程发展呈现非线性加速 未来将形成混合模式:人类主导设计+Agent自动编码[32][34] - Agentic工程师处理明确结果的任务如bug修复、代码重构 人类负责需"品味"的设计工作[34][35] - 关键挑战在于如何让Agent理解代码库 目前仍需人类进行高层次设计[33][35] 专有数据价值重估 - 专有数据价值被高估 "无限智能、无限耐心"的Agent可从公开数据重构替代信息[29][30] - 真正有价值的专有数据是具体客户的深度个性化信息 可辅助专业决策而非训练技能[31] - 垂直领域专属模型表现普遍不如下一代通用模型 因综合能力远超单纯记忆[29] 企业管理与文化构建 - 技术团队应消除研究员与工程师界限 建立平等环境促进全栈理解[37][38] - 管理者核心是真诚关心团队成员 建立忠诚度才能推动困难决策[50][51] - 高绩效人才管理需平衡个人创作欲望与团队协作目标[52] AI教育应用与人才培养 - AI最佳应用是帮助用户成为领域专家 同时减轻重复性工作负担[42][43] - 教育应聚焦学习过程和自主能动性培养 而非特定技能[43][44] - 即时响应式学习能抓住最佳学习时机 大幅提升教育效果[46] 安全防御新范式 - AI使攻击能力提升 防御措施需更加自主化和智能化[53] - 企业需重构业务流程以适应自主安全系统 这为创业公司创造机会[53]