Reasoning - 财报，业绩电话会，研报，新闻

Reasoning

搜索文档

NVIDIA (NasdaqGS:NVDA) Conference Transcript

2026-03-18 01:02

纪要涉及的行业或公司 * 公司为英伟达 (NVIDIA)，行业涉及人工智能 (AI)、加速计算、半导体、云计算[4][5][6] * 讨论围绕英伟达的AI技术路线图、产品组合、市场战略和财务前景展开[6][14][15] 核心观点和论据 **1 技术拐点与产品路线图** * 当前AI发展处于第三个拐点，即“代理系统 (Agentic Systems)”阶段，其特点是能够自主执行任务，而不仅仅是回答问题[6] * 公司拥有对Blackwell和Rubin产品超过1万亿美元 (over $1 trillion plus) 的强劲需求和可见性，预计在2027年底前将持续获得、预订和交付更多业务[14][15] * 下一代Vera Rubin系统预计将在Groq之前开始发货[60][62] * 公司通过每年一次的产品发布节奏和全栈技术所有权（芯片、平台、软件、网络、存储），维持其竞争优势和快速交付能力[111][112][113] **2 商业模式与价值主张** * 客户购买计算机是为了生产“代币 (tokens)”，因此计算机的价值在于其生产代币的效率和成本，而非计算机本身的售价[17][18] * 公司通过每一代产品提供远超上一代的代币生产价值（每秒代币数、每瓦特代币数），使得客户宁愿以更高价格购买新一代产品，而非低价购买旧一代产品[18] * 公司与超大规模云服务提供商 (CSPs) 的关系是共生共赢：公司为CSPs带来客户（CUDA开发者、AI原生公司），是CSPs最好的销售力量之一[21][22][23] * 公司的业务构成可大致分为60%的超大规模云服务商和40%的区域云、工业、企业本地部署等，而后者完全离不开公司的全栈解决方案[23][24] **3 市场动态与增长驱动** * 2024年是“推理之年 (year of inference)”，公司展示了在推理领域的领导地位[19] * 公司覆盖的AI模型范围大幅扩大，包括OpenAI、开源模型、Anthropic、xAI等，这解释了公司在巨大体量下增速仍在加快[20][21] * 预计整个IT软件行业（约2万亿美元）将被AI改造和转型，未来的IT公司将通过集成AI模型并转售代币来改变商业模式，市场规模可能变得更大[39][40][41][45] * 随着市场成熟和细分，代币生产将出现不同层级和价格点，类似于iPhone或汽车行业的发展路径[68][75] * 物理AI（与实体世界交互）的拐点将在几年后到来，届时工业侧（目前占40%）的需求可能会增长，并最终超过数字AI相关的部分[51][52] **4 产品组合与架构演进** * Groq是一种专注于极低延迟、确定性响应的架构，其芯片上SRAM几乎占据整个芯片面积，但编程不易且不灵活[64][65] * 公司将Groq与Vera Rubin及GPU融合，用于处理自回归模型（如语言模型）的最后阶段，该阶段对带宽要求极高[66] * 增加Groq来处理25%的工作负载，将使客户在GPU计算上的支出增加约25%，这部分未包含在上述1万亿美元可见性中[89][90] * 与Grace Blackwell平台相比，Vera Rubin平台通过增加存储、CPU工具使用等，可能带来额外约50%的市场机会[91] * 公司是当今唯一能跨三种内存（HBM、LPDDR5、SRAM）优化AI工厂架构的公司[84] **5 财务与资本配置** * 公司目前每几天产生10亿美元现金 ($1 billion every couple of days)[93] * 现金使用的优先顺序是：1) 为增长提供资金，包括与供应链的长期合作和预付款；2) 投资生态系统（CUDA开发者、AI原生公司）；3) 在完成前期投资承诺后，通过股票回购等方式回报股东[93][94][96][97] 其他重要内容 **关于训练与推理的展望** * 训练已从预训练 (pre-training) 发展到后训练 (post-training)，后训练涉及的技能学习所需的计算强度可能是预训练的约100万倍[121] * 未来的预训练数据将主要来自合成数据，并且会加入多模态和物理交互[122] * 推理和训练之间的界限将变得越来越模糊，学习与应用将是连续的过程[123] * 公司的希望是未来99%甚至100%的计算资源用于产生经济价值的推理，而非训练[124] * 推理极其复杂且难度在不断上升，公司去年全力投入推理领域正是基于对此趋势的判断[125] **关于竞争与行业格局** * 公司的全栈能力（而不仅仅是芯片）是服务那40%非超大规模云客户的关键，这些客户购买的是平台而非芯片[24] * 公司根据客户意图将其分为三类：想自研芯片的（公司需与之竞争）、想在其云中托管英伟达客户的（公司为其带来客户）、需要购买完整系统的基础设施客户[105][106] * 公司认为其组织架构、使命和能力完全对齐于每年交付复杂AI工厂系统的承诺，这是其能够持续保持领先的原因[110][114] **具体数据与预测** * 工程师的“代币预算 (token budget)”已成为现实，公司认为雇佣年薪30万美元 ($300,000) 的工程师却不消耗代币是不合理的[7] * 有Reddit帖子提到某人的“Claw”一天消耗了5000万代币，成本约为50美元[53] * 公司希望日薪2000美元 ($2,000 a day) 的员工能每天消耗1000美元 ($1,000 a day) 的代币，因为这能极大提升生产力[54] * 当前代币的市场价格点大约在每百万代币6美元 ($6 per million tokens) 左右，但公司认为对于超大型、超快模型，客户愿意支付高得多的价格（如每百万代币50美元）[74] * AI公司（如Anthropic, OpenAI）正以史无前例的速度增长，营收每周增加10亿或20亿美元 ($1 billion or $2 billion a week)[39]

从AlphaGo到DeepSeek R1，推理的未来将走向何方？

机器之心· 2026-02-20 07:43

文章核心观点 - 人工智能正从模仿语言的统计机器，迈向能够进行系统性思考的理解与逻辑操纵系统，这标志着人类社会生产力、组织形态乃至权力结构将面临重构[1] - 机器现已相当擅长编程和思考，通用思考机器能够使用计算机解决几乎任何短周期的数字化问题，这正在开启一个几乎所有计算机科学问题都变得可处理的黄金时代[4][9][13] - 以DeepSeek-R1为代表的新一代推理模型，通过结合强大的基座模型、在线策略强化学习和基于规则的奖励等关键条件，成功实现了推理能力的规模化，其范式已变得相当简单且强大[31][32][38] - 自动化研究和思考将引爆对推理算力的天文级需求，其规模将远超当前水平，并成为未来生产力的核心驱动力[43][44] 人工智能能力演进：从编程到通用思考 - 现代编程智能体（如Claude Code）已能完全替代人类手动编写代码，具备从零实现复杂项目（如AlphaGo、完整网页浏览器）、运行研究实验、优化自身代码乃至尝试证明未解数学问题的能力[5][10][11][12][13] - 这些智能体的优秀调试和问题解决能力源自其推理能力，进而解锁了执着追求目标的能力，使得代码REPL智能体被迅速采用[13] - 进步速度是关键，编程助手将很快强大到可以毫不费力地生成任何数字系统，工程师只需指令AI即可完整复刻一家SaaS公司的所有前端、后端、API和服务[15] 推理的技术本质与发展路径 - 推理可分为演绎推理（从前提必然推导结论）和归纳推理（做出概率性判断），但纯粹的符号推理或贝叶斯网络在现实世界中面临计算成本高、不确定性传播导致结果模糊等问题[18][19][20] - AlphaGo是早期成功结合演绎搜索与深度学习归纳推理的系统，但其应用高度依赖于围棋简单固定的规则集，无法直接应用于语言等模糊领域[22][23][24] - 大语言模型的推理能力发展经历了几个阶段：2022年思维链提示的出现是早期突破；2023年的提示词工程被证明无法让模型从根本上变聪明；2024年初结合树搜索的方法未成主流，瓶颈始终在于模型内部的推理电路本身[26][27][28][29] 新一代推理模型（如DeepSeek-R1）的成功范式 - 核心逻辑简单：从一个强大的基座模型开始，使用在线策略强化学习，针对基于规则的奖励（如数学题、编程测试套件）进行优化，同时设定格式奖励以确保推理过程规范化[31][38] - 该方案成功需要四个关键条件：1) 足够强大的基座模型以采样连贯推理轨迹；2) 使用在线策略RL而非仅监督微调，以在紧密反馈循环中强化“幸运电路”；3) 使用基于规则的奖励而非人类反馈训练的奖励模型；4) 推理算力必须扩大规模以支撑大量长上下文采样[33][34][35] - 一个关键启示是：一个算法在弱初始状态下不起作用，并不意味着在强初始状态下也会得到相同的结果[36] 推理的未来发展方向与行业影响 - 算法仍有简化空间，随着“会思考的LLM”普及，过程奖励模型和基于推理序列的教师强制方法可能卷土重来[40] - 序列化推理计算可能不局限于自回归Token生成，未来可能出现在单次前向传播的各层之间，架构设计可能模糊前向传播、反向传播、自回归解码和离散扩散之间的界限[40][41] - 自动化研究将很快成为高产实验室的标准工作流，使用AI智能体的研究员其生产力将远超手动工作者，“每FLOP的信息增益”极高[43] - 现代编程智能体在教学和沟通方面意义深远，未来每个代码库都可能拥有帮助贡献者快速上手的智能教学命令[43] - 自动化思考将引爆对推理算力的天文级需求，其规模将比当前使用ChatGPT的算力高出好几个数量级，为了满足所有数字愿望将面临巨大的算力短缺[43][44]

Reasoning

Large Language Model

Artificial Intelligence

Artificial Intelligence

AlphaGo

Claude Code

智谱创始人唐杰谈DeepSeek：很震撼，开启了“AI做事”新范式

新浪财经· 2026-01-10 21:54

行业范式转变 - DeepSeek在2025年初的横空出世对研究界和产业界产生了震撼性影响，促使行业重新思考发展方向 [2][5] - 行业认为以Chat为代表的对话范式可能已接近发展瓶颈，未来更多是工程和技术优化，而非范式突破 [2][5] - 行业探索的新范式是从“对话”转向“做事”，即让AI能够实际执行任务，这标志着新范式的开启 [2][5] 公司战略方向 - 智谱AI经过思考后，选择了将AI编程、智能体与推理三大能力进行整合的发展战略 [2][5] - 公司致力于让三大能力相对平衡地发展，而非将它们拆分进行单独研究 [2][5] - 公司于2025年7月28日发布的GLM-4.5模型整合了代码、推理和智能体三项能力 [3][6] 产品与技术进展 - GLM-4.5模型在发布后取得了12项基准测试的国内领先成绩 [3][6] - 公司近期发布的GLM-4.7模型，相比之前的GLM-4.6和GLM-4.5，在智能体和编程能力上实现了大幅度提升 [3][6]

喝点VC｜红杉美国对谈OpenAI前研究主管：预训练已经进入边际效益递减阶段，其真正杠杆在于架构的改进

Z Potentials· 2025-07-04 11:56

AI技术发展现状与趋势 - 预训练、后训练和推理构成AI发展的"三位一体"框架预训练已进入边际效益递减阶段真正杠杆在于架构改进后训练聚焦模型个性与智能表现推理能力训练则引导AI自主摸索链式思维[4][8] - 2025年成为"推理之年" 各大实验室重点转向推理优化但后续进展将越来越困难[5][7] - 预训练收益递减源于基本规律模型智能水平与计算资源呈对数线性增长提升智能需指数级增加计算资源[7][8] Agent商业模式与竞争格局 - Agent价格将趋近计算使用成本普适性和性价比将颠覆传统人力密集型领域[6][18] - 简单重复性任务由AI完成复杂需人类理解的服务保持价值稀缺性[19][26] - 创业公司机会在于构建网络效应和规模经济而非依赖高价Agent[21][26] 机器人技术突破与商业化 - LLMs为机器人提供低成本语言接口结合强大视觉编码器赋予处理通用任务的先发优势[24][25] - 机器人领域正处于研究最后阶段距离商业化仅数月到数年时间[22][25] - 技术突破使机器人能快速解决多样化任务如叠衣服、搬运纸箱等[25] 编程领域变革与未来趋势 - 编程发展呈现非线性加速未来将形成混合模式:人类主导设计+Agent自动编码[32][34] - Agentic工程师处理明确结果的任务如bug修复、代码重构人类负责需"品味"的设计工作[34][35] - 关键挑战在于如何让Agent理解代码库目前仍需人类进行高层次设计[33][35] 专有数据价值重估 - 专有数据价值被高估 "无限智能、无限耐心"的Agent可从公开数据重构替代信息[29][30] - 真正有价值的专有数据是具体客户的深度个性化信息可辅助专业决策而非训练技能[31] - 垂直领域专属模型表现普遍不如下一代通用模型因综合能力远超单纯记忆[29] 企业管理与文化构建 - 技术团队应消除研究员与工程师界限建立平等环境促进全栈理解[37][38] - 管理者核心是真诚关心团队成员建立忠诚度才能推动困难决策[50][51] - 高绩效人才管理需平衡个人创作欲望与团队协作目标[52] AI教育应用与人才培养 - AI最佳应用是帮助用户成为领域专家同时减轻重复性工作负担[42][43] - 教育应聚焦学习过程和自主能动性培养而非特定技能[43][44] - 即时响应式学习能抓住最佳学习时机大幅提升教育效果[46] 安全防御新范式 - AI使攻击能力提升防御措施需更加自主化和智能化[53] - 企业需重构业务流程以适应自主安全系统这为创业公司创造机会[53]

Artificial General Intelligence (AGI)

Artificial Intelligence

Artificial General Intelligence (AGI)

Artificial Intelligence