Token经济学 - 财报，业绩电话会，研报，新闻

Token经济学

搜索文档

锦秋集· 2025-07-04 23:35

文章核心观点 - AI行业的核心瓶颈是计算资源的稀缺，这制约了各家公司的发展 [1] - AI服务的定价本质上是延迟、吞吐量和上下文窗口三个性能指标的权衡游戏 [2][3] - DeepSeek和Anthropic采取了不同的策略来应对计算资源限制，反映了行业面临的共同挑战 [4][5] - 随着推理云服务的崛起，如何在有限计算资源下实现技术突破和商业成功的平衡成为关键 [5] AI服务定价机制 - AI服务的定价由三个关键性能指标决定：延迟（用户等待时间）、吞吐量（每秒生成token数）和上下文窗口（模型记忆容量） [3][22][23] - 通过调整这三个参数，服务商可以实现任何价格水平 [24] - 单纯比较每百万token价格意义不大，需结合实际应用场景和用户需求 [24] DeepSeek的策略分析 - DeepSeek选择极端配置：数秒延迟、每秒25个token输出速度、64K上下文窗口，换取极低价格和最大化研发资源 [4][26][28] - 官方平台用户流失29%（从614.7M降至436.2M），但第三方托管模型使用量暴增20倍 [15][16] - 公司主动牺牲用户体验，通过高batch率降低推理资源消耗，保留最大计算资源用于内部研发 [33] - 采用开源策略扩大全球影响力，让其他云服务商托管模型 [33] Anthropic的困境与应对 - Claude在编程领域成功导致计算资源紧张，API输出速度下降30%至每秒55个token [36] - 编程应用消耗更多计算资源，迫使提高batch处理规模 [36] - 与亚马逊达成合作获取50万片Trainium芯片，并向Google租用TPU资源 [37] - 通过提升"智能密度"优化资源利用，模型回答问题所需token数量远少于竞争对手 [40][42] 行业竞争格局变化 - OpenAI将旗舰模型降价80%，价格战加剧 [8][49] - 推理云服务崛起，更多公司将token作为服务直接销售而非打包订阅 [43] - DeepSeek R1编程能力显著提升，成本效益优势明显 [45][47] - Google凭借TPU计算优势提供免费大配额服务 [34] 技术发展趋势 - 强化学习持续迭代改进模型能力，DeepSeek R1-0528版本编程性能显著提升 [10][52] - 出口管制限制中国大规模部署推理服务能力，但未同等阻碍训练优秀模型的能力 [33] - 计算资源优化方式包括：提高batch规模、优化硬件使用（AMD/NVIDIA芯片）、提升token智能密度 [31][32][42]

Token经济学

通用人工智能（AGI）

智能密度

Artificial Intelligence

Artificial Intelligence

DeepSeek R1

Claude

Deepseek爆火之后的现状如何?

傅里叶的猫· 2025-07-04 20:41

DeepSeek R1发布与市场影响 - DeepSeek R1于2025年1月20日推出，性能与OpenAI推理模型相当，但定价极具颠覆性，输入/输出token价格仅为10美元，引发全球AI市场震动 [3] - 低价策略导致行业价格战，OpenAI输出token价格下降8美元以上，迫使旗舰模型价格调整 [3] - 据Reuters报道，DeepSeek低成本策略导致美国科技股市值蒸发数十亿美元，投资者重新评估AI巨头估值 [4] 技术进步与强化学习 - 模型通过强化学习（RL）显著升级，编码领域表现突出，SWE-Bench显示性能提升同时成本降低 [5] - 2025年5月29日发布的R1-0528升级版通过增加计算资源和算法优化，AIME 2025测试准确率从70%提升至87.5%，每题平均token使用量从12K增至23K [5] - 性能提升伴随延迟增加和吞吐量降低，牺牲部分用户体验以实现低成本 [5] 用户使用趋势 - 第三方托管平台使用量激增，自发布以来增长近20倍，但自托管模型用户增长乏力 [6] - 移动应用曾短暂超越ChatGPT成为Apple App Store榜首，但直接用户增长随后放缓，更多用户转向第三方托管服务 [6] - 2025年2月至5月，月活跃用户从6.147亿降至4.362亿（-29%），而ChatGPT同期增长40.6%至54.92亿 [14] token经济学与性能对比 - 通过高批量处理降低每token成本，但导致高延迟和低吞吐量，自托管模型用户体验较差 [7] - 关键性能指标对比显示DeepSeek R1延迟高、吞吐量低（64K上下文窗口），每token成本0.01美元，与Parsail相当但性能落后 [9] - Microsoft Azure提供中等性能，每token成本0.015美元，平衡价格与体验 [9] 硬件与计算限制 - 低成本策略依赖高批量处理，减少推理资源使用，目标为扩大全球影响力而非盈利 [10] - 中国推理模型规模化受出口管制限制，R2延误传闻与管制相关，但训练能力未受显著影响 [10][16] - R1-0528在编码领域进步显著，显示中国AI训练技术仍强，推理规模化需克服硬件和政策障碍 [10] 竞争格局与行业动态 - 用户转向腾讯元宝、字节豆包等第三方平台，导致DeepSeek官方工具使用量下降 [15] - 出口管制对训练影响有限，R2延迟可能涉及审查要求等非硬件因素 [16] - 行业数据显示2025年本地GPU产能预计从2kwpm增至10kwpm，2027年达26kwpm，晶圆良率逐步提升 [21]

通用人工智能（AGI）

token经济学（Tokenomics）

Artificial Intelligence

Artificial Intelligence

DeepSeek R1

ChatGPT

DeepSeek R1-0528

不止芯片！英伟达，重磅发布！现场人山人海，黄仁勋最新发声

21世纪经济报道· 2025-03-19 11:45

文章核心观点英伟达GTC2025大会围绕AI推理时代展开，发布了涵盖计算架构、企业AI应用、数据中心、机器人和自动驾驶等领域的技术，构建完整AI生态体系，有望推动企业和个人生产力变革，虽发布会后股价下跌，但大会或提振AI市场部分正面情绪 [28][30] 分组1：大会概况 - 当地时间3月18日，英伟达创始人兼CEO黄仁勋在英伟达GTC2025大会发表演讲，称其为“AI界的超级碗”，今年关键词是“推理”和“token”，AI叙事重心从训练转向推理 [1] - Forrester副总裁兼首席分析师戴鲲认为大会有三个方向值得关注，分别是面向后训练和推理的加速计算、面向企业级智能代理开发的Agentic AI、AI在物理世界中的应用 [3] 分组2：芯片家族 - 英伟达发布Blackwell Ultra系列芯片及下一代GPU架构Rubin，Vera Rubin NLV144计划于2026年下半年上线，Rubin Ultra NVL576将于2027年下半年面世 [5] - Grace Blackwell已全面投入生产，新平台强化推理能力，Blackwell Ultra在训练和测试时间缩放推理方面实现突破，被称为“AI工厂平台” [6] - Blackwell Ultra（GB300）包含GB300 NVL72机架级解决方案和HGX B300 NVL16系统，GB300 NVL72 AI性能提升1.5倍，使AI工厂收益机会相比Hopper平台提高50倍；HGX B300 NVL16推理速度提高11倍、计算能力提升7倍、内存容量扩大4倍 [8][9] - 瑞银报告指出，Blackwell系列需求强劲，GB200瓶颈解决，英伟达加快B300/GB300推出，预计第一季度提前量产，2025年第三季度大规模出货 [10] - 基于Blackwell Ultra的产品预计2025年下半年由合作伙伴推出，思科、戴尔等将率先推出相关服务器，预计到2028年数据中心投资超一万亿美元，暗示英伟达有增长空间 [11] 分组3：CPO交换机 - 英伟达推出全新NVIDIA Photonics硅光子技术，通过共封装光学取代传统可插拔光学收发器，可降低40MW功耗，提高AI计算集群网络传输效率 [13] - 推出Spectrum-X与Quantum-X硅光子网络交换机，Spectrum-X以太网平台带宽密度达传统以太网1.6倍，Quantum-X光子Infiniband平台AI计算架构速度较前代提升2倍，可扩展性增强5倍 [14] - 英伟达光子交换机集成光通信创新技术，较传统方式减少75%激光器使用，能效提升3.5倍等；摩根大通报告指出CPO应用于GPU最早可能2027年实现，且面临多项技术挑战，对基板供应商是利好 [15] 分组4：软件升级 - 英伟达关注机器人、自动驾驶等领域，生成式AI改变计算方式，计算机成为token生成器，数据中心演变成AI工厂 [17] - 英伟达新推出AI推理服务软件Dynamo，支持下Blackwell推理性能可达上一代Hopper的40倍，能最大化AI工厂token收益，采用分离式推理架构实现高效AI推理计算 [18][19] - 英伟达推出Llama Nemotron系列推理模型和AI - Q，支持企业和开发者构建AI Agent，提升推理能力，减少开发成本和部署难度 [20] - 英伟达核心护城河CUDA是强大软硬件体系，已拥有各领域AI工具 [21] 分组5：端侧AI和机器人 - 英伟达推出基于NVIDIA Grace Blackwell平台的全新DGX个人AI超级计算机系列，包括DGX Spark和DGX Station，将原本仅限数据中心使用的架构性能引入桌面环境 [23][24] - 英伟达正式发布全球首款开源、可定制的通用人形机器人基础模型Isaac Groot（GROOT N1），采用双系统架构，可适配多种任务，已被多家机器人制造商采用 [25] - 英伟达推出一系列模拟框架和方案，在机器人基础模型和体系化解决方案上再次升级，摩根大通预计其在Physical AI方面会有更多突破 [26] 分组6：市场情绪 - 过去一季度AI领域变化大，英伟达GTC2025大会发布众多技术，但发布会结束后股价下跌3.43% [28] - 摩根大通报告指出整体AI市场情绪偏空，GTC大会有望提振部分正面情绪，改善Blackwell系统供应状况，预计2026年AI数据中心资本支出继续健康增长 [29]