Workflow
token经济学(Tokenomics)
icon
搜索文档
Deepseek爆火之后的现状如何?
傅里叶的猫· 2025-07-04 20:41
DeepSeek R1发布与市场影响 - DeepSeek R1于2025年1月20日推出,性能与OpenAI推理模型相当,但定价极具颠覆性,输入/输出token价格仅为10美元,引发全球AI市场震动 [3] - 低价策略导致行业价格战,OpenAI输出token价格下降8美元以上,迫使旗舰模型价格调整 [3] - 据Reuters报道,DeepSeek低成本策略导致美国科技股市值蒸发数十亿美元,投资者重新评估AI巨头估值 [4] 技术进步与强化学习 - 模型通过强化学习(RL)显著升级,编码领域表现突出,SWE-Bench显示性能提升同时成本降低 [5] - 2025年5月29日发布的R1-0528升级版通过增加计算资源和算法优化,AIME 2025测试准确率从70%提升至87.5%,每题平均token使用量从12K增至23K [5] - 性能提升伴随延迟增加和吞吐量降低,牺牲部分用户体验以实现低成本 [5] 用户使用趋势 - 第三方托管平台使用量激增,自发布以来增长近20倍,但自托管模型用户增长乏力 [6] - 移动应用曾短暂超越ChatGPT成为Apple App Store榜首,但直接用户增长随后放缓,更多用户转向第三方托管服务 [6] - 2025年2月至5月,月活跃用户从6.147亿降至4.362亿(-29%),而ChatGPT同期增长40.6%至54.92亿 [14] token经济学与性能对比 - 通过高批量处理降低每token成本,但导致高延迟和低吞吐量,自托管模型用户体验较差 [7] - 关键性能指标对比显示DeepSeek R1延迟高、吞吐量低(64K上下文窗口),每token成本0.01美元,与Parsail相当但性能落后 [9] - Microsoft Azure提供中等性能,每token成本0.015美元,平衡价格与体验 [9] 硬件与计算限制 - 低成本策略依赖高批量处理,减少推理资源使用,目标为扩大全球影响力而非盈利 [10] - 中国推理模型规模化受出口管制限制,R2延误传闻与管制相关,但训练能力未受显著影响 [10][16] - R1-0528在编码领域进步显著,显示中国AI训练技术仍强,推理规模化需克服硬件和政策障碍 [10] 竞争格局与行业动态 - 用户转向腾讯元宝、字节豆包等第三方平台,导致DeepSeek官方工具使用量下降 [15] - 出口管制对训练影响有限,R2延迟可能涉及审查要求等非硬件因素 [16] - 行业数据显示2025年本地GPU产能预计从2kwpm增至10kwpm,2027年达26kwpm,晶圆良率逐步提升 [21]