DeepSeek-V3/R1推理系统概览 - 公司首次披露V3/R1推理系统的理论成本和利润率,在GPU租赁成本为2美元/小时的假设下,日总成本为87072美元,理论日收入为562027美元,成本利润率高达545% [1][4][5] - 优化目标聚焦于提升吞吐量和降低延迟,采用大规模跨节点专家并行(EP)技术,通过增加batch size提高GPU矩阵乘法效率,同时分散专家计算以减少访存需求 [2][3] - 系统面临跨节点通信、负载均衡等挑战,公司通过双批次重叠策略和最优负载均衡方案保证高性能与稳定性 [3] 成本控制与定价策略 - 采用动态节点调度机制,白天高峰时段使用278个节点(每节点含8块H800 GPU),夜间低峰时段缩减至平均226.75个节点以降低运营成本 [4] - 实施错峰定价策略,夜间(00:30-08:30)API调用价格大幅下调:V3输入/输出价格降至标准时段的50%(0.25元/百万tokens输入,4元/百万tokens输出),R1降至25% [6] - 标准时段V3与R1的定价差异显著,R1输入/输出价格均为V3的两倍(1元 vs 0.5元输入,16元 vs 8元输出) [6] 行业竞争与市场定位 - 对比OpenAI最新GPT-4.5模型,其输入价格高达75美元/百万tokens,是DeepSeek-V3标准时段的280倍(按汇率换算),引发用户对高定价的质疑 [10] - 公司通过开源周活动连续7天发布技术组件,构建协同系统以最大化GPU利用率,获得国际社区高度评价,被推测技术能力可能超越公开水平 [7][11] - 加速研发中的DeepSeek-R2模型或将提前发布,重点提升多语言推理和代码生成能力,进一步强化行业竞争力 [11] 技术突破与行业影响 - 大规模跨节点专家并行技术实现批处理规模扩展与延迟降低,但需平衡系统复杂度与性能,成为行业技术创新的典型案例 [2][3] - 动态资源调度与错峰定价形成独特商业模式,在保证服务体验的同时优化成本结构 [4][6] - 开源策略与技术透明度显著提升品牌影响力,推动行业对高效推理系统的重新评估 [7][11]
DeepSeek首次披露:理论成本利润率545%!
证券时报·2025-03-01 16:38