节点专家并行(EP)

搜索文档
Deepseek-V3/R1利润率545%怎么算的?
小熊跑的快· 2025-03-02 14:45
在24小时统计时段内,DeepSeekV3和R1:输入token总数为608B,其中342B tokens(56.3%)命中KVCache硬盘缓存。输出token总数为168B。平 均输出速率为20~22tps,平均每输出一个token的KVCache长度是4989。平均每台H800的吞吐量为:对于prefill任务,输入吞吐约73.7k tokens/s (含缓存命中);对于decode任务,输出吞吐约14.8k tokens/s。如果所有tokens全部按照DeepSeek R1的定价计算,理论一天的总收入为 $562,027,成本利润率545%。 实际利润率: 上述利润率测算仅基于理论,DeepSeek实际利润率将明显低于上述水准,具体原因如下: 标题: DeepSeek官方发布的《DeepSeek-V3/R1推理系统概览》文章显示,假定GPU租赁成本为2美元/小时,DeepSeek V3/R1推理系 统的日均成本为87072美元。然而,若按照DeepSeek R1的定价计算,其单日理论收入竟高达562027美元,成本利润率因此达到了惊人 的545%。 结论: 利润率 500% 怎么计算的? 欢迎指正! ...