DeepSeek-R2为什么还没发?
猿大侠·2025-06-27 22:57
DeepSeek-R2延迟发布 - 核心观点:DeepSeek-R2因CEO对模型表现不满及算力资源短缺而多次推迟发布 [1][2][4] - 研发进程缓慢主因包括英伟达H20芯片供应不足 [2] - R1训练消耗3万块H20、1万块H800和1万块H100芯片 [3] R2研发背景与时间线 - 公众对R2的期待始于2023年12月DeepSeek-V3发布及2024年3月V3-0324升级 [5][6] - 4月公司发布推理Scaling Law论文,引发R2即将发布的猜测 [11][12] - 4月底泄露参数显示R2或达1.2T参数、5.2PB训练数据 [17] - 5月发布解决硬件瓶颈的论文及升级版R1-0528,性能接近OpenAI o3-high [20][21][23][24] 技术进展与市场反应 - V3-0324升级实际效果显著,超出官方描述的"小版本升级" [6] - R1-0528在LiveCodeBench编程测试中表现优异,部分指标超越竞品 [24] - 网友推测R2需等待V4发布,因V3可能已达技术极限 [28][29] 算力资源挑战 - R2预计需要比R1更多的算力资源,H20芯片短缺直接影响研发进度 [3][4] - 公司通过论文公开V3训练和推理中解决硬件瓶颈的方法 [21]