全网期待的 DeepSeek R2 为何迟迟不发?梁文锋这一举动成关键!
DeepSeek R2模型延迟发布 - DeepSeek R2推理模型原计划于5月发布,但因公司联合创始人梁文锋对其性能不满意而推迟[1] - 该模型旨在提升编程能力并实现英语之外的多语言推理功能[1] - 过去几个月工程师一直在优化该模型,等待梁文锋批准发布[1] 芯片供应限制影响 - 美国出口管制导致英伟达服务器芯片在中国供应短缺,可能影响DeepSeek R2的快速推广[1] - 目前大多数云客户通过英伟达H20芯片运行R1模型[2] - 2023年4月特朗普政府实施的新一轮出口管制已禁止英伟达向中国市场销售H20芯片[2] 云服务商面临的挑战 - 需求激增可能导致中国云服务商不堪重负,因运行AI模型需要英伟达先进芯片[1] - DeepSeek已与部分中国云企业接洽,提供技术规格以便规划服务器托管和分发方案[1]