deepseek 撕开一角 (此文值万金)
小熊跑的快·2025-01-27 14:34
文章核心观点 - deepseek撕开强化学习一角,利好垂直模型发展和推理算力 [1] 分组1:deepseek开源的意义 - deepseek开源R1,为几千亿参数的初创公司带来希望 [1] - deepseek用单一模型自反馈且无需打标,撕开openai和google对RL的技术封锁 [1] - deepseek使小模型在模糊精度下有强化出垂直模型的路径,对金融医疗等需透明度行业使用AI有里程碑式影响 [1] - deepseek附带预训练模块库,缩短跨行业部署的时间和难度 [2] 分组2:不同版本模型的适配情况 - 34b版本适合超级终端智能体,能与nvces新发超级pc完美搭配 [3] - 6000亿版本最适合云端应用 [3] - 7b小模型能力不足,在更小终端表现欠佳 [3] 分组3:对行业的影响 - deepseek的RL突破和开源对行业应用影响深远,对智能体带来新颠覆 [3] - 全球算力转向推理,以云端为主,星际之门5000亿美金投入大半用于推理 [3] - 英伟达GB300将在3月初公布架构,预计比GB200提升推理效率10倍,GB200比B200提升23倍以上,B200比H100提升4倍 [3] - 2025年便宜的应用将到来,国产AI将崛起 [3]