从DeepSeek R1的复现看深度思考模型的未来｜ML-Summit 2025

2025全球机器学习技术大会(ML Summit 2025)概况 - 大会将于2025年4月18-19日在上海虹桥西郊庄园丽笙大酒店召开 [1] - 由CSDN & Boolan联合主办，汇聚超50位学术界和工业界顶尖专家 [1] - 设有12大技术专题，覆盖AI领域前沿热点，并设置AI企业创新展区展示最新技术产品和解决方案 [8] 大会核心演讲内容 - 新浪微博首席科学家张俊林将分享《从DeepSeek R1的复现看深度思考模型的未来》 [1] - 演讲将系统梳理DeepSeek R1开源后的各类复现研究，涵盖SFT阶段轻量适配与RL阶段创新实践 [6] - 重点剖析两阶段训练模式：冷启动微调结合多领域数据优化的SFT阶段，以及运用GRPO强化学习与全场景对齐实现能力跃迁 [6] 深度思考模型技术探讨 - 大模型时代Scaling Law仍是核心驱动力，Grok 3案例显示增大模型尺寸的传统做法性价比值得思考 [5] - 提出用S型曲线叠加解释大模型预训练、后训练及推理阶段的Scaling Law现象 [5] - 探讨关键技术问题包括：RL的Scaling Law边界、影响SFT阶段蒸馏方法效果的关键因素、如何科学解释"Aha Moment"现象 [6] 行业影响与展望 - 大会是推动AI生态融合、促进行业协同创新的重要契机 [8] - 旨在探索AI未来发展方向，推动技术在更广泛场景落地 [8] - DeepSeek R1开源引发学术界和工业界复现研究热潮，为探索更强大的深度思考模型提供新视角 [4][5]