DeepSeek GRM

搜索文档
算力机会再度来袭?DeepSeek R2未发先火,云计算50ETF(516630)或迎布局窗口期
每日经济新闻· 2025-05-12 14:00
市场表现 - A股整体震荡向上 主要宽基指数涨多跌少 国防军工板块领涨两市 [1] - 云计算50ETF(516630)午后小幅上涨 持仓股中石基信息、奇安信、千方科技、新易盛、电科数字、中国长城、启明星辰等涨幅居前 [1] 技术进展 - DeepSeek团队发布新论文《Inference-Time Scaling for Generalist Reward Modeling》 提出自我原则点评调优(SPCT)方法 验证推理阶段扩展策略在效率与性能上的双重优势 [1] - 推出DeepSeek GRM模型 27B参数达到R1模型671B参数相当性能 [1] - 华泰证券认为该方法带来推理阶段新Scaling方法 或暗示DeepSeek R2技术路径 模型迭代加速可期 [1] - DeepSeek R2有望在近1-2月内发布 GRM模型发布或是其算法创新雏形 [1] 行业观点 - 湘财证券指出市场等待DeepSeek R2发布 有望成为科技板块新一轮启动契机 [2] - 天风证券持续看好AI行业作为年度投资主线 后续伴随DeepSeek R2/V4及Agent、多模态进展 仍看好AI行业及AIDC产业链高景气 [2] - 整体积极看好25年或成为国内AI基础设施竞赛元年及应用开花结果之年 [2] ETF信息 - 云计算50ETF(516630)AI算力含量较高 标的指数成分股覆盖光模块&光器件、算力租赁(IDC)、数据储存、服务器、液冷等算力基建概念板块 [2] - 云计算指数(930851)Deepseek概念股含量为42 9% [2] - 云计算50ETF(516630)管理费率0 15% 托管费率0 05% 合计费率0 2% 为全市场同类产品最低费率水平 [2]
DeepSeekGRM带来新的推理Scaling路径
华泰证券· 2025-05-07 15:25
报告行业投资评级 - 计算机行业投资评级为增持(维持) [8] 报告的核心观点 - DeepSeek团队新论文引入SPCT方法,推出DeepSeek GRM模型,带来推理阶段新Scaling方法,或暗示DeepSeek R2技术路径,模型迭代加速可期 [2] - SPCT方法拓展推理Scaling路径,提高强化学习质量,为大模型算法迭代提供启发 [3] - DeepSeek GRM-27B以27B参数媲美621B参数R1的性能,证明推理阶段新探索有望拓展模型边界 [4] - DeepSeek GRM模型压缩硬件需求,降低本地化部署成本,利好端侧部署与端侧AI进展 [5] - DeepSeek R2有望近1 - 2月内发布,GRM模型发布或是其算法创新雏形,建议关注算法创新带来的模型迭代加速 [6] 根据相关目录分别进行总结 DeepSeek新论文及模型情况 - DeepSeek团队新论文《Inference-Time Scaling for Generalist Reward Modeling》发布,引入SPCT方法,推出DeepSeek GRM模型,27B参数能跑出目前R1模型671B参数相当性能 [2] SPCT方法优势 - 强化学习在一般领域难获LLMs准确奖励信号,SPCT方法可自适应生成评判原则并评价,提高强化学习质量,拓展推理Scaling路径 [3] DeepSeek GRM模型性能 - DeepSeek GRM-27B在多个综合奖励模型基准测试中优于现有方法和模型,达到与DeepSeek R1(621B参数)、GPT - 4o相当效果;SPCT采用双循环结构,R1单一线性模式会积累错误;推理阶段应用SPCT方法扩展策略性能更优 [4] 硬件消耗与部署情况 - DeepSeek GRM模型采用128块A100 - 80G GPU训练,成本为R1的1/6;推理阶段降低算力与显存需求,能耗为R1模型的17%左右;有望在端侧设备部署,精度优化后显存需求理论上可被消费级显卡满足 [5] R2模型展望 - 预训练阶段Scaling Law放缓,算法优化成各大厂追求方向;DeepSeek R2有望近1 - 2月内发布,GRM模型发布或是其算法创新雏形 [6]