Workflow
摩根士丹利:DeepSeek R2:AI推理新一代重量级模型?
Seek .Seek .(US:SKLTY)2025-06-16 11:16

报告行业投资评级 - 韩国科技行业投资评级为Cautious(谨慎) [7] 报告的核心观点 - DeepSeek的R2模型发布或重新定义中国AI开发、定价和供应链方式,有望成为加速中国AI应用落地的关键催化剂 [1] - R2是中国初创公司DeepSeek思维模型的第二次重大迭代,在多语言推理和代码生成等方面有进展,成本低且性能强,若成功将扰乱AI市场 [2] - R2依托华为昇腾910B芯片集群训练,构建自有供应链,减少对外部依赖 [3] - 中国公司有更多资源部署AI技术,“中国AI 60强”个股或参与R2行情和中国AI发展 [10] 根据相关目录分别进行总结 R2模型介绍 - R2是针对国产硬件优化的万亿参数模型,在多语言推理、代码生成和多模态能力方面取得重大进展,可重新定义AI应用落地的价值、性能和单位成本 [9] - R2优先提高编程能力,采用混合专家混合(MoE)架构,总共有1.2万亿个参数,其中780亿个参数是活跃的,成本比大多数先进模型便宜97% [13] R1模型进展 - 2025年5月29日,DeepSeek发布R1推理模型的更新版本R1 - 0528,使用9900万个tokens完成评估,比原版本多40%,性能在多个测试中有提升 [11] 供应链情况 - DeepSeek可能建立本地硬件供应链,R1曾使用数万张英伟达GPU训练,现在可能用华为昇腾910C芯片推理 [16] - 华为昇腾910C可达到英伟达H100性能的60%,采用中芯国际7纳米N + 2制程工艺,但华为在构建软件和支持生态系统方面还有挑战 [17] 投资影响 - DeepSeek的受益者在业绩、营收和盈利修正方面是长期赢家,后训练阶段tokens增加对本土GPU、GDDR和中国HBM是好兆头 [20] - 全球人工智能公司年初至今整体下跌 -5%,iPhone供应链表现不理想,传统子细分市场每股盈利回升但相对温和 [20] DeepSeek模型演变 - DeepSeek强调软件驱动的资源优化,已发布R1、V3和Prover - V2等模型,即将推出R2和V4模型 [23] - Prover - V2专注数学定理形式化证明,采用改进的MoE架构和压缩的KV缓存,推出MTP框架提高生成速度 [25] R2/V4模型功能 - “推理时间扩展”是R2和V4模型性能突破的关键,采用GRM技术,中型模型可在基准测试中表现出色 [26] - 通过点式生成奖励建模(GRM)、自我原则批评调整(SPCT)和元奖励模型(meta RM)实现模型架构改进 [27][32] 行业覆盖公司评级 - 报告对韩国科技行业多家公司给出评级,如Ecopro BM为Underweight(U),Fadu Inc为Equal - weight(E),Hanmi Semiconductor Co. Ltd.为Overweight(O)等 [81]