Seek .-摩根士丹利：DeepSeek R2：AI推理新一代重量级模型？

报告行业投资评级 - 韩国科技行业投资评级为Cautious（谨慎） [7] 报告的核心观点 - DeepSeek的R2模型发布或重新定义中国AI开发、定价和供应链方式，有望成为加速中国AI应用落地的关键催化剂 [1] - R2是中国初创公司DeepSeek思维模型的第二次重大迭代，在多语言推理和代码生成等方面有进展，成本低且性能强，若成功将扰乱AI市场 [2] - R2依托华为昇腾910B芯片集群训练，构建自有供应链，减少对外部依赖 [3] - 中国公司有更多资源部署AI技术，“中国AI 60强”个股或参与R2行情和中国AI发展 [10] 根据相关目录分别进行总结 R2模型介绍 - R2是针对国产硬件优化的万亿参数模型，在多语言推理、代码生成和多模态能力方面取得重大进展，可重新定义AI应用落地的价值、性能和单位成本 [9] - R2优先提高编程能力，采用混合专家混合（MoE）架构，总共有1.2万亿个参数，其中780亿个参数是活跃的，成本比大多数先进模型便宜97％ [13] R1模型进展 - 2025年5月29日，DeepSeek发布R1推理模型的更新版本R1 - 0528，使用9900万个tokens完成评估，比原版本多40％，性能在多个测试中有提升 [11] 供应链情况 - DeepSeek可能建立本地硬件供应链，R1曾使用数万张英伟达GPU训练，现在可能用华为昇腾910C芯片推理 [16] - 华为昇腾910C可达到英伟达H100性能的60％，采用中芯国际7纳米N + 2制程工艺，但华为在构建软件和支持生态系统方面还有挑战 [17] 投资影响 - DeepSeek的受益者在业绩、营收和盈利修正方面是长期赢家，后训练阶段tokens增加对本土GPU、GDDR和中国HBM是好兆头 [20] - 全球人工智能公司年初至今整体下跌 -5％，iPhone供应链表现不理想，传统子细分市场每股盈利回升但相对温和 [20] DeepSeek模型演变 - DeepSeek强调软件驱动的资源优化，已发布R1、V3和Prover - V2等模型，即将推出R2和V4模型 [23] - Prover - V2专注数学定理形式化证明，采用改进的MoE架构和压缩的KV缓存，推出MTP框架提高生成速度 [25] R2/V4模型功能 - “推理时间扩展”是R2和V4模型性能突破的关键，采用GRM技术，中型模型可在基准测试中表现出色 [26] - 通过点式生成奖励建模（GRM）、自我原则批评调整（SPCT）和元奖励模型（meta RM）实现模型架构改进 [27][32] 行业覆盖公司评级 - 报告对韩国科技行业多家公司给出评级，如Ecopro BM为Underweight（U），Fadu Inc为Equal - weight（E），Hanmi Semiconductor Co. Ltd.为Overweight（O）等 [81]