报告行业投资评级 - 强于大市(维持) [3] 报告的核心观点 - DeepSeek团队开源第二代MoE模型DeepSeek - V2,参数更多、能力更强且成本大幅降低,在主流榜单表现出色,支持128K上下文窗口,以236B总参数、21B激活大致达70B - 110B Dense模型能力,显存消耗低,实际部署吞吐量高 [2] - DeepSeek在编程、数学解题等领域国内领先,各维度表现优异,模型结构创新,提出MLA架构并结合自研DeepSeekMoE降低计算量,提升性能 [5][6] - DeepSeek - V2 API调用成本大幅降低,定价为每百万tokens输入1元、输出2元(32K上下文),是GPT - 4 - Turbo近百分之一,中文能力强且成本低,性价比凸显 [7] - DeepSeek - V2整合多种训练策略,做到算法、工程和数据极致优化,模型架构创新使推理侧降本加快、算力节省,或带来需求上升,建议关注AI板块及相关公司 [13] 根据相关目录分别进行总结 事项 - DeepSeek团队开源第二代MoE模型DeepSeek - V2,参数更多、能力更强、成本大幅降低,在主流榜单表现出色,支持128K上下文窗口,以236B总参数、21B激活大致达70B - 110B Dense模型能力,显存消耗是同级别Dense模型1/5 - 1/100,实际部署吞吐量高 [2] 评论 - DeepSeek在编程、数学解题等领域国内领先,各维度表现优异,模型结构创新,提出MLA架构并结合自研DeepSeekMoE降低计算量,提升性能 [5][6] API调用成本 - DeepSeek - V2 API定价为每百万tokens输入1元、输出2元(32K上下文),是GPT - 4 - Turbo近百分之一,中文能力强且成本低,性价比凸显 [7] 训练策略与建议 - DeepSeek - V2整合多种训练策略,做到算法、工程和数据极致优化,模型架构创新使推理侧降本加快、算力节省,或带来需求上升,建议关注AI板块及海光信息、景嘉微、寒武纪、工业富联、浪潮信息等公司 [13]
信息技术行业动态点评:DeepSeek发布第二代MoE架构模型,API调用成本降低
东方财富证券·2024-05-13 16:30