信息技术行业动态点评：DeepSeek发布第二代MoE架构模型，API调用成本降低

报告行业投资评级 - 强于大市（维持） [3] 报告的核心观点 - DeepSeek团队开源第二代MoE模型DeepSeek - V2，参数更多、能力更强且成本大幅降低，在主流榜单表现出色，支持128K上下文窗口，以236B总参数、21B激活大致达70B - 110B Dense模型能力，显存消耗低，实际部署吞吐量高 [2] - DeepSeek在编程、数学解题等领域国内领先，各维度表现优异，模型结构创新，提出MLA架构并结合自研DeepSeekMoE降低计算量，提升性能 [5][6] - DeepSeek - V2 API调用成本大幅降低，定价为每百万tokens输入1元、输出2元（32K上下文），是GPT - 4 - Turbo近百分之一，中文能力强且成本低，性价比凸显 [7] - DeepSeek - V2整合多种训练策略，做到算法、工程和数据极致优化，模型架构创新使推理侧降本加快、算力节省，或带来需求上升，建议关注AI板块及相关公司 [13] 根据相关目录分别进行总结事项 - DeepSeek团队开源第二代MoE模型DeepSeek - V2，参数更多、能力更强、成本大幅降低，在主流榜单表现出色，支持128K上下文窗口，以236B总参数、21B激活大致达70B - 110B Dense模型能力，显存消耗是同级别Dense模型1/5 - 1/100，实际部署吞吐量高 [2] 评论 - DeepSeek在编程、数学解题等领域国内领先，各维度表现优异，模型结构创新，提出MLA架构并结合自研DeepSeekMoE降低计算量，提升性能 [5][6] API调用成本 - DeepSeek - V2 API定价为每百万tokens输入1元、输出2元（32K上下文），是GPT - 4 - Turbo近百分之一，中文能力强且成本低，性价比凸显 [7] 训练策略与建议 - DeepSeek - V2整合多种训练策略，做到算法、工程和数据极致优化，模型架构创新使推理侧降本加快、算力节省，或带来需求上升，建议关注AI板块及海光信息、景嘉微、寒武纪、工业富联、浪潮信息等公司 [13]