DeepSeek惊艳世界，算力与应用将迎来结构性变化

报告行业投资评级 - 看好（维持） [5] 报告的核心观点 - AI应用正逐步进入落地期，有望呈现较多投资机遇，建议关注行业整体性机会，国产算力及推理算力服务企业将从AI应用繁荣中受益 [3] - DeepSeek呈现出的算法创新、性能表现、开源属性等多重因素，将对AI应用与算力行业产生深远影响 [8][12] 根据相关目录分别进行总结一、DeepSeek-V3、R1模型推出后“火”遍全球 1.1 DeepSeek-V3性能表现不输全球顶尖模型 - 2024年12月26日，DeepSeek发布DeepSeek-V3并同步开源，多项评测成绩超越其他开源模型，性能与世界顶尖闭源模型不分伯仲 [13] - 在知识类、长文本评测、算法类代码、数学竞赛等任务上表现卓越，生成吐字速度大幅提高，API服务定价大幅低于市面上所有模型，性价比优势明显 [14][18] 1.2 R1模型实现了比肩OpenAI o1的推理能力 - 2025年1月20日，DeepSeek发布推理模型R1，在数据、代码、自然语言推理等领域实现比肩OpenAI o1模型的能力 [19] - 开源R1-Zero和R1两个660B模型及6个蒸馏小模型，修改产品协议支持“模型蒸馏”，API服务定价保持超高性价比，还上线APP并更新官网 [23][26] 1.3 DeepSeek-V3、R1模型在产业中引发巨大反响 - 两款模型性能比肩业内最佳，训练成本超低，推出后引发巨大讨论与关注，成为全球增速最快的AI应用，在多个国家/地区下载领先 [29][33] - 受到众多科技领域领袖关注，如微软、Meta、ASML等公司相关负责人均有表态 [31] 二、DeepSeek模型训练与推理技术创新解析 2.1 DeepSeek-V3模型采用了多项创新技术 - DeepSeek-V3为自研MoE模型，通过FP8精度训练、DualPipe双向流水线等技术降低训练成本，通过优化MoE负载均衡、多头潜在注意力机制降低推理成本，通过多Token预测和模型蒸馏提升性能 [35] - 训练方面，FP8精度训练、DualPipe双向流水线和跨节点通信技术是创新重点；推理方面，混合专家系统和多头潜在注意力机制是获得低成本、高质量推理结果的重要原因 [38][40] 2.2 R1-Zero与R1模型尝试强化学习边界 - R1-Zero尝试仅采用大规模强化学习，R1在强化学习前引入冷启动阶段，通过少量人工设计的长链思维数据进行初步监督微调 [43] - R1-Zero性能稳步提升，具备强大推理能力；R1训练分4个阶段，目标是打造更符合人类偏好的通用推理模型，还对开源模型进行微调提高小模型推理能力 [46][51] 三、DeepSeek将对AI算力与应用产生结构性影响 3.1 DeepSeek模型有望引发算力需求与市场结构变化 - DeepSeek模型降低训练端算力消耗，导致算力产业链相关企业股价暴跌，如英伟达、博通、台积电等 [52] - 训练算力长期仍有前景和空间，推理算力需求增长空间大，“杰文斯悖论”有望在推理算力上印证，AI芯片行业格局可能生变，美国进一步限制芯片出口或利好国产芯片 [54][55][57] 3.2 AI应用有望在高性能、低成本模型支撑下繁荣 - 基于大模型的商业化曙光已现，ChatGPT等产品用户数和访问量增长，付费用户也在增加 [62][64] - 此前AI应用普及和商业化存在困难，DeepSeek的强推理能力、低算力成本、开源属性有望推动AI应用繁荣，国产模型集体突破为国内AI应用发展打下基础 [66][72] 四、投资建议与投资标的 - 建议关注行业整体性机会，国产算力及推理算力服务企业将受益 [3][73] - B端企业级应用建议关注金山办公、鼎捷数智等；垂直行业应用领域建议关注科大讯飞、焦点科技等；AI工具类应用建议关注彩讯股份、虹软科技等；国产算力及算力服务企业建议关注海光信息、寒武纪-U等 [8][73][75]