报告行业投资评级 - 看好(维持) [5] 报告的核心观点 - AI应用正逐步进入落地期,有望呈现较多投资机遇,建议关注行业整体性机会,国产算力及推理算力服务企业将从AI应用繁荣中受益 [3] - DeepSeek呈现出的算法创新、性能表现、开源属性等多重因素,将对AI应用与算力行业产生深远影响 [8][12] 根据相关目录分别进行总结 一、DeepSeek-V3、R1模型推出后“火”遍全球 1.1 DeepSeek-V3性能表现不输全球顶尖模型 - 2024年12月26日,DeepSeek发布DeepSeek-V3并同步开源,多项评测成绩超越其他开源模型,性能与世界顶尖闭源模型不分伯仲 [13] - 在知识类、长文本评测、算法类代码、数学竞赛等任务上表现卓越,生成吐字速度大幅提高,API服务定价大幅低于市面上所有模型,性价比优势明显 [14][18] 1.2 R1模型实现了比肩OpenAI o1的推理能力 - 2025年1月20日,DeepSeek发布推理模型R1,在数据、代码、自然语言推理等领域实现比肩OpenAI o1模型的能力 [19] - 开源R1-Zero和R1两个660B模型及6个蒸馏小模型,修改产品协议支持“模型蒸馏”,API服务定价保持超高性价比,还上线APP并更新官网 [23][26] 1.3 DeepSeek-V3、R1模型在产业中引发巨大反响 - 两款模型性能比肩业内最佳,训练成本超低,推出后引发巨大讨论与关注,成为全球增速最快的AI应用,在多个国家/地区下载领先 [29][33] - 受到众多科技领域领袖关注,如微软、Meta、ASML等公司相关负责人均有表态 [31] 二、DeepSeek模型训练与推理技术创新解析 2.1 DeepSeek-V3模型采用了多项创新技术 - DeepSeek-V3为自研MoE模型,通过FP8精度训练、DualPipe双向流水线等技术降低训练成本,通过优化MoE负载均衡、多头潜在注意力机制降低推理成本,通过多Token预测和模型蒸馏提升性能 [35] - 训练方面,FP8精度训练、DualPipe双向流水线和跨节点通信技术是创新重点;推理方面,混合专家系统和多头潜在注意力机制是获得低成本、高质量推理结果的重要原因 [38][40] 2.2 R1-Zero与R1模型尝试强化学习边界 - R1-Zero尝试仅采用大规模强化学习,R1在强化学习前引入冷启动阶段,通过少量人工设计的长链思维数据进行初步监督微调 [43] - R1-Zero性能稳步提升,具备强大推理能力;R1训练分4个阶段,目标是打造更符合人类偏好的通用推理模型,还对开源模型进行微调提高小模型推理能力 [46][51] 三、DeepSeek将对AI算力与应用产生结构性影响 3.1 DeepSeek模型有望引发算力需求与市场结构变化 - DeepSeek模型降低训练端算力消耗,导致算力产业链相关企业股价暴跌,如英伟达、博通、台积电等 [52] - 训练算力长期仍有前景和空间,推理算力需求增长空间大,“杰文斯悖论”有望在推理算力上印证,AI芯片行业格局可能生变,美国进一步限制芯片出口或利好国产芯片 [54][55][57] 3.2 AI应用有望在高性能、低成本模型支撑下繁荣 - 基于大模型的商业化曙光已现,ChatGPT等产品用户数和访问量增长,付费用户也在增加 [62][64] - 此前AI应用普及和商业化存在困难,DeepSeek的强推理能力、低算力成本、开源属性有望推动AI应用繁荣,国产模型集体突破为国内AI应用发展打下基础 [66][72] 四、投资建议与投资标的 - 建议关注行业整体性机会,国产算力及推理算力服务企业将受益 [3][73] - B端企业级应用建议关注金山办公、鼎捷数智等;垂直行业应用领域建议关注科大讯飞、焦点科技等;AI工具类应用建议关注彩讯股份、虹软科技等;国产算力及算力服务企业建议关注海光信息、寒武纪-U等 [8][73][75]
DeepSeek惊艳世界,算力与应用将迎来结构性变化
东方证券·2025-02-04 14:00