Workflow
计算机行业点评:DeepSeek开启模型平权时代,AI应用前景可期
甬兴证券·2025-02-08 09:50

报告行业投资评级 - 增持(维持) [6] 报告的核心观点 - DeepSeek - V3通过引入FP8混合精度训练框架和设计DualPipe算法,实现加速训练和减少GPU内存使用,训练经济效益优异,每万亿标记预训练仅需180K H800 GPU小时,假设H800 GPU租赁价为每小时2美元,总训练成本仅557.6万美元 [2] - DeepSeek - R1基于R1 - Zero迭代而来,未经过监督微调仍展现卓越推理能力,达到OpenAI - o1 - 1217水平,验证了大模型推理能力提升可仅通过RL无需SFT,且“大”模型向“小”模型蒸馏得到的较小密集模型表现优异 [2] - 以DeepSeek为代表的厂商降低API调用单价,国产模型性能提升,AI模型进入普惠发展期,下游应用侧公司有望以低成本享受更强基座性能,AI应用侧将进入高速增长期 [3] 投资建议 - 关注各垂直行业AI进展,建议关注科大讯飞、金山办公、泛微网络、福昕软件、致远互联、润达医疗、焦点科技、润泽科技等标的 [4] 事件概述 - 深度求索发布DeekSeek - V3及DeepSeek - R1模型并开源,前者为6710亿参数专家混合模型,性能比肩GPT - 4和Claude - 3.5 - Sonnet等;后者在数学等任务上性能比肩OpenAI o1正式版,API定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元 [1]