Workflow
互联网:DeepSeek成本和性能双突破,有望加速国内AI进程
华安证券·2025-02-05 17:14

报告行业投资评级 - 行业评级为增持 [2] 报告的核心观点 - DeepSeek取得AI模型性能和成本双重突破,其发布并开源的DeepSeek - R1在多个基准测试中表现出色,多模态开源模型Janus - Pro击败部分竞品,此外还有其他公司发布新模型 [3] - DeepSeek主要通过训练流程设计和新算法应用取得创新,从DeepSeek - V3到DeepSeek - R1在不同方面有技术创新 [4] - 目前生成式AI处于技术发展早期,单位成本下降是趋势,AI下游使用增长拉动国内云基础设施需求,给出多方面投资建议 [5] 根据相关目录分别进行总结 模型性能突破 - DeepSeek发布的DeepSeek - R1在多个基准测试中表现出色,如在AIME 2024数学基准测试中得分率为79.8%,高于o1的79.2%;在MATH - 500基准测试中得分率为97.3%,优于o1的96.4% [3] - DeepSeek发布的多模态开源模型Janus - Pro在GenEval和DPG - Bench基准测试中,击败了Stable Diffusion和OpenAI的DALL - E 3 [3] 技术创新 - DeepSeek - V3体现高效架构与创新技术结合,包括MoE架构的共享专家策略、引入FP8混合精度训练框架、多头潜在注意力机制、多Token预测应用、数据并行和模型并行 [4] - 从DeepSeek - V3到DeepSeek - R1在强化学习技术上有所创新,结合监督学习和强化学习优势,提高模型可读性和初始推理能力 [4] 投资建议 - AI下游使用增长拉动国内云基础设施需求,建议关注阿里巴巴 - W、腾讯控股、百度集团 - SW、金山云(未覆盖)等 [5] - 端侧AI有望提速,建议关注小米集团 - W、联想控股等 [5] - SaaS等软件是AI赋能提效落地重要场景,建议关注焦点科技、金山办公、金蝶国际等 [5] - 垂直行业应用值得持续关注,成本降低有助于寻找PMF,建议关注美图公司等 [5]