AI动态跟踪系列（四）：DeepSeek引发广泛关注，大模型应用落地将加速

报告行业投资评级 - 强于大市（维持） [1] 报告的核心观点 - DeepSeek系列大模型发布，国产大模型能力比肩海外领军大模型，且成本更低 [3][5][48] - DeepSeek大模型获全球关注，其开源、低成本和高性能将降低大模型应用成本，加快B端和C端应用落地，冲击全球大模型产业竞争格局 [3][21][30] - DeepSeek大模型出圈预计不改算力整体需求向上态势，推理和端侧算力有望增长更快，还将加快国产AI芯片产业链成熟 [3][4][31][46] - 坚定看好AI主题投资机会，给出多方面投资标的推荐 [5][49] 根据相关目录分别进行总结 DeepSeek - V3和DeepSeek - R1陆续发布，国产大模型能力已可比肩海外领军大模型 - DeepSeek - V3于2024年12月26日发布并开源，为自研MoE模型，671B参数，激活37B，在14.8T tokens上预训练，多项评测成绩超越其他开源模型，性能与顶尖闭源模型相当 [3][6] - DeepSeek - V3在百科知识、长文本、代码、数学、中文能力方面表现出色，生成Tokens速度提升至60 TPS，训练时长2788K个H800 GPU小时，花费约557.6万美元，API服务价格更具性价比 [7][8][9] - DeepSeek - R1于2025年1月20日发布并开源，后训练用强化学习技术，在数学等任务上性能比肩OpenAI o1正式版，还蒸馏6个小模型开源，API服务价格大幅低于OpenAI o1 [12][15][17] - DeepSeek大模型多模态能力提升，发布的Janus - Pro在多模态理解等方面进步，7B型号在基准测试中击败OpenAI的DALL - E 3和Stable Diffusion [20] DeepSeek系列大模型引发全球广泛关注，海内外巨头科技公司及云服务平台厂商已相继接入 - 2025年春节期间DeepSeek系列大模型火爆出圈，AI助手在多市场下载量领先，App上线18天DAU达1500万，速度是ChatGPT的约13到14倍 [21] - 全球开始复刻DeepSeek大模型，港科大团队复刻结果亮眼，Hugging Face宣布复刻DeepSeek - R1 [23] - 英伟达、微软等国际巨头，腾讯云、百度云、阿里云等国内云服务平台厂商，以及美格智能等部分AI应用领域企业相继接入或部署DeepSeek大模型 [25][27][28] DeepSeek大模型的出圈预计不改算力整体需求向上的态势，但推理和端侧算力有望增长更快 - DeepSeek大模型或改变AI算力投入结构，平抑模型训练端需求增长，推理环节算力需求有望增长，其低成本开源方案为算力市场增添想象空间 [31][35] - 随着DeepSeek大模型推出，应用推理端算力需求将快速增长，推理算力竞争更充分，参与者多，大模型厂商参与硬件生态建设，相关产品厂商将受益 [36][37] - 国产AI算力平台厂商与DeepSeek合作，其适配成熟将加快国产AI芯片在训练端和推理端应用，促进产业链成熟，带来发展机遇 [39][42][46] 投资建议 - 国产算力基础设施方面，推荐浪潮信息等，建议关注寒武纪等 [5][49] - 端侧算力方面，推荐恒玄科技等，关注乐鑫科技等 [5][49] - 算法方面，推荐科大讯飞 [5][49] - 应用场景方面，强烈推荐中科创达等，推荐金山办公等，建议关注同花顺等 [5][49]