报告行业投资评级 - 强于大市(维持) [1] 报告的核心观点 - DeepSeek系列大模型发布,国产大模型能力比肩海外领军大模型,且成本更低 [3][5][48] - DeepSeek大模型获全球关注,其开源、低成本和高性能将降低大模型应用成本,加快B端和C端应用落地,冲击全球大模型产业竞争格局 [3][21][30] - DeepSeek大模型出圈预计不改算力整体需求向上态势,推理和端侧算力有望增长更快,还将加快国产AI芯片产业链成熟 [3][4][31][46] - 坚定看好AI主题投资机会,给出多方面投资标的推荐 [5][49] 根据相关目录分别进行总结 DeepSeek - V3和DeepSeek - R1陆续发布,国产大模型能力已可比肩海外领军大模型 - DeepSeek - V3于2024年12月26日发布并开源,为自研MoE模型,671B参数,激活37B,在14.8T tokens上预训练,多项评测成绩超越其他开源模型,性能与顶尖闭源模型相当 [3][6] - DeepSeek - V3在百科知识、长文本、代码、数学、中文能力方面表现出色,生成Tokens速度提升至60 TPS,训练时长2788K个H800 GPU小时,花费约557.6万美元,API服务价格更具性价比 [7][8][9] - DeepSeek - R1于2025年1月20日发布并开源,后训练用强化学习技术,在数学等任务上性能比肩OpenAI o1正式版,还蒸馏6个小模型开源,API服务价格大幅低于OpenAI o1 [12][15][17] - DeepSeek大模型多模态能力提升,发布的Janus - Pro在多模态理解等方面进步,7B型号在基准测试中击败OpenAI的DALL - E 3和Stable Diffusion [20] DeepSeek系列大模型引发全球广泛关注,海内外巨头科技公司及云服务平台厂商已相继接入 - 2025年春节期间DeepSeek系列大模型火爆出圈,AI助手在多市场下载量领先,App上线18天DAU达1500万,速度是ChatGPT的约13到14倍 [21] - 全球开始复刻DeepSeek大模型,港科大团队复刻结果亮眼,Hugging Face宣布复刻DeepSeek - R1 [23] - 英伟达、微软等国际巨头,腾讯云、百度云、阿里云等国内云服务平台厂商,以及美格智能等部分AI应用领域企业相继接入或部署DeepSeek大模型 [25][27][28] DeepSeek大模型的出圈预计不改算力整体需求向上的态势,但推理和端侧算力有望增长更快 - DeepSeek大模型或改变AI算力投入结构,平抑模型训练端需求增长,推理环节算力需求有望增长,其低成本开源方案为算力市场增添想象空间 [31][35] - 随着DeepSeek大模型推出,应用推理端算力需求将快速增长,推理算力竞争更充分,参与者多,大模型厂商参与硬件生态建设,相关产品厂商将受益 [36][37] - 国产AI算力平台厂商与DeepSeek合作,其适配成熟将加快国产AI芯片在训练端和推理端应用,促进产业链成熟,带来发展机遇 [39][42][46] 投资建议 - 国产算力基础设施方面,推荐浪潮信息等,建议关注寒武纪等 [5][49] - 端侧算力方面,推荐恒玄科技等,关注乐鑫科技等 [5][49] - 算法方面,推荐科大讯飞 [5][49] - 应用场景方面,强烈推荐中科创达等,推荐金山办公等,建议关注同花顺等 [5][49]
AI动态跟踪系列(四):DeepSeek引发广泛关注,大模型应用落地将加速
平安证券·2025-02-06 11:10