Workflow
科技行业:DeepSeek爆火后,影响几何?
建银国际证券·2025-02-21 18:57

报告核心观点 - DeepSeek性能表现几乎追平美国龙头,全球人工智能发展加速,中美差距缩小,开源和闭源竞争加剧,训练算力需求短期内降温 [7] 行业发展现状 - 杭州人工智能初创公司DeepSeek发布全新强化学习版本DeepSeek模型DeepSeek R1及相关应用程序,性能几乎追平现有领先AI模型,成本却非常低,引发市场对大规模算力部署和资金投入必要性的担忧 [1] - R1模型通过强化学习,在数学、编码、自然语言推理等领域拥有卓越表现,其V3模型训练成本估计仅为Llama 3或GPT - 4的8 - 9%左右 [1] 投资建议 - 建议关注国内算力股,如中芯国际、北方华创、中微、深南电路、中际旭创、寒武纪、海光;服务器和数据中心供应商,如联想、中兴通讯、浪潮信息、紫光股份、工业富联 [2] 行业发展趋势 - 全球AI发展或进一步加速,边缘AI及应用将是下一轮竞争焦点,DeepSeek成功表明使用强化学习和MoE技术可使训练更高效节省成本,MoE成功使用或加速人工智能发展,边缘AI因安全隐私问题受关注,AI电脑、智能手机、眼镜成趋势 [3] - 开源与闭源的竞争愈演愈烈,DeepSeek是开源AI模型,代码和模型结构开放,大部分开源模型可免费使用但可能需部署成本,GPT等是闭源模型,需许可证且费用高,随着DeepSeek R1表现追平同业龙头,开源与闭源竞争可能迅速升温 [4] - 训练算力需求热潮降温,DeepSeek V3模型训练过程仅需280万GPU小时左右,成本约560万美元,仅为Llama 3.1的9%,GPT - 4的8%,Claude 3.5 Sonnet的11 - 18%,高效训练和推理或成多数玩家选择,高性能GPU或其他器件需求短期内降温但仍将增长 [5] - 中美人工智能技术差距将加速缩小,美国因领先芯片设计制造能力和对中国供应限制发展迅速,中国大型互联网公司和初创公司也推出模型,DeepSeek在无最先进AI GPU情况下实现突破,未来差距或进一步缩小,美国可能实施更多限制 [6] - 多模态AI与AI Agent步入焦点,多模态AI能处理整合多种类型数据,可应用于多个领域,AI Agent能感知环境等,需多模态AI,开发需更多时间,潜力巨大可用于多领域 [7][8] 模型对比 - 给出DeepSeek模型与OpenAI - o1模型在数学、编程、英语等方面的性能表现比较数据 [9][10] - 给出DeepSeek R1、V3,GPT - 4等多个模型的API之间价格比较,包括最大CoT、最大输出、每百万tokens输入输出价格等信息 [11]