Workflow
A world-class AI model for just $6M
Morgan Stanley·2025-01-27 03:14

报告行业投资评级 - 对韩国科技行业持谨慎态度 [7] 报告的核心观点 - 中国初创公司DeepSeek以低成本实现前沿AI性能,挑战现状,推动AI创新与普及,改变全球AI格局 [2][4][5] - 中国虽在AI硬件上落后,但开发者推出出色产品,开源趋势使技术优势非成功关键,中国在实用AI应用上前景好 [13][18] - 投资上,能利用AI提高业务效率的公司或成赢家,DeepSeek发展或影响亚洲AI供应链科技股估值,传统非AI科技公司或受关注 [19][20][21] 根据相关目录分别进行总结 DeepSeek的突破与意义 - DeepSeek以创新优化实现前沿AI性能,成本低,开源模式或促进行业创新,缩小中西AI能力差距 [1][2] - 其展示了高效模型训练新路径,提高数据质量和改进架构,输出代币价格比GPT - 4o和Claude 3.5低9 - 13倍 [3] - 表明前沿AI能力可在较少计算资源下实现,提高资源利用效率,或推动AI开发和部署创新,提升LLM投资回报率,促进AI民主化 [4] 中国AI发展现状 - 中国在AI领域起步晚,但公司在基础大语言模型上缩小差距,如DeepSeek突破,AI部署成本降低,能低成本整合AI能力的公司或成赢家 [9] - 中国开发者推出有竞争力产品,开源趋势使AI开发进入门槛降低,挑战现有AI领导者地位 [13] DeepSeek的技术优势 - DeepSeek V3利用DeepSeek MoE结构和Multi - head Latent Attention,以低成本训练,推理时激活370亿参数,训练成本仅560万美元,远低于GPT - 4的6300万美元 [11] - DeepSeek计算需求大幅降低,与同等能力模型相比,GPU数量需求为7.8倍,GPU训练小时数效率提升约11倍,其开源模式将促使竞争,降低模型使用价格 [14] - 采用先进算法和低精度计算,减少计算和内存使用,推理成本显著低于OpenAI,如输入令牌成本OpenAI o1为15美元,DeepSeek R1为0.55美元 [15][17] 投资影响 - 投资回报分三阶段,能利用AI提高业务效率的公司或成赢家,涉及金融、医疗等多行业 [19] - DeepSeek低成本模式若受认可,亚洲AI供应链科技股高估值或受影响,传统非AI科技公司,尤其是低估的中国AI公司,或受投资者关注 [20][21] DeepSeek工作原理 - 采用创新架构和训练技术,由多个针对不同任务优化的神经网络组成,路由器智能分配请求,减少硬件成本 [27] - 模型和权重开源,可加速行业AI能力普及,最新模型使推理快速商品化,未来或推出开源o3级模型 [28] 性能和基准 - DeepSeek AI为DeepSeek V3设定新API定价结构,2月8日后输入(缓存未命中)0.27美元/百万令牌,输入(缓存命中)0.07美元/百万令牌,输出1.1美元/百万令牌,远低于GPT - 4o和Claude 3.5 [30] 行业覆盖公司评级 - 报告对韩国科技行业部分公司给出评级,如Ecopro BM为减持(U),Fadu Inc为持平(E),Hanmi Semiconductor Co. Ltd.为增持(O)等,评级可能变化 [79]