Workflow
互联网行业:以DeepSeek视角,解读DeepSeek逆袭
浦银国际证券·2025-02-06 22:33

报告行业投资评级 未提及 报告的核心观点 - DeepSeek春节期间成为全球AI行业关注焦点,其“成本创新”优势显著,整体表现与海外大模型第一梯队相当,但成本仅为OpenAI的5%-10%,商业化定价仅为2%-5% [1] - DeepSeek的低成本优势推动AI产业链从“算力竞赛”转向“算法优化”,未来AI产业将更依赖算法密度与生态协同 [2] - DeepSeek打破美国在大模型层面的垄断格局,或带动市场重新审视国产AI行业,带来价值重估;其“成本创新”使大模型价格平民化,加速应用层爆发;长期来看有助于推动云服务需求上升 [2] 根据相关目录分别进行总结 DeepSeek最大亮点 - DeepSeek整体表现与OpenAI等海外大模型第一梯队相当,但在成本控制方面优势显著,整体成本仅为OpenAI的5%-10%,商业化定价仅为2%-5% [1] DeepSeek实现“成本创新”的方式 - 采用稀疏激活的混合专家(MoE)架构,仅激活任务相关参数,降低90%算力消耗 [1] - 支持本地化部署,支持消费级硬件,无需依赖昂贵的云服务 [1] - 采用规则奖励系统,替代昂贵的“AI监工”模型,减少额外训练 [1] - 利用开源生态,借助社区贡献降低研发成本,迭代速度提升3倍 [1] DeepSeek与OpenAI成本对比 训练成本 - DeepSeek-V3训练成本仅558万美元,训练时间55天,使用2,048块NVIDIA H800 GPU,计算资源消耗远低于行业平均水平 [7] - OpenAI的GPT - 4训练成本高达10亿美元,依赖大规模全参数激活和复杂的监督微调流程,训练时间长,需数百万GPU小时支持 [8] - DeepSeek训练成本仅为OpenAI的5%-10% [8] 推理成本 - DeepSeek输入费用缓存未命中时为0.14美元/百万tokens,缓存命中时低至0.014美元/百万tokens,输出费用为0.28美元/百万tokens,采用稀疏激活策略降低推理成本 [9] - OpenAI的GPT - 4o输入费用为2.5美元/百万tokens(缓存未命中),输出费用高达10美元/百万tokens,全参数激活模式导致算力消耗巨大 [10] - DeepSeek推理成本仅为OpenAI的1/10至1/20 [10] 商业化定价 - DeepSeek提供开源模型和低成本API,每百万tokens价格仅为0.48美元,支持本地化部署消费级硬件,降低企业使用门槛 [10] - OpenAI的GPT - 4 API定价较高,每百万tokens价格为18美元,依赖昂贵的云服务资源,企业级部署硬件成本高昂 [11] - DeepSeek商业化定价仅为OpenAI的2%-5%,适合预算敏感的中小企业和开发者 [11] DeepSeek与OpenAI底层技术异同 相同点 - 基础架构都基于Transformer架构,利用自注意力机制处理输入序列,并行计算能力强,能高效处理长文本和复杂语言任务 [14] - 都强调推理能力提升,采用多步骤推理技术(如思维链推理)增强逻辑处理能力 [15] - 都采用多阶段训练流程提升模型性能 [16] 不同点 - 训练方式上,DeepSeek主要依赖强化学习(GRPO算法),不依赖大量监督微调数据;OpenAI高度依赖监督微调,依赖大量人工标注数据 [17] - 架构设计上,DeepSeek采用模块化框架和MoE架构,提高泛化能力和鲁棒性;OpenAI基于Transformer架构,优化层结构和注意力机制提升通用性和多功能性 [18] - 推理与生成能力上,DeepSeek在深度推理领域(如数学、代码生成)表现出色;OpenAI在自然语言处理和文本生成方面更突出 [19] - 成本与效率上,DeepSeek通过算法优化和模块化设计降低训练和推理成本;OpenAI成本较高,依赖大规模计算资源和高质量标注数据 [20] - 应用场景上,DeepSeek适合深度推理和专业领域知识场景;OpenAI在通用任务中表现出色 [21] DeepSeek低成本优势对全球AI产业链的影响 云计算 - 算力需求从训练向推理倾斜,预计2026年推理算力占GenAI总需求比例将突破70%,传统GPU厂商加速转型,云服务商调整策略 [22] - 边缘计算与混合云崛起,DeepSeek支持消费级硬件和端侧部署,推动算力从集中式云向边缘侧迁移,混合云架构将成主流 [23] 大模型 - 打破“算力垄断”,推动技术民主化,开源生态繁荣,模型开发重心转变,催生新Scaling Law,加速复杂任务的Agent化落地 [24] - 垂直领域模型爆发,低成本模型降低企业私有化部署门槛,推动LLM向金融、医疗、教育等垂直领域渗透 [25] 应用层 - 中小开发者与长尾市场激活,DeepSeek API定价低且支持设备端运行,使中小开发者能低成本开发AI应用,潜在市场规模超千亿 [26] - 商业模式创新,传统云计算厂商转向“AI + 行业解决方案”高毛利模式,衍生数据服务成为新增长点 [26]