机器学习（ML）模型 - 财报，业绩电话会，研报，新闻

机器学习（ML）模型

搜索文档

致富证券· 2025-03-12 14:38

报告行业投资评级未提及报告的核心观点 - DeepSeek在训练和推理成本上有显著优势，引发科技股大幅波动，短期内冲击英伟达股价，但长远看随着AI技术普及和商业化加速，英伟达芯片需求可能进一步增长，AI产业将迈向新阶段 [2][3][16] 根据相关目录分别进行总结 DeepSeek引发市场波动 - 1月27日，DeepSeek在中国区和美国区苹果App Store免费榜登顶，美国科技股市场大幅下跌，费城半导体指数下跌9.2%，英伟达股价下跌近17%，市值蒸发近6000亿美元，WTI原油价格盘中一度下跌3% [2] DeepSeek成本优势 - 训练成本方面，DeepSeek使用约2000张H800 GPU训练，V3模型训练成本不超过600万美元，预训练阶段每万亿Token训练用2048个H800 GPU集群，180K个GPU小时（约3.7天）完成，总耗时约2788K GPU小时 [5][6] - 推理成本方面，OpenAI的o1模型每百万输入和输出Token分别收费15美元和60美元，DeepSeek的R1模型相同输入和输出价格仅为OpenAI的3%，DeepSeek推理成本API报价每百万Token输入成本仅1元 [3][7] DeepSeek低成本训练实现方式 - DeepSeek团队创新训练策略，在监督微调环节优化，最初尝试跳过SFT步骤仅用强化学习训练，引入少量冷启动数据提升稳定性和推理能力，R1系列模型摒弃RLHF中的人类反馈部分 [9] - 为解决纯强化学习训练文本中英混杂问题，用数千条链式思考数据微调V3 - Base模型，再启动强化学习流程生成样本数据微调得到R1模型，降低成本同时提升推理和语言生成质量 [10] DeepSeek对AI产业影响 - 对依赖自研大模型构建商业模式的公司影响更显著，如引发Meta内部AI团队担忧，Meta成立小组分析其技术原理并计划用于Llama模型优化 [12] - 美国大型科技企业以保持技术领先为首要目标，虽可能借鉴DeepSeek方法优化成本，但不会作为核心战略，现阶段大语言模型发展需大量算力，未来其他机器学习模型也可能有巨大算力需求 [13] - 英伟达认为DeepSeek成果会增加市场对其芯片需求，依据杰文斯悖论，技术进步降低资源使用成本会使市场对资源总体需求上升 [14] - DeepSeek降低大语言模型开发门槛，促使更多中小型企业和个人训练私有模型，若引发推理需求“第二波”增长，增量需求将远超AI巨头减少的GPU采购量，且商业化后推理环节算力消耗更大 [15]