市场表现 - 1月27日,DeepSeek在中美苹果App Store免费榜登顶,同日美国科技股市场大幅下跌,费城半导体指数(SOX)下跌9.2%,英伟达股价下跌近17%,市值蒸发近6000亿美元,WTI原油价格盘中一度下跌3%[2] 成本优势 - DeepSeek推理成本低,每百万Token输入成本仅1元,R1模型输入和输出价格仅为OpenAI o1模型的3%[3][7] - DeepSeek训练成本不超600万美元,使用约2000张H800 GPU,预训练每万亿Token用2048个H800 GPU集群,180K个GPU小时(约3.7天)可完成,总耗时约2788K GPU小时[5][6][7] 训练策略 - DeepSeek团队创新训练策略,在监督微调环节优化,推出DeepSeek - R1 - Zero版本,引入少量冷启动数据提升稳定性和推理能力,摒弃RLHF中的人类反馈部分[9] - 用数千条链式思考数据微调V3 - Base模型,生成80万个样本数据微调得到R1模型,降低成本并提升推理和语言生成质量[10] 产业影响 - DeepSeek对依赖自研大模型构建商业模式的公司影响显著,如引发Meta内部担忧,Meta成立小组分析其技术原理并计划用于Llama模型优化[12] - 美国大型科技企业以保持技术领先为主,虽可能借鉴DeepSeek方法优化成本,但不会作为核心战略,LLM发展需大量算力,未来其他ML模型也可能有巨大算力需求[13] 英伟达前景 - 短期内,DeepSeek成果冲击英伟达股价,但长期看,随着AI商业化加速,依据杰文斯悖论,市场对英伟达芯片需求可能增加[14] - DeepSeek降低LLM开发门槛,若引发中小型企业、家庭和个人推理需求增长,增量需求将超AI巨头减少的GPU采购量,商业化后推理环节算力消耗更大[15]
中国宏观经济月报:DeepSeek对英伟达长期股价的潜在影响
致富证券·2025-02-12 20:02