文章核心观点 - DeepSeek本身有优化创新点和局限,其成功对整体AI发展有积极意义,对算力层面非断崖式负面影响,在算力、端侧、应用等方面带来不同影响,投资者可据此调整投资组合 [1] - DeepSeek开源战略和低成本API推动AI技术从云端向终端渗透,降低成本创造投资机会 [9] - Janus - Pro和DeepSeek - R1展示算法创新可降低算力需求,推动AI发展 [13][14] - DeepSeek带动TMT板块反弹,推动科技产业链发展,吸引全球资本关注 [16] - 未来大模型公司竞争聚焦“算法效率”,DeepSeek影响英伟达高端GPU份额,吸引资本流入中国AI领域 [22][24] 分组1:DeepSeek模型特点 - DeepSeek V3以来使用FP8混合精度训练等降低模型训练成本,R1 - Zero不用SFT通过多轮RL迭代提升推理能力,蒸馏有效提升端侧模型推理能力上限/降低门槛 [1] - DeepSeek R1通过开源、高性能和低成本API对标OpenAI的o1模型,在数学推理和代码生成等任务表现卓越 [9] - DeepSeek - R1在数学推理等领域表现出色,输入和输出费用低,采用创新两阶段强化学习提升推理能力并降低成本 [14] 分组2:DeepSeek对算力的影响 - 23 - 24年全球算力叙事逻辑在24年底转变,DeepSeek出现使26年后算力资本开支重点不确定性提升,不同企业有不同倾向,算力使用方式多元化,NV链条中期确定性下降,推理逻辑相关公司确定性较高 [1][3][4] - Janus - Pro证明算法创新可显著降低算力需求,大模型不再依赖庞大算力资源 [13] - DeepSeek实现算力有效压缩,为全球AI大模型提供降本路径,激发推理端算力需求增长 [15] - DeepSeek低成本训练表明低端GPU能实现类似性能,可能影响英伟达高端GPU市场份额 [24] 分组3:DeepSeek对端侧的影响 - R1可蒸馏特性利好本地化部署的AI手机,手机应用可能提前落地,中美端侧用户体验大概率对齐,自动驾驶方面国内有望推出类似体验软件版本且降低训练成本,端对端有领先优势的整车企业有望重估 [5][6][7] - DeepSeek R1通过蒸馏生成的轻量化模型适用于自动驾驶、手机端语音助手等场景 [9] - 微软的DeepSeek - R1模型应用于智能手机、汽车等设备,带来高效本地化部署方案 [23] 分组4:DeepSeek对应用的影响 - 国内Agents类应用落地加速,但付费生态与美国有差距,2025年围绕互联网生态进行大模型商业开发的实施性企业边际投资机会高,更看好云服务企业 [7][8] - DeepSeek推动AI商业化落地和垂直领域应用创新,中小企业可利用其技术在电商、教育等领域部署解决方案 [9][11] 分组5:投资组合思路 - 2025年算力配置重要性下降,但仍选择部分A股算力标的赚业绩兑现收益,未来增加端侧和应用相关标的配置,用两个季度左右优化结构,关注低估的消费电子标的 [8] 分组6:对A股市场的影响 - DeepSeek带动TMT板块反弹,推动科技产业链发展,随着AI创新和其示范效应,可能引发科技成长风格回升,加速AI应用普及,吸引全球资本关注推动市值扩张 [16][19][20] 分组7:行业发展趋势 - 目前AI算力增长范式未变,未来大模型公司竞争聚焦“算法效率”,投资重点可能转向算法优化 [21][22] - 开源模型加速AI技术普及,推动AI公司重新思考商业模式,使AI技术向更广泛领域渗透 [24] 分组8:其他影响 - DeepSeek成功可能提高投资者对中国AI公司产业链预期,吸引资本流入,可能提高恒生科技指数估值,美国可能加强对中国AI出口管制 [24]
专家访谈汇总:DeepSeek是“算力屠夫”?
阿尔法工场研究院·2025-02-05 18:08