Workflow
Deepseek冲击波:AI狂潮下计算机行业的颠覆与重生
中国银河·2025-02-24 07:45

报告行业投资评级 - 计算机行业投资评级为推荐,维持评级 [3] 报告的核心观点 - DeepSeek崛起驱动全球科技投资重心转变,AI产业进入场景落地阶段,算力总需求暴增,计算机行业价值体系重估 [4] - 传统算力堆砌模式改变,GPU霸权松动,通用大模型厂商遇危机;推理芯片、AI Agent、数据要素等新势力崛起 [4] - 算力结构从训练为主过渡到推理主导,产业重心从基建投资转向应用爆发 [4] - 把握“低成本技术扩散→高价值场景变现”主线,超配具备数据独占性、算法工程化能力、端侧生态卡位的核心资产 [4] 根据相关目录分别进行总结 一、DeepSeek冲击波及背景解析 (一)DeepSeek冲击波引发全球科技市场的连锁反应 - DeepSeek凭借低成本、高性能和开源策略引发全球科技市场变革,影响产业链、资本市场和国际竞争格局 [8] - DeepSeek APP下载量和周活跃用户规模增长迅速,用户体验良好,在多领域表现出色 [8][9] - DeepSeekR1发布获广泛关注,其开源策略、低成本和高性能对科技巨头形成压力,刺激算力总需求增长,为国产芯片提供机遇 [10][11] (二)DeepSeek公司成立背景与发展历程 - DeepSeek由幻方量化联合创始人梁文峰创立,专注大语言模型研发,坚持技术创新,取得显著进展 [12] - 介绍了DeepSeek自2023年7月成立以来的主要发展历程,包括多个模型的发布时间和特点 [12][14][15] (三)DeepSeek开源战略 - DeepSeek坚持“非商业化优先”开源路线,推动AI普惠,对闭源巨头形成竞争压力,促进知识共享和技术创新 [16][18] - 列举了DeepSeek的开源过程及时间点,包括多个模型的开源情况 [17][18] 二、全球大模型对比及DeepSeek技术创新要点 (一)全球大模型技术性能及成本效益对比 - DeepSeek - R1和DeepSeek - V3参数量相同,但R1推理性能在多个基准测试中更优,表明训练方法和知识蒸馏对性能至关重要 [19] - DeepSeek - R1在数学推理、代码相关、知识基准等多项测试中表现出色,与OpenAI - o1 - 1217相当或略优 [19][20] - DeepSeek和Grok3代表不同技术路线,DeepSeek通过算法优化和开源策略推动AI普惠化,在低算力、高性价比和开源生态方面有优势 [25] - 对比了DeepSeek与Grok3、GPT - 4o、Gemini 2.0的模型架构、训练策略、成本、目标用户和场景侧重等 [26] - 列举了全球主流大模型的API价格,DeepSeek价格优势明显,预计2025年AI现象级应用将持续涌现 [28][29] (二)DeepSeek技术创新的核心要点 - DeepSeekV3在Transformer框架基础上,对注意力机制和前馈神经网络采用创新架构设计,包括多头潜在注意力(MLA)和DeepSeekMoE [30] - DeepSeek算法优化历程包括R1 - Zero的纯强化学习训练、R1的多阶段训练和知识蒸馏等,提升了推理性能和小模型能力 [32][33][47] - MLA通过低秩键值联合压缩降低键值缓存,提高推理效率,在DeepSeek - V2和V3中应用效果显著 [33][34] - DeepSeekMoE架构通过专家混合系统和优化策略,降低计算量,提升模型性能,保障设备计算均衡 [41][42] - 多令牌预测(MTP)技术提高了DeepSeek - V3解码阶段的推理效率,可同时预测多个token [46] - FP8低精度训练技术降低显存占用、提升训练速度、降低能耗,为AI模型训练和应用开辟新道路 [53][54][55] - DeepSeek模型适配华为昇腾NPU平台,支持多种主流框架,降低开发和部署成本,提升运行效率 [57] 三、DeepSeek对全球AI产业链发展趋势影响 (一)“杰文斯”悖论再次到来,算力需求将迎来长周期繁荣 - DeepSeekV3和R1通过工程优化降低训练成本,但中长期算力需求依旧强劲,“杰文斯”悖论使算力需求总量上升 [58][68] - 大模型推动AI应用普及,算力总需求将因AI普及而扩张,算力成为核心资源 [71][72] - DeepSeek发布文生图大模型Janus - Pro,表现优于DALL - E3,推动算力需求结构性改变,推理算力需求占比提升 [73][74] - DeepSeek优化路径降低行业对先进制程芯片依赖,利好国产算力芯片,加速国产化进程 [76] (二)DeepSeek加速AGI到来,大模型从“训练”向“推理”演进 - DeepSeekR1推动AGI时代到来,AI Agent成为通往AGI的基石,其工作流程比传统LLM交互更高效 [78][79] - 未来人工智能发展关键在于推理,推理Capex的日常经营性质越发明显,AI Agent对推理算力需求将指数级增长 [80][82] (三)新一轮“得入口者得天下”,从APP到Agent与终端生态的转变 - 技术驱动下,ICT行业核心入口从传统APP向AI Agent和终端设备主导的新生态转移,DeepSeek加速这一进程 [83] - AI Agent崛起得益于多种技术发展,能提供更人性化服务;终端设备与AI深度融合,DeepSeek提升其智能化水平 [83][84] - 中国AI Agent市场规模预计到2028年达8520亿元,年复合增长率72.7%,DeepSeek推动其市场扩张 [85] - DeepSeek赋能终端设备,在工业物联网和智能家居等领域发挥作用,AI agent模型解决端侧AI痛点,与硬件争夺流量入口 [89][90] - 多家科技公司在旗舰产品中融入大模型,促使应用生态调整接口,形成模型生态 [92] (四)DeepSeek推动AI Agent崛起,B端 + C端应用开启新篇章 - AI Agent有望成为2025年AI应用新趋势,市场规模和应用场景将扩大,全球头部公司纷纷布局 [95] - DeepSeek推动AI Agent快速进化,全球和中国数据量增长为其提供资源,国产大模型密集发布 [97] - 中国AI Agent市场空间广阔,B端重构SaaS应用,C端推动传统行业升级转型,预计2028年市场规模达8520亿元 [99][100][101] (五)生态应用统一接口条件下,端侧AI迎来巨大发展机遇 - 生态应用统一接口下,AI手机、AI PC等端侧AI解决用户痛点,迎来发展机遇 [104] - AI手机硬件升级提速,端云结合方式提升手机操作能力,华为AI助手表现出色 [104][105] - AI PC智慧加速,英特尔酷睿Ultra处理器搭载的AI PC在多层面实现跃升 [110] 四、投资建议 - 把握“低成本技术扩散→高价值场景变现”主线,建议超配具备数据独占性、算法工程化能力、端侧生态卡位的核心资产 [4] - 关注三大赛道:AI Agent产业链,2025年有望爆发,未来三年复合增长率超60%;高质量数据服务与处理提供商;端侧AI产业链 [4] - 重点个股包括宝信软件、润泽科技等多家公司 [4]