Deepseek冲击波：AI狂潮下计算机行业的颠覆与重生

报告行业投资评级 - 计算机行业投资评级为推荐，维持评级 [3] 报告的核心观点 - DeepSeek崛起驱动全球科技投资重心转变，AI产业进入场景落地阶段，算力总需求暴增，计算机行业价值体系重估 [4] - 传统算力堆砌模式改变，GPU霸权松动，通用大模型厂商遇危机；推理芯片、AI Agent、数据要素等新势力崛起 [4] - 算力结构从训练为主过渡到推理主导，产业重心从基建投资转向应用爆发 [4] - 把握“低成本技术扩散→高价值场景变现”主线，超配具备数据独占性、算法工程化能力、端侧生态卡位的核心资产 [4] 根据相关目录分别进行总结一、DeepSeek冲击波及背景解析（一）DeepSeek冲击波引发全球科技市场的连锁反应 - DeepSeek凭借低成本、高性能和开源策略引发全球科技市场变革，影响产业链、资本市场和国际竞争格局 [8] - DeepSeek APP下载量和周活跃用户规模增长迅速，用户体验良好，在多领域表现出色 [8][9] - DeepSeekR1发布获广泛关注，其开源策略、低成本和高性能对科技巨头形成压力，刺激算力总需求增长，为国产芯片提供机遇 [10][11] （二）DeepSeek公司成立背景与发展历程 - DeepSeek由幻方量化联合创始人梁文峰创立，专注大语言模型研发，坚持技术创新，取得显著进展 [12] - 介绍了DeepSeek自2023年7月成立以来的主要发展历程，包括多个模型的发布时间和特点 [12][14][15] （三）DeepSeek开源战略 - DeepSeek坚持“非商业化优先”开源路线，推动AI普惠，对闭源巨头形成竞争压力，促进知识共享和技术创新 [16][18] - 列举了DeepSeek的开源过程及时间点，包括多个模型的开源情况 [17][18] 二、全球大模型对比及DeepSeek技术创新要点（一）全球大模型技术性能及成本效益对比 - DeepSeek - R1和DeepSeek - V3参数量相同，但R1推理性能在多个基准测试中更优，表明训练方法和知识蒸馏对性能至关重要 [19] - DeepSeek - R1在数学推理、代码相关、知识基准等多项测试中表现出色，与OpenAI - o1 - 1217相当或略优 [19][20] - DeepSeek和Grok3代表不同技术路线，DeepSeek通过算法优化和开源策略推动AI普惠化，在低算力、高性价比和开源生态方面有优势 [25] - 对比了DeepSeek与Grok3、GPT - 4o、Gemini 2.0的模型架构、训练策略、成本、目标用户和场景侧重等 [26] - 列举了全球主流大模型的API价格，DeepSeek价格优势明显，预计2025年AI现象级应用将持续涌现 [28][29] （二）DeepSeek技术创新的核心要点 - DeepSeekV3在Transformer框架基础上，对注意力机制和前馈神经网络采用创新架构设计，包括多头潜在注意力（MLA）和DeepSeekMoE [30] - DeepSeek算法优化历程包括R1 - Zero的纯强化学习训练、R1的多阶段训练和知识蒸馏等，提升了推理性能和小模型能力 [32][33][47] - MLA通过低秩键值联合压缩降低键值缓存，提高推理效率，在DeepSeek - V2和V3中应用效果显著 [33][34] - DeepSeekMoE架构通过专家混合系统和优化策略，降低计算量，提升模型性能，保障设备计算均衡 [41][42] - 多令牌预测（MTP）技术提高了DeepSeek - V3解码阶段的推理效率，可同时预测多个token [46] - FP8低精度训练技术降低显存占用、提升训练速度、降低能耗，为AI模型训练和应用开辟新道路 [53][54][55] - DeepSeek模型适配华为昇腾NPU平台，支持多种主流框架，降低开发和部署成本，提升运行效率 [57] 三、DeepSeek对全球AI产业链发展趋势影响（一）“杰文斯”悖论再次到来，算力需求将迎来长周期繁荣 - DeepSeekV3和R1通过工程优化降低训练成本，但中长期算力需求依旧强劲，“杰文斯”悖论使算力需求总量上升 [58][68] - 大模型推动AI应用普及，算力总需求将因AI普及而扩张，算力成为核心资源 [71][72] - DeepSeek发布文生图大模型Janus - Pro，表现优于DALL - E3，推动算力需求结构性改变，推理算力需求占比提升 [73][74] - DeepSeek优化路径降低行业对先进制程芯片依赖，利好国产算力芯片，加速国产化进程 [76] （二）DeepSeek加速AGI到来，大模型从“训练”向“推理”演进 - DeepSeekR1推动AGI时代到来，AI Agent成为通往AGI的基石，其工作流程比传统LLM交互更高效 [78][79] - 未来人工智能发展关键在于推理，推理Capex的日常经营性质越发明显，AI Agent对推理算力需求将指数级增长 [80][82] （三）新一轮“得入口者得天下”，从APP到Agent与终端生态的转变 - 技术驱动下，ICT行业核心入口从传统APP向AI Agent和终端设备主导的新生态转移，DeepSeek加速这一进程 [83] - AI Agent崛起得益于多种技术发展，能提供更人性化服务；终端设备与AI深度融合，DeepSeek提升其智能化水平 [83][84] - 中国AI Agent市场规模预计到2028年达8520亿元，年复合增长率72.7%，DeepSeek推动其市场扩张 [85] - DeepSeek赋能终端设备，在工业物联网和智能家居等领域发挥作用，AI agent模型解决端侧AI痛点，与硬件争夺流量入口 [89][90] - 多家科技公司在旗舰产品中融入大模型，促使应用生态调整接口，形成模型生态 [92] （四）DeepSeek推动AI Agent崛起，B端 + C端应用开启新篇章 - AI Agent有望成为2025年AI应用新趋势，市场规模和应用场景将扩大，全球头部公司纷纷布局 [95] - DeepSeek推动AI Agent快速进化，全球和中国数据量增长为其提供资源，国产大模型密集发布 [97] - 中国AI Agent市场空间广阔，B端重构SaaS应用，C端推动传统行业升级转型，预计2028年市场规模达8520亿元 [99][100][101] （五）生态应用统一接口条件下，端侧AI迎来巨大发展机遇 - 生态应用统一接口下，AI手机、AI PC等端侧AI解决用户痛点，迎来发展机遇 [104] - AI手机硬件升级提速，端云结合方式提升手机操作能力，华为AI助手表现出色 [104][105] - AI PC智慧加速，英特尔酷睿Ultra处理器搭载的AI PC在多层面实现跃升 [110] 四、投资建议 - 把握“低成本技术扩散→高价值场景变现”主线，建议超配具备数据独占性、算法工程化能力、端侧生态卡位的核心资产 [4] - 关注三大赛道：AI Agent产业链，2025年有望爆发，未来三年复合增长率超60%；高质量数据服务与处理提供商；端侧AI产业链 [4] - 重点个股包括宝信软件、润泽科技等多家公司 [4]