Workflow
模算协同
icon
搜索文档
深度解读DeepSeek-模算协同-全国产闭环-Coding
2026-04-26 21:04
纪要涉及的行业或公司 * **行业**:人工智能大模型、国产AI算力、AI芯片、AI服务器、云计算、编程工具[1][2][3][4][5] * **公司**: * **AI模型公司**:深度求索(DeepSeek)[1][2][3] * **国产算力/芯片公司**:华为(升腾)、寒武纪、海光信息、云天励飞、中国长城、龙芯中科、和胜新材[1][4][5] * **AI服务器/超节点公司**:浪潮信息、中科曙光、软通动力、神州数码[1][5] * **云计算公司**:金山云、网宿科技、优刻得[5] * **编程工具公司**:卓翼信息[5] 核心观点与论据 * **DeepSeek V4模型的技术突破与影响** * 模型通过KVCache优化与三层压缩机制,实现了低成本、可工程化的Coding Agent,显著提升了开源模型在百万级上下文处理和复杂Agent推理方面的商业可行性[1][2] * 其复杂调度决策(如三层压缩机制中对实时/历史内容的不同处理)提升了对CPU性能的需求[1][2] * 采用PD分离(Prefetch和Decode按约1:3比例)与专家并行技术,优化了超节点架构,无需万卡集群即可在单节点或少量节点互联场景下达到最优适配[1][3] * 模型在编程能力上取得重要突破,性能在多个榜单上位于国内外头部模型前列[5] * **“模算协同”与国产算力生态** * DeepSeek V4实现了与国产AI算力的深度协同,即“模算协同”全栈适配,从软件生态层面缩小了与CUDA的差距[1][2] * 模型在2025年第一季度已具备基于升腾950及MXFP4精度进行训练的能力,证明了其与国产算力的深度适配[1][2] * 升腾算力成为成本关键变量,预计2026年下半年升腾950超节点批量上市后,DeepSeek V4 Pro的推理价格将大幅下调[1][4] * 寒武纪等厂商在模型发布当日即完成了对Flash/Pro模型的适配,并通过原生框架优化算子降低通信占比[1][4] * 国产算力发展进入“模算协同”新范式,并与AI模型在FP4等未来数据精度上进行更紧密的配合[4] * **对行业竞争格局的预期** * 短期可能对其他国产大模型厂商(如Minimax、智谱AI)构成市场情绪上的负面影响[3] * 中长期看,开源里程碑将带动行业并行发展,预计其他厂商追赶并实现类似技术能力的时间周期约为3到6个月,若市场出现调整反而可能为相关公司提供发展机会[1][3] 其他重要内容 * **产业链投资机会**:报告指出DeepSeek V4的发布及与国产算力的融合,利好四大产业链环节: 1. 国产AI芯片及CPU厂商(如寒武纪、海光信息等)[5] 2. 国产超节点及AI服务器龙头(如浪潮信息、中科曙光等)[5] 3. 云计算领域公司(如金山云、网宿科技等)[5] 4. 编程工具领域公司(如卓翼信息)[5] * **生态建设**:华为升腾在其CANN中推出了新的编程范式,旨在长期构建一个能够打破CUDA生态壁垒的新生态,从编译层面深化与国产大模型的适配[4]
计算机行业周报20260425:深度解析DeepSeekV4:“模算协同”全国产闭环+Coding-20260425
国联民生证券· 2026-04-25 20:27
行业投资评级 - 报告对计算机行业给予“推荐”评级 [12] 核心观点 - DeepSeek V4系列模型发布,其技术革新(尤其在编程领域能力提升)和“模算协同”全国产闭环,为国产算力开辟了全新发展空间 [6][15][31][44] - AI Agent时代Token需求的非线性增长,可能直接带来超预期的AI算力需求,国产算力自身价值有望持续提升 [6][47] - 国产算力(如华为昇腾、寒武纪)已与DeepSeek V4实现深度适配,预计下半年昇腾950超节点批量上市后,模型服务价格将大幅下调,推动“模算协同”大规模应用 [31][34][44] 市场回顾 - 本周(04.20-04.24)沪深300指数上涨0.86%,中小板指数上涨1.90%,创业板指数下跌0.29%,计算机(中信)板块上涨0.12% [3][54] - 板块个股涨幅前五名:皖通科技(21%)、品高股份(19%)、宏景科技(18%)、佳华科技(17%)、杰创智能(16%) [3][60] - 板块个股跌幅前五名:实达集团(-30%)、*ST国华(-23%)、品茗科技(-20%)、信安世纪(-20%)、真视通(-18%) [3][60] 行业要闻 - DeepSeek-V4预览版上线,拥有百万字(1M)超长上下文,在Agent能力、世界知识和推理性能上实现领先 [4][48] - 腾讯混元Hy3 preview语言模型开源,总参数295B,激活参数21B,最大支持256K上下文 [4][49] - 字节跳动发布高精度3D生成大模型Seed3D 2.0,在几何与材质生成上取得SOTA结果 [4][50] 公司动态 - **软通动力**:2025年全年营收**350.90亿元**,同比增长**12.05%**;归母净利润**2.06亿元**,同比增长**14.27%**。2026年Q1营收**81.17亿元**,同比增长**15.79%**,其中AI相关业务营收**45.14亿元**,同比大增**39%**。2025年AI相关业务收入达**184.66亿元**,占总营收比重**52.6%** [5][51] - **达梦数据**:发布四款战略新品,其中DM9数据库实现450余项新特性升级,支持AI智能体 [5][51] - **中科曙光**:2026年Q1营收**31.99亿元**,同比增长**23.71%**;归母净利润**2.28亿元**,同比增长**22.19%** [52] - **中国软件**:2026年Q1营业总收入**7.09亿元**,同比增长**10.77%**,归母净利润亏损**-7371.63万元**,亏损同比缩小**8.57%** [53] DeepSeek V4技术解析 - **模型能力**:V4-Pro在Agentic Coding评测中达开源模型最佳水平,实测体验优于Sonnet 4.5,接近Opus 4.6非思考模式;世界知识类测评成绩大幅领先其他开源模型;在数学、STEM、代码类测评中比肩全球顶级闭源模型 [15][16] - **关键性能数据**:V4-Pro在MMLU-Pro得分为**87.5**,在LiveCodeBench得分为**93.5**,在SWE-bench-Verified得分为**80.6** [19] - **长上下文技术**:采用压缩序列注意力(CSA)和混合压缩注意力(HCA)新机制,实现百万上下文标配,并大幅降低计算和显存需求 [20][23][26] - **国产算力适配**:模型细粒度专家并行(EP)方案在英伟达GPU和华为昇腾NPU上完成验证,在通用推理任务上实现**1.50 ~ 1.73倍**加速,在延迟敏感场景最高加速比达**1.96倍** [31] 国产算力发展机遇 - **华为昇腾**: - 昇腾950超节点支持DeepSeek V4,在8K输入场景下,V4-Pro模型单卡Decode吞吐达**4700TPS**(TPOT约20ms),V4-Flash模型单卡Decode吞吐达**1600TPS**(TPOT约10ms)[34] - 昇腾A3超节点已实现V4-Flash模型单卡Decode吞吐**2000+TPS** [38] - 昇腾950芯片支持FP8、MXFP8、MXFP4等格式,可降低内存占用**50%+**,计算能力翻倍 [36] - Atlas 950 AI超节点总算力达FP8精度**8EFLOPS**、FP4精度**16EFLOPS**,总显存**1152TB** [46] - **寒武纪**:在DeepSeek V4开源当日完成Day 0适配,依托自研NeuWare软件生态实现快速模型迁移与极致性能优化 [40][41] - **编程生态**:昇腾推出PyPTO编程范式,可使DeepSeek V4新一代模型算子开发周期缩短至天级 [39] 投资建议 - 建议重点关注四大方向 [6][47]: 1. **国产AI芯片/CPU**:寒武纪、海光信息、云天励飞、中国长城、龙芯中科、禾盛新材 2. **国产超节点龙头**:浪潮信息、中科曙光、软通动力、神州数码、慧博云通、拓维信息、工业富联、彩讯股份、高新发展 3. **云计算**:金山云、网宿科技、优刻得、青云科技 4. **AI编程**:卓易信息、普元信息、金现代