Workflow
升腾 950
icon
搜索文档
深度解读DeepSeek-模算协同-全国产闭环-Coding
2026-04-26 21:04
纪要涉及的行业或公司 * **行业**:人工智能大模型、国产AI算力、AI芯片、AI服务器、云计算、编程工具[1][2][3][4][5] * **公司**: * **AI模型公司**:深度求索(DeepSeek)[1][2][3] * **国产算力/芯片公司**:华为(升腾)、寒武纪、海光信息、云天励飞、中国长城、龙芯中科、和胜新材[1][4][5] * **AI服务器/超节点公司**:浪潮信息、中科曙光、软通动力、神州数码[1][5] * **云计算公司**:金山云、网宿科技、优刻得[5] * **编程工具公司**:卓翼信息[5] 核心观点与论据 * **DeepSeek V4模型的技术突破与影响** * 模型通过KVCache优化与三层压缩机制,实现了低成本、可工程化的Coding Agent,显著提升了开源模型在百万级上下文处理和复杂Agent推理方面的商业可行性[1][2] * 其复杂调度决策(如三层压缩机制中对实时/历史内容的不同处理)提升了对CPU性能的需求[1][2] * 采用PD分离(Prefetch和Decode按约1:3比例)与专家并行技术,优化了超节点架构,无需万卡集群即可在单节点或少量节点互联场景下达到最优适配[1][3] * 模型在编程能力上取得重要突破,性能在多个榜单上位于国内外头部模型前列[5] * **“模算协同”与国产算力生态** * DeepSeek V4实现了与国产AI算力的深度协同,即“模算协同”全栈适配,从软件生态层面缩小了与CUDA的差距[1][2] * 模型在2025年第一季度已具备基于升腾950及MXFP4精度进行训练的能力,证明了其与国产算力的深度适配[1][2] * 升腾算力成为成本关键变量,预计2026年下半年升腾950超节点批量上市后,DeepSeek V4 Pro的推理价格将大幅下调[1][4] * 寒武纪等厂商在模型发布当日即完成了对Flash/Pro模型的适配,并通过原生框架优化算子降低通信占比[1][4] * 国产算力发展进入“模算协同”新范式,并与AI模型在FP4等未来数据精度上进行更紧密的配合[4] * **对行业竞争格局的预期** * 短期可能对其他国产大模型厂商(如Minimax、智谱AI)构成市场情绪上的负面影响[3] * 中长期看,开源里程碑将带动行业并行发展,预计其他厂商追赶并实现类似技术能力的时间周期约为3到6个月,若市场出现调整反而可能为相关公司提供发展机会[1][3] 其他重要内容 * **产业链投资机会**:报告指出DeepSeek V4的发布及与国产算力的融合,利好四大产业链环节: 1. 国产AI芯片及CPU厂商(如寒武纪、海光信息等)[5] 2. 国产超节点及AI服务器龙头(如浪潮信息、中科曙光等)[5] 3. 云计算领域公司(如金山云、网宿科技等)[5] 4. 编程工具领域公司(如卓翼信息)[5] * **生态建设**:华为升腾在其CANN中推出了新的编程范式,旨在长期构建一个能够打破CUDA生态壁垒的新生态,从编译层面深化与国产大模型的适配[4]