DeepSeek-V4模型发布与核心能力 - 文章核心观点:DeepSeek-V4的发布不仅是模型能力的重大升级,更标志着AI产业底层逻辑的转变,特别是顶尖模型适配国产算力、国产算力体系规模化以及生态协同的初步形成,正在挑战由英伟达CUDA主导的全球AI算力格局 [4] - DeepSeek-V4发布两款模型:DeepSeek-V4-Pro和DeepSeek-V4-Flash,并于4月24日发布预览版 [1] - DeepSeek-V4-Pro模型规模达1.6万亿参数,激活参数为490亿,预训练数据达33万亿tokens,上下文长度为100万tokens [2] - DeepSeek-V4-Flash模型参数为2840亿,激活参数为130亿,预训练数据达32万亿tokens,上下文长度同样为100万tokens [2] - 模型能力显著提升:在复杂推理、Agent多轮任务处理及代码生成等关键能力上,开始逼近OpenAI与Anthropic等头部闭源模型 [11] - DeepSeek-V4-Pro的Agent能力达到当前开源模型最佳水平,内部使用体验优于Claude Sonnet4.5,交付质量接近GPT-4 Opus非思考模式 [11] - 在数学、STEM、竞赛型代码测评中,DeepSeek-V4-Pro超越所有已公开评测的开源模型,取得比肩世界顶级闭源模型的成绩 [11] - 模型采用创新的注意力机制,大幅降低对计算和显存的需求,并使100万上下文长度成为标配,提升了推理效率 [14] - 公司保持了强大的成本控制优势:DeepSeek-V4-Pro输入(缓存命中)价格低至1元/百万Tokens,输出价格为24元/百万Tokens;DeepSeek-V4-Flash输入(缓存命中)价格低至0.2元/百万Tokens,输出价格为2元/百万Tokens [14][15] - DeepSeek-V4-Flash并非低配版,其推理能力、Agent能力与V4-Pro接近,同属大模型第一梯队,主要在高难度任务上存在差距 [17] 国产算力生态崛起与产业影响 - DeepSeek-V4在华为昇腾平台首发,昇腾超节点全系列产品支持该系列模型,其中昇腾950通过融合kernel和多流并行技术大幅提升推理性能 [1] - 寒武纪基于vLLM推理框架完成了对DeepSeek-V4两个版本的Day0适配,一个围绕国产算力的先进模型运行与部署体系正在快速成型 [4] - 根据IDC报告,2025年国产GPU与AI芯片厂商市场份额攀升至41%,总出货量约400万张,其中华为出货量排名第一,占总量近半 [4] - 华为昇腾CANN框架成为英伟达CUDA的重要挑战者,它连接上层AI框架与底层硬件,是华为昇腾AI生态的核心软件底座 [23] - CANN走开源开放之路,已升级至8.0版本,兼容PyTorch、TensorFlow等主流AI框架,适配昇腾全系列芯片,形成了“芯片+CANN+框架”的原生生态 [24] - 华为昇腾芯片按计划快速迭代:2026年推出昇腾950系列,2027年迭代到960,2028年到970,几乎以“一年一代算力翻倍”的速度推进 [23] - 受DeepSeek-V4发布及国产算力生态进展影响,4月24日A股海光信息、摩尔线程、沐曦股份等多家千亿市值算力芯片巨头股价集体飙升 [7][8] - 港股中芯国际大涨10%,华虹半导体大涨15%,资金抢筹迹象明显 [8] - 与此同时,港股AI应用板块遭遇重挫,“Token第一股”迅策收盘跌近16%,智谱、MINIMAX分别跌逾9% [9] 全球大模型竞争格局与行业演进 - 全球大模型竞争已从“季度级发布”进入“月更级甚至周更级演进”,技术进步明显加速 [19] - 2026年前四个月,全球头部厂商已密集发布数十款具有代表性的模型或关键迭代版本 [18] - 海外阵营中,OpenAI连续推出GPT-5.3 Codex、GPT-5.4及GPT-5.5等多个版本;Anthropic密集迭代Claude 4.x系列;Google DeepMind通过Gemini 3.x系列推进多模态与统一模型架构 [18] - 国内阵营同样进入竞速周期:阿里巴巴迭代Qwen系列;字节跳动推进豆包大模型;腾讯升级混元大模型;MiniMax在多模态与长上下文领域频繁发布新版本;Kimi、智谱等厂商也在持续迭代 [19] - 大模型竞争正从单一维度对比走向综合能力比拼,未来的赢家是能在性能、成本与生态之间取得平衡的系统型玩家 [18] - DeepSeek-V4支持英伟达生态,其细粒度专家并行方案已在英伟达GPU和华为昇腾NPU上完成验证 [4] 公司动态与市场信号 - 近期关于DeepSeek融资的消息不断传出,估值数字由200亿美元跳至400亿美元,并有腾讯、阿里入局的消息 [5] - 更有媒体报道其本轮融前估值达3000亿元(约合440亿美元),这一数字已超过已上市的MiniMax的市值,接近智谱的市值 [5] - DeepSeek-V4的发布被视为一次产业信号的集中释放,标志着AI竞争的底层逻辑正在发生转变 [4] - 公司预计,下半年昇腾950超节点批量上市后,DeepSeek-V4-Pro的价格会大幅下调 [22] - 华为昇腾与DeepSeek的组合,正在将“算力体系选择”这一影响未来产业格局的关键变量推向台前 [25]
DeepSeek估值或达3000亿元,国产芯片股彻底引爆,有个股7分钟直线涨停
21世纪经济报道·2026-04-25 08:49