刚刚，梁文锋被曝史上首次融资！DeepSeek V4彻底摆脱英伟达

公司融资策略转变 - 公司首次寻求外部融资，计划以不低于100亿美元的估值筹集至少3亿美元资金 [1][2] - 公司此前坚决不融资，多次拒绝国内顶级风投和科技巨头的投资意向，此次转变旨在充实资金弹药库以应对激烈的AI大模型开发竞赛 [3][6][7] - 融资成功将有助于公司获取更多算力资源并开出更高薪酬，防止顶尖研究者流失 [9] V4模型技术规格与进展 - V4模型参数量跃升至万亿级别，采用MoE架构，总参数约1万亿，但每个token仅激活约370亿参数，推理成本与前代V3持平 [17][18] - 模型上下文窗口扩展到100万token，引入Engram条件记忆架构，在该长度下的信息召回率达到97% [20] - V4将是公司首个原生多模态模型，支持文本、图像和视频生成 [22] - 模型代码能力大幅强化，内部benchmark显示SWE-bench成绩超过80%，HumanEval达到90%，能处理整个代码仓库级别的复杂bug修复 [23] - V4预计分两个版本发布：完整版超万亿参数，针对高级推理和复杂代码任务；轻量版约2000亿参数，面向通用对话和API服务 [24] - 模型计划以Apache 2.0协议开源权重 [25] - 多个信源指向V4将于4月底发布，近期已有测试版本短暂出现，且公司开始招聘算力基础设施相关驻场人员，表明已进入大规模部署准备阶段 [26][27][28] 硬件生态迁移与战略影响 - V4模型将运行在华为最新的昇腾芯片上，公司工程师花费大量时间将核心代码从英伟达CUDA生态迁移至华为CANN架构 [31][32] - 公司刻意未向英伟达和AMD提供V4做早期优化适配，而是将早期访问权限独家给了国产芯片厂商 [33] - 若V4在华为芯片上跑出有竞争力的性能，将是全球首个不依赖英伟达的前沿AI模型 [34] - 英伟达CEO对此表示担忧，认为AI模型被优化为在中国硬件上运行对美国芯片产业将是一个糟糕的结果 [35][36] 行业竞争背景 - 公司新一代模型发布已推迟一年半，而全球各大顶尖模型正在快速迭代，中美科技巨头凭借资金优势不断占领高位 [9][11] - 根据斯坦福大学2026年度AI指数报告，截至今年3月，美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点 [40] - 竞争对手OpenAI近期以8520亿美元估值完成了1220亿美元融资，相比之下公司寻求的3亿美元融资规模较小 [40]