梁文锋被曝史上首次融资！DeepSeek V4彻底摆脱英伟达

公司融资动态 - 公司正寻求首次外部融资，计划以不低于100亿美元的估值筹集至少3亿美元资金 [2] - 公司此前坚决不融资，多次拒绝顶级风投和科技巨头的投资意向，此次融资标志着其策略的重大转变 [5][6] - 融资目的包括获取更多算力、提供更高薪酬以防止顶尖研究者流失，以应对日益激烈的行业竞争 [6] 新一代模型V4的技术规格 - V4模型参数量跃升至万亿级别，采用MoE架构，总参数约1万亿，但每个token仅激活约370亿参数，推理成本与V3持平 [8] - 模型上下文窗口扩展到100万token，并引入Engram条件记忆架构，在该长度下的信息召回率达到97% [10] - V4将是公司首个原生多模态模型，支持文本、图像和视频生成 [12] - 模型代码能力大幅强化，内部基准测试显示SWE-bench成绩超过80%，HumanEval达到90%，能处理代码仓库级别的复杂bug修复 [13] - V4计划分两个版本发布：完整版超万亿参数，针对高级推理和复杂代码任务，面向华为昇腾芯片；轻量版约2000亿参数，面向通用对话和API服务，可在其他国产芯片上运行 [13] - 公司计划以Apache 2.0协议开源V4模型的权重 [13] 模型发布与部署进展 - V4原定今年2月发布，但已多次跳票，最新发布时间窗口指向“未来几周内”或4月底 [8][13] - 测试版本“V4 Lite”曾短暂出现，其推理速度提升30%，128K上下文的信息召回率从45%提升至94% [13] - 公司在内蒙古乌兰察布发布服务器运维和交付经理的招聘岗位，这是其首次公开招聘算力基础设施驻场人员，表明V4已进入大规模部署准备阶段 [13][14] 底层硬件战略迁移 - V4延期的核心原因在于底层硬件的大迁移，模型将运行在华为最新的昇腾芯片上，而非此前一直依赖的英伟达芯片 [16] - 工程师花费大量时间重写核心代码，将模型从英伟达CUDA生态迁移至华为CANN架构 [16] - 公司刻意未向英伟达和AMD提供V4做优化适配，而是将早期访问权限独家给了国产芯片厂商 [16] - 若V4在华为芯片上跑出有竞争力性能，将成为全球首个不依赖英伟达的前沿AI模型，英伟达CEO对此表示担忧 [16] 行业竞争格局 - 在极其烧钱的AI大模型开发竞赛中，公司也需要充实资金弹药库 [2] - 全球顶尖模型快速迭代，中美科技巨头凭借财力优势不断占领高位，给公司带来竞争压力 [6] - 根据斯坦福大学2026年度AI指数报告，截至今年3月，美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点 [19] - 作为对比，OpenAI近期以3000亿美元估值完成了400亿美元融资 [19]