梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达
创业邦·2026-04-18 11:19

公司融资动态 - 公司正寻求首次外部融资,计划以不低于100亿美元的估值筹集至少3亿美元资金 [2] - 公司此前坚决不融资,多次拒绝顶级风投和科技巨头的投资意向,此次融资标志着其策略的重大转变 [5][6] - 融资目的包括获取更多算力、提供更高薪酬以防止顶尖研究者流失,以应对日益激烈的行业竞争 [6] 新一代模型V4的技术规格 - V4模型参数量跃升至万亿级别,采用MoE架构,总参数约1万亿,但每个token仅激活约370亿参数,推理成本与V3持平 [8] - 模型上下文窗口扩展到100万token,并引入Engram条件记忆架构,在该长度下的信息召回率达到97% [10] - V4将是公司首个原生多模态模型,支持文本、图像和视频生成 [12] - 模型代码能力大幅强化,内部基准测试显示SWE-bench成绩超过80%,HumanEval达到90%,能处理代码仓库级别的复杂bug修复 [13] - V4计划分两个版本发布:完整版超万亿参数,针对高级推理和复杂代码任务,面向华为昇腾芯片;轻量版约2000亿参数,面向通用对话和API服务,可在其他国产芯片上运行 [13] - 公司计划以Apache 2.0协议开源V4模型的权重 [13] 模型发布与部署进展 - V4原定今年2月发布,但已多次跳票,最新发布时间窗口指向“未来几周内”或4月底 [8][13] - 测试版本“V4 Lite”曾短暂出现,其推理速度提升30%,128K上下文的信息召回率从45%提升至94% [13] - 公司在内蒙古乌兰察布发布服务器运维和交付经理的招聘岗位,这是其首次公开招聘算力基础设施驻场人员,表明V4已进入大规模部署准备阶段 [13][14] 底层硬件战略迁移 - V4延期的核心原因在于底层硬件的大迁移,模型将运行在华为最新的昇腾芯片上,而非此前一直依赖的英伟达芯片 [16] - 工程师花费大量时间重写核心代码,将模型从英伟达CUDA生态迁移至华为CANN架构 [16] - 公司刻意未向英伟达和AMD提供V4做优化适配,而是将早期访问权限独家给了国产芯片厂商 [16] - 若V4在华为芯片上跑出有竞争力性能,将成为全球首个不依赖英伟达的前沿AI模型,英伟达CEO对此表示担忧 [16] 行业竞争格局 - 在极其烧钱的AI大模型开发竞赛中,公司也需要充实资金弹药库 [2] - 全球顶尖模型快速迭代,中美科技巨头凭借财力优势不断占领高位,给公司带来竞争压力 [6] - 根据斯坦福大学2026年度AI指数报告,截至今年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点 [19] - 作为对比,OpenAI近期以3000亿美元估值完成了400亿美元融资 [19]

梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达 - Reportify