公司融资动态 - 公司DeepSeek寻求首次外部融资,计划以不低于100亿美元的估值筹集至少3亿美元资金[2] - 公司此前一直保持“从不融资”的立场,此次融资标志着其创始人梁文锋的重大战略转变[6][7][8] - 融资目的旨在充实资金弹药库,以应对AI大模型开发的巨额成本,并用于获取更多算力和支付更高薪酬以留住顶尖人才[3][10] 新一代模型V4技术规格 - 模型参数量跃升至万亿级别,采用MoE架构,总参数约1万亿,但每个token仅激活约370亿参数以保持推理成本与V3持平[19] - 上下文窗口扩展到100万token,并引入Engram条件记忆架构,据称在100万token长度下的信息召回率达到97%[21] - V4将是公司首个原生多模态模型,支持文本、图像和视频生成[23] - 代码能力大幅强化,内部benchmark显示SWE-bench成绩超过80%,HumanEval达到90%,旨在处理整个代码仓库级别的复杂bug修复[24] - 模型计划分两个版本发布:完整版超万亿参数针对高级推理和复杂代码任务优化;轻量版约2000亿参数面向通用对话和API服务[26] - 公司计划以Apache 2.0协议开放V4的权重,延续其开源策略[27] 模型发布与部署进展 - V4原定于2026年2月发布,但已多次推迟,最新时间窗口指向“未来几周内”[16][17] - 多个信源指向V4可能在4月底发布[28] - 测试版本“V4 Lite”曾于3月9日短暂出现在公司平台上,随后被撤下;4月初API节点上再次出现测试版本,推理速度提升30%,128K上下文的信息召回率从45%提升至94%[29][30] - 公司在内蒙古乌兰察布发布了服务器运维工程师和交付经理的招聘岗位,这是其首次公开招聘算力基础设施相关的驻场人员,表明V4已进入大规模部署准备阶段[31][32] 战略转向与行业竞争 - V4延期的核心原因在于底层硬件的大迁移,公司决定将V4运行在华为最新的昇腾芯片上,而非此前一直依赖的英伟达芯片[34][35][36] - 公司工程师花费大量时间解决V4对华为芯片的适配问题,重写核心代码,从英伟达的CUDA生态迁移到华为的CANN架构[37] - 公司刻意未向英伟达和AMD提前提供V4做优化适配,而是将早期访问权限独家给了国产芯片厂商[39] - 若V4在华为芯片上跑出有竞争力的性能,它将是全球第一个不依赖英伟达的前沿AI模型[40] - 英伟达CEO黄仁勋对此表示担忧,认为DeepSeek基于华为平台的新模型“对美国来说将是一个糟糕的结果”[41][42] - 根据斯坦福大学2026年度AI指数报告,截至2026年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点,竞争日趋激烈[46] - 同期,OpenAI以3000亿美元估值完成400亿美元融资,凸显了行业融资规模[47]
刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达
华尔街见闻·2026-04-18 13:38