梁文锋,坐不住了
虎嗅APP·2026-04-20 08:25

公司动态与融资情况 - DeepSeek正以约100亿美元的估值寻求新一轮融资,规模约3亿美元,创始人梁文锋的态度从一年前“拒绝融资”转变为主动接触资本 [4] - 有市场传闻称,过去一年里梁文锋曾先后见过马化腾与雷军讨论融资可能性,信号明显 [4] - 尽管面临技术困境,但风险投资机构(VC)对投资DeepSeek仍持肯定态度,认为其估值100亿美元低于智谱、MiniMax和Kimi等已上市的同行 [8][24] 公司面临的挑战与困境 - 公司新一代模型(V4)的发布时间多次被预告却未能如期落地,发展节奏明显放缓 [5][13] - 延迟原因被指向一个现实问题:试图摆脱对英伟达算力体系的依赖,但此过程极不顺利 [5][13] - 团队层面出现波动,包括参与代码研究的郭达雅、LLM核心作者王炳宣、OCR核心作者魏浩然在内的多位关键人才相继离开 [6] - 公司过去因算法与工程优化实现的高“性价比”优势,高度依赖于对英伟达GPU底层PTX编程的深度优化,这导致其向国产芯片迁移的成本极高,近乎需要“从0开始”重写底层代码 [14][15][16][20] 公司的技术路径与历史优势 - DeepSeek曾通过从“效率”入手,进行算法与工程优化,实现了接近SOTA水平的性能,同时大幅压低成本,其提出的GRPO架构是对训练与推理效率的再设计 [14] - 公司的效率优势源于两方面:创始人早期量化交易积累的丰富英伟达GPU资源,以及大量依赖对一流模型的蒸馏结果 [14] - 公司通过直接优化PTX编程,对GPU执行层进行改写,从而实现了对AI算力基础设施的系统性重构,这是其实现“性价比”的关键 [14][15] - 这种深度绑定英伟达体系的路径,使其在过去被视为在重写一套更便宜的AI基础设施,但也成为当前转型的最大障碍 [12][15][19] 行业对比与公司定位 - 包括OpenAI和国内互联网大厂在内的公司,为避免被单一算力体系锁死,不会在底层过度依赖类似PTX的深度优化 [18] - DeepSeek过去因“极致性价比”、“算法创新”和“国产替代路径”等叙事被推至高位,被视为中国大模型体系中少数具备“自洽能力”的玩家 [11] - 公司过去被视为“例外”:用更少的钱做出接近SOTA的模型、拒绝融资、强调效率而非规模 [28][29] - 若公司寻求广泛VC融资并转向商业化,将需要考虑模型能力如何转化为收入,并可能站在与Kimi、MiniMax、智谱、阶跃星辰等公司竞争的同一梯队 [25][27][31]

梁文锋,坐不住了 - Reportify