梁文锋，坐不住了

公司动态与融资情况 - DeepSeek正以约100亿美元的估值寻求新一轮融资，规模约3亿美元，创始人梁文锋的态度从一年前“拒绝融资”转变为主动接触资本 [4] - 有市场传闻称，过去一年里梁文锋曾先后见过马化腾与雷军讨论融资可能性，信号明显 [4] - 尽管面临技术困境，但风险投资机构（VC）对投资DeepSeek仍持肯定态度，认为其估值100亿美元低于智谱、MiniMax和Kimi等已上市的同行 [8][24] 公司面临的挑战与困境 - 公司新一代模型（V4）的发布时间多次被预告却未能如期落地，发展节奏明显放缓 [5][13] - 延迟原因被指向一个现实问题：试图摆脱对英伟达算力体系的依赖，但此过程极不顺利 [5][13] - 团队层面出现波动，包括参与代码研究的郭达雅、LLM核心作者王炳宣、OCR核心作者魏浩然在内的多位关键人才相继离开 [6] - 公司过去因算法与工程优化实现的高“性价比”优势，高度依赖于对英伟达GPU底层PTX编程的深度优化，这导致其向国产芯片迁移的成本极高，近乎需要“从0开始”重写底层代码 [14][15][16][20] 公司的技术路径与历史优势 - DeepSeek曾通过从“效率”入手，进行算法与工程优化，实现了接近SOTA水平的性能，同时大幅压低成本，其提出的GRPO架构是对训练与推理效率的再设计 [14] - 公司的效率优势源于两方面：创始人早期量化交易积累的丰富英伟达GPU资源，以及大量依赖对一流模型的蒸馏结果 [14] - 公司通过直接优化PTX编程，对GPU执行层进行改写，从而实现了对AI算力基础设施的系统性重构，这是其实现“性价比”的关键 [14][15] - 这种深度绑定英伟达体系的路径，使其在过去被视为在重写一套更便宜的AI基础设施，但也成为当前转型的最大障碍 [12][15][19] 行业对比与公司定位 - 包括OpenAI和国内互联网大厂在内的公司，为避免被单一算力体系锁死，不会在底层过度依赖类似PTX的深度优化 [18] - DeepSeek过去因“极致性价比”、“算法创新”和“国产替代路径”等叙事被推至高位，被视为中国大模型体系中少数具备“自洽能力”的玩家 [11] - 公司过去被视为“例外”：用更少的钱做出接近SOTA的模型、拒绝融资、强调效率而非规模 [28][29] - 若公司寻求广泛VC融资并转向商业化，将需要考虑模型能力如何转化为收入，并可能站在与Kimi、MiniMax、智谱、阶跃星辰等公司竞争的同一梯队 [25][27][31]