DeepSeek不会向资本低头

DeepSeek融资传闻与战略转型分析 - 市场传闻DeepSeek正在洽谈融资，目标至少3亿美元，估值超过100亿美元 [5] - 市场部分观点认为此举意味着公司因缺钱而开始商业化转型，但文章认为此结论错误，是用旧逻辑解释已进入新阶段的行业 [7][8][9] DeepSeek的资金状况与母公司支持 - 从账面看，DeepSeek并不缺钱，其母公司幻方量化在2025年创下56.6%的平均收益率，在管理规模超百亿的量化私募中排名第二 [11] - 按行业估算，幻方700亿管理规模带来的年收入约合人民币50亿元，能投入DeepSeek研发的经费至少达数亿元量级 [12][13] - DeepSeek的研发经费直接来自幻方研发预算，不受外部股东干涉，无需为他人退出计划负责 [14][15] AI行业范式切换：从Chatbot到Agent - AI行业正经历从Chatbot到AI Agent的快速范式切换 [16] - Chatbot时代是“一次训练、反复调用”，算力消耗集中在训练阶段，推理成本相对可控 [17] - Agent执行完整任务链，消耗的推理token可能是Chatbot时代的几十甚至上百倍，推理成本开始逼近训练成本 [18][19] - 模型参数量持续攀升，从千亿级向万亿级跨越，单次训练所需的算力、数据和工程复杂度陡峭上升 [20][21] Agent时代对算力与资金需求的冲击 - DeepSeek过去能用500多万美元训练出V3模型，依靠方法论上的极致效率 [22] - 但Agent时代的模型训练成为持续迭代的飞轮，数据、算力和工程资源需求呈指数型抬升 [25] - 幻方年收入50亿在Chatbot时代绰绰有余，但在Agent时代可能变得不够用 [26] DeepSeek面临的人才流失挑战 - 自R1大获成功以来，公司至少有5名核心研发成员离职，覆盖基座模型、推理、OCR和多模态四条核心技术主线 [29] - 核心研发团队约百人，流失5名核心成员意味着四条技术主线同时出现断点 [30] - 公司组织模式极度扁平，缺乏成熟的股权激励体系，给予员工的期权因缺乏融资经历和股份定价而难以成为确定性激励工具 [31][33][34] - 面对竞争对手开出的2-3倍收入及可观的股权激励，公司面临人才困境 [34][35] - 融资能为员工期权标定价格，提供确定性，以应对大厂的人才竞争 [36][37] DeepSeek向Agent产品化的战略倾斜 - 2026年3月，公司一口气放出17个新招聘岗位，其中三个为Agent方向专属岗位 [39][40] - 新岗位职责涵盖Agent的算法研究、数据评测和基础设施搭建 [41][42][43] - 模型策略产品经理岗位也单独设立了Agent方向 [44] - 对比2026年1月，公司扩招重心已明显从基础模型研究向Agent产品化倾斜 [45][46] Agent与模型的互补关系及场景需求 - Agent在复杂场景中的丰富度会反向拉升模型的能力，模型需要在真实任务链中积累反馈 [48][49] - 能力的成长依赖于丰富、复杂、真实的应用场景与训练环境 [51] - 获取高质量训练环境的一种路径是通过战略投资方的产业网络，其“场景协同效应”价值远超资金本身 [52] - 融资的意义在于“接入”单靠幻方利润无法购买的产业资源 [53] DeepSeek的核心定位与行业贡献 - 公司的定位是前沿人工智能实验室，其核心价值在于向行业输出可被复用的方法论 [57] - 2026年元旦，公司在arXiv发布mHC架构论文，解决了超连接架构在大规模训练中的不稳定性问题 [57] - 2025年9月发布的DeepSeek-V3.2引入的DSA稀疏注意力机制被寒武纪、智谱GLM-5等借鉴 [59] - 公司开源的OCR系列技术被匹兹堡大学、普林斯顿大学等机构引用，重塑了技术路线 [59] - 公司输出的是一套被行业反复引用和跟随的技术路线图 [61] Anthropic的镜鉴：商业化与研发的共生关系 - Anthropic在2024年至2026年间年化收入从10亿美元增长至300亿美元，主要依靠企业API合同、开发者订阅和Claude Code [64][65] - Anthropic预计在2027年实现正向自由现金流，其效率远高于OpenAI [67] - Anthropic证明商业化与模型能力提升并非零和关系，B端API实现的自我造血能支撑持续研发投入 [68][69] - 有限度的商业化可以为前沿研究探索提供更大燃料 [70] 研发自由度、试错成本与自我造血 - AI前沿研发具有高度不确定性，天然不适合由KPI考核严格、投资回报周期明确的组织主导 [70][73] - 公司过去能持续产出创新，得益于“不考核、不设deadline”的试错空间 [76] - 试错的成本是大量废弃实验和消耗掉的算力与人力 [77] - 进入Agent时代后，试错成本成倍放大，单靠幻方输血，试错弹性被压缩 [79] - 自我造血不仅是财务问题，更关乎研发自由度，能提供“犯错的权利” [80][83] - 建立经常性收入能为下一代模型研发增加缓冲，让试错空间不随算力通胀而萎缩 [83] 融资的性质与战略意义 - 判断是否妥协的标准在于融资是否改变了原本的研究方向 [86] - 证据显示Agent是公司既定路线的一部分，而非融资后的选择 [87] - 3亿美元的融资规模在当今AI市场更像一笔战略补给，而非方向性投降 [88] - 此次融资不能简单理解为“向资本低头”，真正变化的是AI发展的阶段 [89] - 在窗口期收窄的节点，公司需要为下一阶段竞争储备弹药、锁定人才、接入场景 [90] - 不是DeepSeek需要资本，是Agent时代需要一个资源配置更完整的DeepSeek [91]