DeepSeek V4
搜索文档
Token定价重塑产业链-应用修复信号已现-算力租赁进入长景气
2026-04-21 08:51
纪要关键要点总结 一、 涉及的行业与公司 * **行业**:人工智能(AI)行业,重点聚焦于**AI应用**、**算力租赁**(或称“New Cloud”)及**国产算力**产业链 [1] * **公司**: * **AI应用厂商**:麦麸食、范式 [1][3] * **海外算力租赁厂商**:CoreWeave、Nebulas (Nebulus)、Lambda Labs、甲骨文 (Oracle) [7][12][14] * **国内算力租赁厂商**:协创、宏景、金山云 [7][15][19] * **大模型公司**:DeepSeek、OpenAI (GPT-4/4.5)、微软 (Office 4.6) [1][4][6][10] * **其他提及**:Manta、AstroPick、Two Sigma、Palantir、Bloom Energy [3][7][13][16] 二、 核心观点与论据 1. AI应用商业模式变革与投资逻辑 * **模式转变**:AI应用商业模式正从订阅制/项目制,转向**按Token消耗量或按业务结果付费** [1][2] * **价值链条**:形成“算力层Token -> 模型层Token -> 应用层Token”的三层增值链,应用厂商通过整合行业知识将通用API转化为面向具体场景的Agent产品,实现更高单Token定价 [2] * **IT预算调整**:企业广义IT(含AI)支出总盘子在扩大,部分人力、营销预算转向AI投入,但内部结构在调整,**算力和大模型支出占比提升,传统软件预算受挤压** [2] * **选股框架**:应筛选符合以下标准的AI应用标的:1) 高成长性、低估值;2) 已有明确的按量/按结果付费商业模式并产生收入;3) 在AI时代具备稳固护城河;4) 财务数据能验证商业模式有效性(营收利润加速增长)[2] * **案例验证 - 麦麸食**:AI应用业务近三年收入**复合增速达70%**;2026年PS约2-3倍,PE约30倍;按量/按结果付费收入占比已达**高个位数**,预计全年达**10%-20%**;最新一季报AI应用收入**同比增长110%** [3] * **案例验证 - 范式**:当前**PS不足两倍**,毛利倍数约五倍;2025年增速**35%**,预计2026年达**45%**;核心优势在于整合了算力、模型和应用 [3] 2. 算力租赁行业景气度与持续性 * **供需缺口长期存在**:算力供需缺口预计持续至**2028年**,是行业景气的根本支撑 [1][10] * **价格强劲上涨**:**B系列GPU租金过去两个月上涨48%**,达到每小时**4.08美元**;**H100租金从2025年12月到2026年3月上涨40%**;市场闲置卡供给明显下降 [1][10][11] * **价格下降风险有限**:决定价格的关键是GPU能创造的商业价值,而非仅总拥有成本(TCO);随着模型能力提升(如从GPT-4到GPT-4.5),单Token“智能密度”和总价值增长,部分价值会传导给算力租赁商,支撑现有算力卡价值 [10] * **交付瓶颈缓解**:国内厂商从下单到上线计费最快**两个多月**;海外厂商(如CoreWeave)2025年Q4起交付情况已明显改善,当前在手已激活电力**850兆瓦**,已签订合同总电力达**3.1吉瓦** [12][13] * **融资成本压力下降**:CoreWeave最新**85亿美元**GPU抵押融资利率已降至**6%**(2025年为9%);国内龙头厂商凭借长期合同信用背书,银行贷款利率维持在**3.7%-4%** 区间 [1][12] 3. 龙头公司商业模式演进与竞争优势 * **向PaaS平台演进**:龙头厂商正从单纯IaaS算力提供商,向构建工具链、模型库、优化服务的PaaS平台演进,增强客户粘性,构建竞争壁垒 [14] * **长期锁价合同保障收益**:海外厂商通过签订**5年以上**长期大单锁定收益,CoreWeave在手订单超**900亿美元**,Nebulas几笔大单总额近**500亿美元**;国内厂商合同期也基本为五年,协创订单额从2025年**200多亿元**增长至2026年**300多亿元**,宏景给出2026年超**500亿元**订单指引 [15] * **议价能力提升**:由于算力短缺加剧,部分大客户从倾向“3+2”模式转向愿意直接签订**五年锁价合同** [15] * **核心竞争优势**: 1. **获取先进GPU的优先分配权**:为大模型公司提供抓住**4到6个月**训练领先窗口期的“时间杠杆” [16] 2. **国内高端GPU的独特获取优势与高残值**:国内某龙头企业的A100卡在完成三年租赁后,市场售价仍达原价的**75%**,远高于会计残值(15%)[16] * **成本传导与盈利放大**:在上游硬件成本上涨周期中,厂商能将成本上涨传导至下游,例如B300单卡模组价格从年初约**375万元/台**涨至**500万元/台**,万卡集群成本从**40-50亿元**涨至**70-80亿元**(涨幅约**50%**),从而提升盈利空间 [17] 4. 按Token计费模式转型与影响 * **转型趋势**:算力租赁行业正积极探索向**按Token计费**模式转型,这是提升估值的关键方向 [17] * **盈利能力对比**:传统租赁模式净利率普遍在**15%** 左右,而按Token计费模式的净利率指引可达**20%以上** [1][18] * **海外实践**:Nebulas自2025年下半年已开始尝试按Token计费并提供综合云服务,未来竞争将转向算力调度和模型基础设施优化能力 [17] * **国内进展与挑战**:国内厂商(如协创)已开始与大模型公司商谈按Token计费或分润模式,并上线自有平台部署开源模型;主要挑战在于解决算力调度的“波峰波谷”问题(白天调用高,夜间闲置),正考虑“Token出海”方案但面临数据合规性问题 [18] * **短期展望**:预计短期内国内市场将出现首批按Token计费或分成合同落地,主要由行业龙头公司推行 [18] 5. DeepSeek V4发布与国产算力影响 * **融资计划解读**:DeepSeek计划首次融资至少**3亿美元**,投后估值不低于**100亿美元**,目的可能是采购算力及稳定核心技术团队 [4][5] * **行业意义**:对国产算力需求具有**里程碑式**的推动作用,将极大促进企业级市场大规模采纳国产算力卡,使其成为内部主力算力 [6] * **能力进步**:在代码能力、复杂推理等方面相较之前版本有显著提升,其开源特性将加速AI在企业级应用的渗透 [6] * **市场影响**:V4发布后,市场关注点预计将优先转向**国产算力链** [1][6] 6. 投资策略总结 * **核心逻辑**:在算力持续紧缺背景下,龙头厂商凭借稀缺资源获取能力、议价权、商业模式创新,具备显著利润弹性 [19] * **标的选择**: * **国内市场**:优先关注龙头公司**协创、宏景**,可将**金山云**纳入观察,同时配置部分具备业务弹性的其他公司 [19] * **海外市场**:优先选择交付确定性高的**CoreWeave** [19][20] 三、 其他重要内容 * **市场催化事件**: * 海外:2026年3月中旬以来,Nebulas与Manta新签**270亿美元**协议、CoreWeave融资评级提升至投资级、与Manta签**210亿美元**协议、AstroPick接入CoreWeave算力、与Two Sigma签**60亿美元**协议等,推动相关公司股价反弹 [7] * 国内:协创2026年4月15日发布的一季度业绩预告利润超预期,成为点燃国内算力租赁行情的重要催化剂 [7] * **行业集中度提升**:预计市场将出现“长尾出清”,目前海外约有**100家** New Cloud厂商,未来集中度将提升,不具备高效集群调度能力的厂商将被淘汰 [16] * **长期商业模式**:算力租赁业务长期可能演变为类似公共事业的标准化服务 [16]
国泰海通|计算机:算力与大模型涨价潮,前沿模型加速底层生态整合
国泰海通证券研究· 2026-04-20 21:59
AI产业政策与投资动态 - 国家发改委明确将在“人工智能+”基础设施等领域开展扩大有效投资行动,并在中央投资项目中全面开展“软建设”,发挥国家创投引导基金作用带动社会资本支持新兴产业 [2] 算力与模型涨价潮 - 阿里云四天内连发三条涨价公告,其中百炼大模型单元提价2%-5%,DDoS高防资费上调50%,DataWorks API取消无限制免费调用转为按量付费 [2] - 海外巨头Anthropic将Claude企业级订阅从最高200美元转为“按实际算力消耗+20美元固定缴纳”计费,导致重度用户成本翻倍甚至三倍暴涨 [2] - B端H100租赁合约价较此前低点飙升近40%,全球算力荒加剧 [2] - 算力商业模式已开始从单纯的“卖裸算力”向“卖Token”跨越,掌握稀缺高端算力并具备涨价溢价权成为AI企业争夺的核心战略资源与新赛点 [1][2] 国产AI模型与硬件生态进展 - DeepSeek寻求在百亿美元估值下进行3亿美元融资,核心目的是助推其万亿参数、原生多模态的V4模型彻底脱离英伟达,全面迁移至华为CANN架构 [3] - DeepSeek底层基础设施DeepGEMM更新Mega MoE,将破碎的计算流程熔铸为单一Mega-kernel以实现计算与通信同步,并采用FP8 × FP4精度压榨效率极限 [3] - 前沿AI竞争正向底层延伸,摆脱硬件路径依赖与实现基建极致优化已成为决胜新赛点 [3] 国际AI模型与生态竞争 - Anthropic发布旗舰模型Claude Opus 4.7版本,在高级软件工程与金融分析代理测试中取得全球最高分,视觉识别边长达2576像素并升级全新分词器 [4] - Anthropic即将更新的Claude Code引入跨代码仓库统一界面,标志着公司正从底层API算力批发向高利润解决方案转型 [4] - Anthropic依托模型能力的不对称优势,对Cursor等第三方应用层工具完成了深度的生态挤压 [1][4]
计算机行业双周报:全球AI算力涨价持续,重视产业链投资机遇-20260420
东莞证券· 2026-04-20 19:55
行业投资评级 - **超配(维持)** 东莞证券对计算机行业给予“超配”评级并予以维持 [1] 核心观点 - **全球AI算力供需失衡,涨价潮持续** 进入2026年,以OpenClaw为代表的AI Agent产品进入规模化应用,驱动全球算力需求爆发式增长,而供给端受HBM产能、先进封装及电力设施等刚性约束,导致全球范围严重算力短缺和涨价潮 [2][20][26] - **国产大模型驱动需求爆发** 根据全球最大API聚合平台OpenRouter统计,2026年4月其平台周度累计Token消耗量较去年同期提升约7-8倍,其中国产大模型贡献了主要增量 [2][20][26] - **投资聚焦AI算力产业链** 短期来看,AI算力是战略性稀缺资源,建议持续关注AI芯片、AI服务器、算力租赁及液冷等关键细分环节的投资机遇 [2][27] 行业行情回顾 - **近期表现强势** 申万计算机板块近2周(2026/4/6-4/19)累计上涨9.73%,跑赢沪深300指数3.25个百分点,在31个申万一级行业中排名第7名 [2][9] - **月度与年度表现** 申万计算机板块4月累计上涨7.57%,跑赢沪深300指数1.31个百分点;但今年累计下跌0.62%,跑输沪深300指数2.75个百分点 [2][9] - **个股表现分化** 近两周涨幅前三的个股为宏景科技(69.78%)、品高股份(68.93%)和盛视科技(67.43%);跌幅前三为ST赛为(-17.22%)、金溢科技(-16.92%)和网达软件(-15.42%) [14][15][16] 板块估值情况 - **估值水平较高** 截至2026年4月19日,SW计算机板块PE TTM(剔除负值)为54.97倍,处于近5年87.69%分位、近10年78.43%分位 [2][19] 重点产业新闻 - **DeepSeek V4即将发布** DeepSeek V4将于4月下旬发布,模型参数达万亿级别,支持百万级上下文,并深度适配华为昇腾等国产AI芯片,采用Apache 2.0开源协议,带动新型AI芯片市场价格近期上涨约两成 [20] - **全球算力巨头密集调价** 阿里云在4月四天内连发三条涨价公告,涉及DataWorks API免费额度、百炼模型服务价格(上调2%-5%)及DDoS高防产品;腾讯云也宣布将于5月9日起对AI算力等相关产品价格统一上调5%;海外方面,Anthropic将Claude Enterprise订阅模式改为按实际算力消耗收费,对重度用户可能导致成本提升两到三倍 [2][20][26] - **大额AI基础设施协议签订** CoreWeave与Meta达成一项扩展协议,预计将提供约210亿美元的AI云容量,期限至2032年12月,以支持Meta AI的开发和部署 [2][22] - **中美大模型差距实质性消除** 斯坦福大学报告指出,中美顶级大模型差距“实质性消除”,头部模型呈并跑态势,竞争焦点从性能转向成本、可靠性与实用性 [2][22] - **国内AI应用规模快速突破** 国家统计局数据显示,到2026年3月,日均词元(Token)调用量突破140万亿,较上年末增长超40%;一季度,规模以上数字产品制造业增加值同比增长11.2%,其中电子专用材料制造、集成电路制造行业增加值分别增长32.5%和49.4% [2][22] - **液冷散热趋势明确** 预期2026年开始出货的Vera Rubin NVL72计算托架将采用100%液冷散热,海外有望逐步进入全液冷时代 [2][22] 公司公告摘要 - **海康威视** 2025年营业收入925.08亿元,同比增长0.01%;归母净利润141.95亿元,同比增长18.52% [23] - **用友网络** 2025年营业收入91.82亿元,同比增长0.32%;归母净利润为-13.89亿元 [23] - **中科曙光** 2025年营业收入149.64亿元,同比增长13.81%;归母净利润21.76亿元,同比增长13.87% [23] - **紫光股份** 2025年营业收入967.48亿元,同比增长22.43%;归母净利润16.86亿元,同比增长7.19% [24] - **网宿科技** 2025年营业收入46.61亿元,同比下降5.50%;归母净利润8亿元,同比增长18.53% [24] - **汉得信息** 2025年营业收入34.15亿元,同比增长5.57%;归母净利润2.27亿元,同比增长20.28% [24] - **浪潮信息** 2025年营业收入1647.82亿元,同比增长43.25%;归母净利润24.13亿元,同比增长5.20% [25] - **达梦数据** 2025年营业收入13.06亿元,同比增长25.03%;归母净利润5.17亿元,同比增长42.76% [25] 建议关注标的 - **广电运通 (002152.SZ)** 金融科技主业稳健,数据要素、算力等领域布局深化 [28] - **神州数码 (000034.SZ)** “鲲鹏+昇腾”产业链核心伙伴,受益国产算力需求上升 [28] - **浪潮信息 (000977.SZ)** 人工智能服务器全球领先,行业地位稳固 [28] - **税友股份 (603171.SH)** 国内领先财税信息化服务商,受益新一轮财税改革 [28] - **软通动力 (301236.SZ)** 华为核心合作伙伴,鸿蒙生态建设领先 [28] - **赛意信息 (300687.SZ)** 积极布局AI Agent领域,推出差异化智能体解决方案 [28]
计算机行业双周报(2026、4、6-2026、4、19):全球AI算力涨价持续,重视产业链投资机遇-20260420
东莞证券· 2026-04-20 17:03
行业投资评级 - 计算机行业投资评级为“超配”,且评级维持不变 [1] 报告核心观点 - 全球AI算力需求爆发式增长与供给刚性约束导致严重短缺,引发全球范围的算力涨价潮,AI算力成为战略性稀缺资源,建议持续关注AI算力产业链投资机遇 [2][20][26][27] - 进入2026年,以OpenClaw为代表的AI Agent类产品进入规模化应用阶段,驱动全球算力需求呈现爆发式增长 [2][26] - 根据全球最大的API聚合平台OpenRouter统计,2026年4月其平台周度累计Token消耗量相较去年同期提升约**7-8倍**,其中国产大模型贡献了主要增量 [2][20][26] - 算力供给侧受制于HBM产能、先进封装吞吐量及电力基础设施配套等多重刚性约束,短期边际增量有限 [2][26] - 建议重点关注**AI芯片、AI服务器、算力租赁及液冷**等关键细分环节的投资机遇 [2][27] 根据目录分别总结 1. 计算机行业行情回顾 - **市场表现**:申万计算机板块近2周(2026/4/6-2026/4/19)累计上涨**9.73%**,跑赢沪深300指数**3.25**个百分点,在31个申万一级行业中排名第**7**名 [2][9] - **月度与年度表现**:申万计算机板块4月累计上涨**7.57%**,跑赢沪深300指数**1.31**个百分点;但年初至今累计下跌**0.62%**,跑输沪深300指数**2.75**个百分点 [2][9] - **个股表现**:近两周涨幅前三的个股为宏景科技(**69.78%**)、品高股份(**68.93%**)和盛视科技(**67.43%**);跌幅前三为ST赛为(**-17.22%**)、金溢科技(**-16.92%**)和网达软件(**-15.42%**) [14] 2. 板块估值情况 - **当前估值**:截至2026年4月19日,SW计算机板块PE TTM(剔除负值)为**54.97**倍 [2][19] - **历史分位**:当前估值处于近5年**87.69%**分位、近10年**78.43%**分位 [2][19] 3. 产业新闻 - **大模型进展**:DeepSeek V4将于4月下旬正式发布,参数达万亿级别,支持百万级上下文,并深度适配华为昇腾等国产AI芯片,采用Apache 2.0开源协议 [20] - **算力需求与涨价**: - 全球算力需求快速增长,OpenRouter平台周度Token消耗量同比提升**7-8倍** [20][22] - 阿里云在4月四天内连发三条涨价公告,涉及DataWorks API免费额度调整及百炼模型服务价格上调**2%至5%**不等 [2][20] - 腾讯云宣布自5月9日起对AI算力等相关产品价格统一上调**5%** [2][26] - 海外方面,Anthropic将Claude Enterprise订阅模式改为按实际算力消耗收费,对重度用户可能导致成本提升**两到三倍** [2][20][26] - **重大合作**:CoreWeave与Meta达成一项扩展协议,预计将提供约**210亿美元**的AI云容量,期限至2032年12月 [2][22] - **中美AI对比**:斯坦福报告指出,中美顶级大模型差距“实质性消除”,头部模型表现呈并跑态势 [2][22] - **国内应用数据**:国家统计局数据显示,到2026年3月,日均词元(Token)调用量突破**140万亿**,比上年末增长超**40%** [2][22] - **技术趋势**:预期2026年开始出货的Vera Rubin NVL72计算托架将采用**100%液冷**散热,海外有望逐步进入全液冷时代 [2][22] 4. 公司公告(部分重点公司2025年年报摘要) - **海康威视**:营业收入**925.08亿元**,同比增长**0.01%**;归母净利润**141.95亿元**,同比增长**18.52%** [23] - **用友网络**:营业收入**91.82亿元**,同比增长**0.32%**;归母净利润为**-13.89亿元** [23] - **中科曙光**:营业收入**149.64亿元**,同比增长**13.81%**;归母净利润**21.76亿元**,同比增长**13.87%** [23] - **紫光股份**:营业收入**967.48亿元**,同比增长**22.43%**;归母净利润**16.86亿元**,同比增长**7.19%** [24] - **网宿科技**:营业收入**46.61亿元**,同比下降**5.50%**;归母净利润**8亿元**,同比增长**18.53%** [24] - **浪潮信息**:营业收入**1647.82亿元**,同比增长**43.25%**;归母净利润**24.13亿元**,同比增长**5.20%** [25] 5. 本周观点(详细阐述) - **核心逻辑**:AI Agent规模化应用驱动算力需求爆发,而供给受限于HBM、先进封装、电力设施等,导致全球算力短缺与涨价 [2][26] - **国内涨价案例**: - 阿里云:4月13日调整DataWorks免费额度为**10万次/月**;4月15日上调百炼部分模型价格**2%-5%**;同日将DDoS高防弹性95定价从**100元/Mbps/月**调整为**150元/Mbps/月** [2][26] - 腾讯云:4月9日公告将于5月9日起对AI算力等相关产品价格统一上调**5%** [2][26] - **海外涨价案例**:Anthropic的Claude Enterprise从固定收费(最高**200美元/用户/月**)改为按算力消耗收费+**20美元/月**固定费,重度用户成本可能翻**两到三倍** [2][20][26] - **投资建议**:短期AI算力是稀缺资源,建议关注**AI芯片、AI服务器、算力租赁及液冷**产业链 [2][27] (附)建议关注标的 - 报告列举了多家建议关注的公司及简要理由,包括**广电运通、神州数码、浪潮信息、税友股份、软通动力、赛意信息**等,涉及金融科技、国产算力、AI服务器、财税信息化、鸿蒙生态、AI Agent解决方案等领域 [28]
DeepSeek百亿美元估值融资传闻背后的四重逻辑判断
创业邦· 2026-04-20 11:30
文章核心观点 - 公司被传以100亿美元估值进行约3%股权融资,核心目的并非单纯获取资金,而是一套由创始人全盘设定的、高度克制的综合性战略动作,旨在解决内部激励、筛选合作伙伴、锁定战略资源并管理市场预期,外部投资者难以获得份额[5][17] 第一重逻辑:融资本质与员工激励 - 公司自2023年孵化以来从未进行外部股权融资,导致员工期权缺乏市场化定价锚点,在AI人才竞争白热化(竞争对手薪酬可达公司翻倍甚至更多)的背景下,此轮融资的首要功能是为员工期权池完成具有公信力的市场化定价[6] - 融资规模约3亿美元对应约3%股权,此交易量足以建立有法律效力的价格锚点,同时不撼动创始人(直接和间接持股84.29%,拥有近100%表决权)的绝对控制权,核心目的是“对内交代”[7] - 选择外部融资而非内部回购估值,是因为独立第三方真金白银的交易行为所提供的“市场化背书”和公信力,是解决期权定价问题最具公信力的“最优解”[8] 第二重逻辑:估值定价的深层含义 - 100亿美元估值在横向对比中显著偏低:同期智谱AI港股最新市值约507亿美元,MiniMax约344亿美元,月之暗面估值已达180亿美元[9] - 估值在纵向对比中也显偏低:母公司幻方量化2025年管理规模超700亿元人民币,按行业惯例估算可为创始人带来约50亿元人民币(超7亿美元)收入,若考虑其稳定盈利能力,此估值对应的市盈率仅十余倍[9] - 低估值本身是一种筛选机制,旨在过滤对财务回报要求苛刻的机构,筛选出愿意接受创始人设定规则的合作方[10] - 100亿美元估值释放3%融得约3亿美元,该金额约等于母公司幻方量化过去三年对公司的累计投入(约数亿美元量级),标志着公司在财务意义上将独立于母公司运作[11] 第三重逻辑:融资的战略用途推演 - 3亿美元融资规模在AI算力竞赛中杯水车薪,参照OpenAI融资1220亿美元(投后估值8520亿美元)、Anthropic融资300亿美元(投后估值3800亿美元)的规模,甚至不够购置一个中等规模万卡集群[12] - 推测融资可能用于“降维锚定”,即以公司股权作为“高维货币”,置换产业链上具有结构性成本优势的“低维节点”资源,例如锁定电力企业或数据中心的长期低价供电协议(中国电力成本仅为美国的五分之一以下)[13] - 此逻辑可扩展至锚定国产芯片产能、数据中心机柜、跨境带宽等基础设施,旨在用股权换取结构性壁垒,而不仅是用股权换现金[14] 第四重逻辑:融资的时点与信号意义 - 选择在当前时点融资具有“信号对冲”意图:公司V4版本多次推迟(从原定2月推迟至4月下旬),市场对其“永远领先”的确定性叙事产生动摇,而豆包应用月活已超3.31亿[15] - 启动首轮融资释放了“组织进化”的强信号,旨在用“从研究机构进化为有资本治理结构的商业公司”这一确定性叙事,来对冲产品延期带来的技术节奏不确定性[15] - 选择在市场预期脆弱时以低估值释放融资消息,其前置的“信号”价值远比在市场信心高涨时融资更有力量[16]
如果DeepSeek选择华为,黄仁勋说的“灾难”到底是什么?
虎嗅APP· 2026-04-19 17:22
核心观点 - 英伟达创始人黄仁勋对DeepSeek下一代模型V4可能率先在华为昇腾平台发布表示担忧,认为这对美国是“灾难性”的,其核心焦虑并非中国做出好模型,而是顶级开源模型可能不再以英伟达CUDA生态作为默认和首要的优化起点,这将动摇其“事实标准”的生态护城河[5][6][7] - 华为通过“以规模换效率,以系统换单点”的系统工程路径构建算力竞争力,其大规模集群在算力上已可比肩甚至超越英伟达旗舰方案,尽管功耗较高,但中国在可再生能源方面的优势可部分抵消此成本[9][10] - 黄仁勋的言论是一次精心策划的战略喊话,旨在同时向美国政策圈和中国市场传递信息:对美方强调需通过保持芯片销售来维持CUDA生态优势,对中方暗示脱离英伟达路径将面临更高成本,其根本目标是保住中国市场收入并维持CUDA的生态主导地位,防止出现一个由顶级模型背书的、成功的非CUDA全栈替代路径[12][13][16][17] 英伟达的竞争焦虑与生态护城河 - 英伟达真正的护城河并非GPU算力,而是CUDA作为“事实标准”的软件生态位,过去近二十年,主流AI框架和模型的首发优化均以CUDA为默认起点[6] - 生态护城河的自我强化逻辑在于:模型先在CUDA上优化,迁移到其他硬件需付出以月计的工程代价,使得其他硬件成为“备选方案”,从而巩固CUDA的默认地位[6] - 英伟达担忧DeepSeek V4在华为昇腾首发,将首次公开打破“开源模型必须以CUDA为首要优化目标”的默认规则,证明存在一条被顶级模型验证过的非CUDA可行路径,并积累起相应的工程师、经验和用户信心[7] - 公司的竞争策略是“向外吸纳、向内收敛”,即允许其他能运行CUDA的加速器纳入生态,但必须确保CUDA是不可替代的中心,以此保持“平台”身份,但华为的全栈布局使其成为无法被吸纳的平行宇宙对手[13][14] 华为的算力发展路径与竞争力 - 华为昇腾910C单卡FP16算力约800TFLOPS,与英伟达Blackwell旗舰仍有约三倍性能差距,但华为采用系统工程和群体战术进行竞争[9] - 2025年4月推出的CloudMatrix384超节点,集成384颗910C芯片,BF16集群算力达300PFLOPS,是英伟达GB200NVL72旗舰集群算力的1.7倍,HBM总容量达后者3.6倍,但整体功耗近560千瓦,约为英伟达同级方案的四倍[9] - 华为公布了激进的路线图,包括Atlas950(8192卡)和Atlas960(15488卡)超节点,走“以规模换效率,以系统换单点”的清晰发展路径[10] - 中国拥有全球第二大计算市场、约一半的AI研究人员、庞大的算力总量以及可再生能源优势,为华为的路径提供了基础[10] DeepSeek模型迁移的象征意义与影响 - DeepSeek V3/R1已证明中国能以极低成本训练出接近OpenAI水平的模型,动摇了“算力决定一切”的范式[11] - 若V4真以昇腾首发,其象征意义远超V3,将从证明“中国能做好模型”升级为证明“中国能在自己的硬件上做好模型”,这标志着从“客户”到“对手”的转变[11] - 此举意味着顶级模型、顶级硬件与开源传播首次在中国大陆完整结合,将在全球开源社群形成首发效应,为英伟达主导的“模型-框架-硬件”默认栈提供一个被主流证实可用的备份栈,在叙事上动摇“CUDA是唯一起点”的观念[20] 黄仁勋言论背后的商业策略与市场现实 - 黄仁勋在访谈中存在逻辑矛盾:一方面以DeepSeek的成功论证出口管制无效,另一方面又以“防止中国脱离生态”为由主张继续对华销售芯片,这揭示了其真实目标是同时保住中国市场收入和CUDA生态位[12][13] - 其言论是对美国出口管制导致业务受损的直接反应,从A100/H100被禁到专供中国版H20的销售波折,中国市场需求依然强劲,例如字节、阿里、腾讯在被禁前三个月曾下单超过160亿美元的H20订单[15] - 黄仁勋承认中国在算法和AI研究人员数量上的根本优势,意在向美国政策圈传递“制裁无法阻止中国赶超”的信号,为解除限制铺路,但此逻辑也可能强化中国“全面去CUDA化”的决心[15] - 此次访谈选择在DeepSeek V4传闻与正式发布之间的关键时间点,通过技术播客精准投向技术社群与政策圈,其核心论证是“无法通过阻断来赢,只能通过保持在场来赢”,本质是为继续销售芯片进行包装[16]
梁文锋的电话,被投资人打爆了
商业洞察· 2026-04-19 17:21
DeepSeek启动首次外部融资 - 中国大模型头部玩家DeepSeek正式启动成立以来的首次外部融资,目标估值不低于100亿美元,计划募集资金不少于3亿美元 [5] - 融资消息引发资本市场高度关注,投资人反应热烈 [6] 100亿美元估值逻辑与行业对标 - 100亿美元估值介于已上市的智谱AI(约68亿美元)和MiniMax(约137亿美元)的首日市值之间,但DeepSeek作为未盈利、未商业化的私募公司,此估值体现了投资人对技术实力和未来潜力的极高溢价 [8][10] - 全球范围内,OpenAI于2026年3月以8520亿美元估值完成1220亿美元融资,Anthropic于2026年2月以3800亿美元估值完成300亿美元G轮融资,DeepSeek的100亿美元估值相对较小,但在中国AI独角兽中已属高位 [9][11] DeepSeek的资金来源与创始人背景 - DeepSeek由量化私募巨头幻方量化于2023年孵化,创始人梁文锋同时执掌两家公司,并在DeepSeek直接和间接持有84.29%的股份,拥有几乎100%的表决权 [13] - 公司此前从未接受外部VC投资,创始人梁文锋曾因理念不合及自身资金充足而拒绝资本 [14][15][17] - 幻方量化2025年收益均值高达56.55%,按超700亿元管理规模计算,利润约350到400亿元,其2025年强劲表现可能带来超过7亿美元的收入,足以支撑早期研发 [16] 融资动因:研发成本飙升与行业变化 - 大模型烧钱速度呈指数级增长:DeepSeek V3训练成本预算为557万美元,而V4预计将达十亿美元级别 [19] - 2026年一季度,国内通用大模型融资额同比下滑72%,但资金向头部集中趋势明显 [19][34] - 中国日均Token调用量已突破140万亿,两年间增长了1000多倍,算力消耗进入爆发式增长期 [35] V4模型的技术挑战与延期原因 - DeepSeek V4预计在4月底亮相,参数规格跃升至约1万亿(MoE架构),上下文窗口扩展至100万token,并首次支持原生多模态,内部测试基准表现优秀 [21] - 模型发布多次延期,背后原因包括:技术路线质变导致工程复杂度提升;选择深度适配华为昇腾芯片以实现去英伟达化,代码迁移与精度对齐耗时;以及公司对“效率神话”品牌形象的压力 [22][23][24][25] - 这些技术挑战的本质均指向对更多资金的需求,以获取算力、工程师并加快调试进度 [26][27] 人才流失与股权激励问题 - 自2025年初以来,DeepSeek核心团队经历严重人才流失,多名关键贡献者转投小米、腾讯、字节跳动等大厂 [29] - 流失主因是公司未融资导致缺乏市场化估值,员工股权承诺无法兑现,而竞争对手能提供“现金+期权+IPO预期”的组合 [30][31] - 建立市场化股权激励机制需要先通过融资确定公司公允价值 [31] 行业竞争格局与资本重要性 - 全球大模型竞争已演变为资本之战,OpenAI和Anthropic以极高估值完成巨额融资 [33] - 国内赛道呈现“头部聚集、冷热分化”格局,阶跃星辰、智谱AI、MiniMax等公司获得大额融资或成功上市 [34] - 行业竞争从技术单点比拼演变为算力、人才、生态的综合较量,没有资本持续支撑难以长远发展 [36][39][40] 游戏规则转变与未来展望 - 过去DeepSeek以“效率神话”和低成本研发(如用557万美元做出R1模型)颠覆行业,但2026年游戏规则已变,参数规模和算力需求跃升至新量级 [38][39] - 行业正从“讲故事”转向“看业绩”,模型表现、商业化进展、算力自主进度将成为关键 [40][41] - 未来1-2年国内大模型赛道可能迎来新一轮洗牌,头部玩家估值将逐渐回归基本面,DeepSeek的首轮融资是这场洗牌的开始 [41]
“不差钱”的DeepSeek要融资了?
第一财经· 2026-04-19 13:50
DeepSeek启动外部融资的战略转向 - 公司正计划以超过100亿美元(约合人民币682亿元)的估值,进行首次外部融资,计划募集不少于3亿美元(约合人民币20亿元)资金 [3] - 此举被视为公司长期拒绝外部资本、强调独立性后的一次重大战略转向,旨在获取更多计算资源开发新模型,并提供更具竞争力的薪酬防止人才流失 [3] - 潜在投资方预计以国内人民币资金为主,美国风险资本可能心存顾虑,公司尚未对融资消息作出官方回应 [3] 融资动因:人才激励与资金需求 - 融资的核心动因之一是为员工期权体系引入市场化定价,解决因长期拒绝外部资本导致的内部期权缺乏流通性和溢价锚点的问题,以稳定和激励核心团队 [4] - AI领域人才竞争激烈,竞争对手为DeepSeek核心研发人员开出的薪酬包可达翻倍甚至更多,公司已出现多位核心研究员流向小米、字节跳动、元戎启行等公司的情况 [4] - 融资的另一现实需求是应对大模型竞赛的巨额资金消耗,模型参数向万亿级迈进导致算力投入指数级增长,仅依靠孵化方幻方量化的资金支持可能面临压力 [5] 公司背景与资金状况 - 公司由量化私募巨头幻方量化孵化,幻方量化2025年平均收益率达56.6%,管理规模超700亿元人民币,估算2025年为创始人带来超过7亿美元收入,曾是公司维持独立运转的“无限弹药” [5] - 有观点认为,创始人不可能无限制使用幻方资金补贴DeepSeek,将公司独立分拆并按市场化估值融资是更合理的商业选择 [5] 技术进展与战略迁移 - 公司已有15个月未进行大版本更新,原计划2025年2月发布的下一代旗舰模型DeepSeek V4因工程问题多次跳票 [6] - V4延期的核心原因之一是进行重大的技术路线迁移,将放弃基于英伟达CUDA框架的路径,全面运行于华为昇腾芯片并适配华为CANN框架,这涉及整体架构重构与系统稳定性强化 [6][7] - 若迁移成功,DeepSeek V4将成为全球首个不依赖英伟达的前沿AI模型,英伟达CEO黄仁勋认为此举将削弱美国在AI技术生态的壁垒 [7] - 传闻DeepSeek V4将于4月下旬发布,模型参数规模达万亿级别,支持百万级上下文长度,上月持续约13小时的服务中断被业内普遍归因于V4的灰度测试 [7]
刚刚,梁文锋被曝史上首次融资!DeepSeek V4彻底摆脱英伟达
猿大侠· 2026-04-19 12:10
公司融资策略转变 - 公司首次寻求外部融资,计划以不低于100亿美元的估值筹集至少3亿美元资金 [1][2] - 公司此前坚决不融资,多次拒绝国内顶级风投和科技巨头的投资意向,此次转变旨在充实资金弹药库以应对激烈的AI大模型开发竞赛 [3][6][7] - 融资成功将有助于公司获取更多算力资源并开出更高薪酬,防止顶尖研究者流失 [9] V4模型技术规格与进展 - V4模型参数量跃升至万亿级别,采用MoE架构,总参数约1万亿,但每个token仅激活约370亿参数,推理成本与前代V3持平 [17][18] - 模型上下文窗口扩展到100万token,引入Engram条件记忆架构,在该长度下的信息召回率达到97% [20] - V4将是公司首个原生多模态模型,支持文本、图像和视频生成 [22] - 模型代码能力大幅强化,内部benchmark显示SWE-bench成绩超过80%,HumanEval达到90%,能处理整个代码仓库级别的复杂bug修复 [23] - V4预计分两个版本发布:完整版超万亿参数,针对高级推理和复杂代码任务;轻量版约2000亿参数,面向通用对话和API服务 [24] - 模型计划以Apache 2.0协议开源权重 [25] - 多个信源指向V4将于4月底发布,近期已有测试版本短暂出现,且公司开始招聘算力基础设施相关驻场人员,表明已进入大规模部署准备阶段 [26][27][28] 硬件生态迁移与战略影响 - V4模型将运行在华为最新的昇腾芯片上,公司工程师花费大量时间将核心代码从英伟达CUDA生态迁移至华为CANN架构 [31][32] - 公司刻意未向英伟达和AMD提供V4做早期优化适配,而是将早期访问权限独家给了国产芯片厂商 [33] - 若V4在华为芯片上跑出有竞争力的性能,将是全球首个不依赖英伟达的前沿AI模型 [34] - 英伟达CEO对此表示担忧,认为AI模型被优化为在中国硬件上运行对美国芯片产业将是一个糟糕的结果 [35][36] 行业竞争背景 - 公司新一代模型发布已推迟一年半,而全球各大顶尖模型正在快速迭代,中美科技巨头凭借资金优势不断占领高位 [9][11] - 根据斯坦福大学2026年度AI指数报告,截至今年3月,美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点 [40] - 竞争对手OpenAI近期以8520亿美元估值完成了1220亿美元融资,相比之下公司寻求的3亿美元融资规模较小 [40]
计算机行业周报20260413-20260417:物理AI商业化加速!ClaudeMythos讨论-20260418
申万宏源证券· 2026-04-18 22:26
报告行业投资评级 - 看好 [2] 报告核心观点 - 物理AI正由技术验证走向商业化落地,产业竞争重心由模型能力转向数据能力、仿真能力与场景闭环能力,高质量数据的可得性成为核心约束 [4][6] - 合成数据的核心价值在于基于真实数据对训练样本进行规模化扩展,未来产业竞争的本质在于谁能率先建立“真实数据沉淀—结构化表达—合成扩展—闭环验证”的数据工厂能力 [4][10] - 群核科技、五一视界、索辰科技等中游厂商围绕真实世界数据构建物理AI基础设施,承担“数据放大器”和“场景基础设施”角色,成长空间取决于平台化、行业复制及场景延展能力 [4][14][21] - Claude Mythos标志着AI在网络安全领域具备规模化攻防能力,其极强的漏洞挖掘与Agent化能力将昂贵、稀缺的漏洞挖掘工作推向更可规模化阶段 [35][40] - DeepSeek V4预计将补齐多模态短板,推理和代码能力达业内领先水准,并通过Engram、DualPath等创新架构提升长上下文和复杂长任务(Agent)处理能力,同时全面适配国产算力 [41][42][45][49][56] 根据相关目录分别进行总结 1. 物理AI商业化加速,数据成关键壁垒 - 物理AI训练依赖大量符合物理规律、具备交互反馈且可验证的环境数据,而真实世界数据存在采集成本高、长尾覆盖不足、加工复杂和物理一致性要求高等约束 [4][6][7] - 高质量物理数据的可得性正成为物理AI商业化的核心约束,数据已直接决定训练效率、泛化能力和可部署性 [6][7] - 物理AI商业化近期明显提速,源于下游应用成熟度提升、上游基础设施标准化推进以及中游厂商平台化能力增强 [15] - 下游场景对训练和验证效率要求提升,仿真与合成数据由辅助工具升级为商业化必需的基础设施 [16] - 上游科技平台公司推动世界模型、仿真平台等标准化,强化了“物理AI核心在于数据工厂”的认知 [19] - 中游厂商由项目制交付走向平台化输出,商业模式由“项目交付驱动”转向“平台复用驱动” [20] 2. 重点公司分析(物理AI基础设施) - **群核科技**:基于室内空间设计、三维模型等数据底座,向空间智能基础设施提供商演进。核心产品SpatialVerse用于生成合成虚拟数据集以训练AIGC模型及增强机器人等认知能力。公司正通过SpatialTwin、Aholo等产品将能力平台化,其长期价值在于作为“空间智能数据底座”的稀缺性 [21][22][25][26] - **五一视界**:核心为智能驾驶仿真与数据验证平台,打通了真实数据采集、场景重建、闭环仿真与验证反馈的完整链条。近期结合神经重建能力,将真实路测数据高效转化为交互式仿真场景。公司已在高阶智驾仿真领域形成先发优势,并正将能力向机器人等更广泛的具身智能场景外延 [21][26][28][29] - **索辰科技**:基于工业仿真和国产CAE能力,向工业级物理AI平台延展。其数据底层是工业机理模型和多物理场数据,物理规律内嵌于训练过程是关键特征。核心平台“天工·开物”尝试将设计、仿真、训练和优化融为一体,商业模式由出售单点软件转向更高附加值的平台输出。其长期价值体现在工业级物理AI的高门槛与高粘性 [21][30][31][32][34] 3. 模型更新:Claude Mythos及DeepSeek V4 - **Claude Mythos**:Anthropic新一代旗舰模型,网络安全能力极强,可自动在大型软件系统中寻找零日漏洞并生成完整利用代码(exploit),在测试中发现数千个高危漏洞 [35][36]。其Agent化能力很强,可自主扫描系统、组合漏洞链并完成复杂安全任务,像一个自动化红队AI Agent [40]。该模型仅提供给大型科技公司、网络安全公司、政府机构等少数机构使用 [35] - **DeepSeek V4**:开启灰度测试,预计补齐多模态短板 [41] - **推理与代码能力**:主打编码能力,内部初步测试结果显示超过Claude和GPT系列 [42] - **长上下文与Agent能力提升**:可能基于Engram和DualPath新架构。Engram模块实现存算解耦,将海量记忆卸载至CPU内存,以O(1)哈希检索,在保障长上下文与推理精度的同时释放GPU压力 [45]。DualPath解决Agent任务负载下的存储带宽瓶颈,通过动态负载均衡,在测试中使离线推理吞吐量提升1.87倍,在线服务吞吐量平均提升1.96倍 [49] - **国产算力适配**:预计全面迁移至华为昇腾AI芯片及CANN架构,实现深度协同。在昇腾950PR芯片上推理速度达到英伟达H100的85%,显存占用降低40%,能耗降低30% [56] 4. 重点公司更新 - **达梦数据**:即将发布GDMBASE AI数据库,采用图原生+向量一体化底座,原生适配MCP协议。其HyperRAG全域检索融合四大技术栈,使检索召回率提升30%、准确率提升20%;在百万级记忆节点规模下,图谱检索延迟稳定低于100ms [58]。同时发布DAMENG PAI数据库一体机,在3个存储节点配置下,8K随机读IOPS可达500万,I/O时延控制在80微秒以内,大表扫描性能提升50倍 [59] - **聚水潭**:国内电商SaaS ERP市场份额达24.4%,位居行业第一 [60]。公司2023-2025年收入同比增速分别为33.3%/30.5%/25.6%,经调整净利润由2023年的-2.1亿元提升至2025年的2.3亿元,实现盈利拐点 [62]。增长由规模化效应、AI赋能与出海拓展驱动,预计2026-2028年营业收入分别为14.0/16.5/19.8亿元,归母净利润分别为3.7/5.0/7.4亿元 [63] - **神州数码**:2025年加速布局AI行业应用与服务、自有品牌算力设备等领域,“AI for Process”战略业务签约客户数同比增长167%,互联网行业签约额同比激增915% [64]。公司提出“企业数智基座”战略,涵盖算力基座、模型基座和Agent运行基座 [66] 5. 重点推荐主线 - 报告列出了九大重点推荐投资主线,包括:1) 数字经济领军;2) AIGC应用;3) AIGC算力;4) 数据要素;5) 信创弹性;6) 港股核心;7) 智联汽车;8) 新型工业化;9) 医疗信息化,并提供了详细的标的列表 [4][67]