Workflow
H200
icon
搜索文档
国泰海通|计算机:大模型进入可执行Agent时代,入口与算力侧同步演进
文章核心观点 - 大模型产业正加速向可执行、可协同、能自进化的智能体(Agent)时代演进,体现在模型能力、应用入口和底层算力三个方面的同步发展与强化 [1] 大模型Agent能力升级 - 小米与MiniMax近期集中强化Agent能力,推动大模型进入强执行、可协同、能自进化的时代 [2] - 小米的MiMo-V2-Pro支持1M上下文,在Coding Agent与Tool Use等维度进入第一梯队,且其API价格仅为同级竞品的1/5 [2] - 小米的MiMo-V2-Omni与TTS进一步补齐多模态感知、办公生成与语音交互能力,推动MiMo向“人车家全生态”智能中枢演进 [2] - MiniMax发布M2.7模型,在复杂技能环境下的指令遵循率达97%,并开始具备自主构建和优化Agent Harness的能力 [2] Agent应用入口向即时通讯延伸 - Anthropic与腾讯QClaw分别从海外聊天软件和微信生态切入,推动Agent入口向即时通讯场景延伸 [3] - Anthropic的Claude Code新增Channels功能,可接入Telegram、Discord等通信工具,用户可直接在手机端远程调用AI执行代码、运行测试并接收结果反馈 [3] - 腾讯QClaw正式开启公测,微信入口升级为小程序,支持上传或接收电脑端文件,并上线“灵感广场”预置常用任务,实现无需编写指令的一键调用 [3] 算力供给与基础设施演进 - 英伟达已恢复为中国市场生产H200人工智能处理器,随着中国客户需求信号增强,公司已获得相关出口许可并收到采购订单,供应链正重新启动 [4] - 英伟达将推出全新MGX NVL机架NVIDIA Kyber,每个机架的NVLink域容量翻倍至可容纳144个GPU,并采用CPO(共封装光学)与铜互连实现扩展 [4] - Rubin架构亦有望大规模采用铜互连,显示公司正同步推进中国市场供给修复与下一代算力基础设施演进 [4]
计算机周观点第37期:大模型进入可执行Agent时代,入口与算力侧同步演进
国泰海通证券· 2026-03-22 18:45
行业投资评级 - 维持计算机板块“增持”评级 [4] 核心观点 - 大模型进入可执行Agent时代,产业演进持续提速,入口与算力侧同步演进 [2][4] - 小米与MiniMax最新模型进入可执行Agent时代,国产大模型加速向任务执行与自我进化升级 [4] - Anthropic与腾讯QClaw接入Telegram、Discord及微信小程序等入口,推动Agent向即时通讯场景延伸 [4] - 英伟达重启对华H200生产并推出新一代Kyber机架,算力供给与底层架构同步演进 [4] 大模型Agent能力演进 - 小米与MiniMax近期集中强化Agent能力,大模型全面进入强执行、可协同、能自进化的Agent时代 [4] - 小米MiMo-V2-Pro支持1M上下文,在Coding Agent与Tool Use等维度进入第一梯队,且API价格仅为同级竞品的1/5 [4] - 小米MiMo-V2-Omni与TTS进一步补齐多模态感知、办公生成与语音交互能力,推动MiMo向“人车家全生态”智能中枢演进 [4] - MiniMax发布M2.7,在复杂技能环境下指令遵循率达97%,并开始具备自主构建和优化Agent Harness的能力 [4] Agent入口向即时通讯延伸 - Anthropic的Claude Code新增Channels功能,可接入Telegram、Discord等通信工具,用户可直接在手机端发送消息,远程调用AI执行代码、运行测试并接收结果反馈 [4] - 腾讯QClaw正式开启公测,微信入口升级为小程序,支持上传或接收电脑端文件,同时上线“灵感广场”并预置常用任务与skills,实现无需编写指令的一键调用 [4] - QClaw是首个实现微信互联的“龙虾”,显示国内Agent产品正加快与高频社交入口融合 [4] 算力供给与基础设施演进 - 英伟达宣布已恢复为中国市场生产H200人工智能处理器,随着近几周中国客户需求信号增强,公司已获得相关出口许可并收到采购订单,供应链正重新启动 [4] - 英伟达将推出全新MGX NVL机架NVIDIA Kyber,每个机架的NVLink域容量翻倍至可容纳144个GPU,并采用CPO与铜互连实现扩展 [4] - Rubin架构亦有望大规模采用铜互连,显示公司正同步推进中国市场供给修复与下一代算力基础设施演进 [4] 推荐标的 - 报告推荐标的包括:日联科技、金山办公、海光信息、浪潮信息、合合信息、海康威视、赛意信息、新国都、迅策、聚水潭 [4] - 根据盈利预测表,各公司2025年预测市盈率(PE)分别为:日联科技53.56倍、金山办公62.70倍、海光信息159.13倍、浪潮信息30.51倍、合合信息51.05倍、海康威视21.29倍、赛意信息36.85倍、新国都22.69倍、聚水潭46.83倍 [5] - 迅策2026年预测市盈率为474.19倍 [5]
计算机周观点第37期:大模型进入可执行Agent时代,入口与算力侧同步演进-20260322
国泰海通证券· 2026-03-22 16:26
报告行业投资评级 - 维持计算机板块“增持”评级 [4] 报告核心观点 - 大模型进入可执行Agent时代,产业演进持续提速,入口与算力侧同步演进 [1][2] - 小米与MiniMax最新模型进入可执行Agent时代,国产大模型加速向任务执行与自我进化升级 [4] - Anthropic与腾讯QClaw接入Telegram、Discord及微信小程序等入口,推动Agent向即时通讯场景延伸 [4] - 英伟达重启对华H200生产并推出新一代Kyber机架,算力供给与底层架构同步演进 [4] 大模型Agent能力演进 - 小米与MiniMax近期集中强化Agent能力,大模型全面进入强执行、可协同、能自进化的Agent时代 [4] - 小米MiMo-V2-Pro支持1M上下文,在Coding Agent与Tool Use等维度进入第一梯队,且API价格仅为同级竞品的1/5 [4] - 小米MiMo-V2-Omni与TTS进一步补齐多模态感知、办公生成与语音交互能力,推动MiMo向“人车家全生态”智能中枢演进 [4] - MiniMax发布M2.7,在复杂技能环境下指令遵循率达97%,并开始具备自主构建和优化Agent Harness的能力 [4] Agent入口向即时通讯延伸 - Anthropic的Claude Code新增Channels功能,可接入Telegram、Discord等通信工具,用户可直接在手机端发送消息远程调用AI执行代码 [4] - 腾讯QClaw正式开启公测,微信入口升级为小程序,支持上传或接收电脑端文件,同时上线“灵感广场”并预置常用任务与skills [4] - QClaw是首个实现微信互联的“龙虾”,显示国内Agent产品正加快与高频社交入口融合 [4] 算力供给与基础设施演进 - 英伟达宣布已恢复为中国市场生产H200人工智能处理器,已获得相关出口许可并收到采购订单,供应链正重新启动 [4] - 英伟达将推出全新MGX NVL机架NVIDIA Kyber,每个机架的NVLink域容量翻倍至可容纳144个GPU [4] - 新一代机架方案采用CPO与铜互连实现扩展,Rubin架构亦有望大规模采用铜互连,显示“光铜并举”的演进方向 [4] 推荐标的 - 报告推荐标的包括:日联科技、金山办公、海光信息、浪潮信息、合合信息、海康威视、赛意信息、新国都、迅策、聚水潭 [4] - 提供了推荐标的的盈利预测表,包含收盘价、总市值、EPS及PE等数据 [5]
Token经济爆发,谁赚翻了
21世纪经济报道· 2026-03-21 10:29
行业核心观点 - AI行业正从“模型为王”的时代进入“Token为王”的时代,Token被视为新时代的“工业石油”,成为人类与数字世界交互的主要载体[1] - AI的商业逻辑发生转变,Token经济的爆发标志着AI行业迈入“商业变现期”,产业链价值正在重构[1][4] 产业链上游:算力硬件与芯片 - 英伟达是核心受益者,其GPU(如H200、B200)是Token工厂的核心资产,用于持续的推理算力消耗[2] - 英伟达在GTC大会上将2027年的市场需求预期从5000亿美元上调至1万亿美元[2] 产业链中游:云服务与算力平台 - 国内云厂商(如腾讯云、阿里云、百度云)集体官宣涨价,因Token消耗导致算力成为稀缺资源,云厂商重新掌握定价权[2] - 阿里云AI算力、存储等产品最高涨价34%,百度智能云AI算力相关服务上调约5%-30%[2] - 阿里成立“Token Hub”事业群,由CEO吴泳铭亲自挂帅,核心目标是创造、输送和应用Token[1] 产业链中游:大模型与AI智能体 - 以“OpenClaw”为代表的开源AI智能体加速落地,带动Token需求大涨,最近每周的Token使用量相比今年1月翻了三倍[1] - 智能体每执行一个任务,消耗的Token量是普通聊天的几十倍甚至上百倍[2] - 中国大模型公司凭借高性价比优势受益,其API定价普遍不到OpenAI GPT同类产品的20%,有的甚至只有10%[3] - MiniMax的M2.5模型Token使用量一度排到全球第一,其M2系列文本模型日均Token消耗量在2026年2月较2025年12月暴增超过6倍[3] - Kimi在1月底以来20天的收入就超过了2025年全年,且海外收入已超过国内收入[3] - 中国大模型公司的估值逻辑已从“讲故事”转变为“算收入”[3] 产业链基础设施:数据中心与通信网络 - AI数据中心是Token的生产地,相关公司(如润泽科技、光环新网)将受益[4] - 为算力设施降温的液冷解决方案提供商(如英维克)将受益[4] - 光模块和光纤是Token传输的通道,相关龙头公司(如中际旭创、新易盛)将受益[4] 行业终局与竞争焦点 - 行业竞争的终局将取决于谁能以最低成本生产Token、最高效地输送Token,以及让Token产生最大价值的应用[4]
重返中国 AI 芯片市场:英伟达 H200 重启供货,Groq 芯片补齐推理版图
经济日报· 2026-03-19 07:04
英伟达产品策略与市场动态 - 英伟达已重启并加快生产H200芯片销往中国大陆,其执行长黄仁勋表示已拿到许多中国客户的许可证和采购订单,供应链正在运作 [1] - H200是基于较旧世代Hopper架构的产品,此前因美中监管趋严于去年停产,此次取得出口许可后重启生产,标志公司重新进入中国大陆市场取得进展 [1][1] 中国大陆市场准入与客户情况 - 路透社报道,北京当局已批准多家中国大陆企业能够采购H200订单,有陆企消息人士表示已收到英伟达通知能够下单 [1] - 法人指出,英伟达冲刺H200生产有助扩大其中国市场占有率,并有益于鸿海、英业达等在大陆拥有不少云端服务供应商客户的服务器厂后续出货 [1] 新产品规划与市场布局 - 英伟达据传正在准备能在大陆销售的Groq推论芯片,试图在竞争日益激烈的AI推论市场中站稳脚跟 [1] - 公司正准备推出一款可销往大陆市场的Groq芯片版本,该版本并非特别为大陆降规设计,而是具备可与其他系统整合的弹性,预计最快5月上市 [2] - 英伟达即将推出的Vera Rubin绘图处理器用于海外资料中心进行模型训练,而可销往大陆的Groq芯片则负责推论运算,两者并非打包销售,而是分别部署于不同市场以因应出口管制限制 [2]
Energy & Inflation "Whammies" Hit Stocks into FOMC Interest Rate Decision
Youtube· 2026-03-18 23:00
宏观经济与地缘政治风险 - 伊朗与以色列的冲突导致能源供应风险上升,推动原油价格上涨,布伦特原油突破108美元,WTI原油升至约98美元,油价回升至一周前回调前的水平[2] - 生产者价格指数(PPI)数据超预期,整体PPI同比增长7%,核心PPI同比增长0.5%,且该数据尚未包含本月油价的飙升[3] - PPI中走高的分项指标将传导至个人消费支出(PCE)物价指数,而PCE是美联储当前政策决策的关键指标[3] - 地缘冲突导致的能源价格飙升(涨幅达50-60%)不仅影响原油,还将传导至化工和化肥等产业,对经济产生影响[7] - 市场对美联储降息的预期已大幅缩减,目前仅定价一次降息,而一个月前预期为一到两次降息[8] 美联储政策与市场预期 - 市场关注美联储会议传递的信息,特别是关于通胀是暂时性还是将持续的评估,以及其对短期和长期经济的看法[3][4] - 美联储的“点阵图”将成为关键,它能揭示美联储官员对通胀、GDP直至年底及明年的预测[5] - 美联储正试图消化来自多个方向的不同变量,此前一周的数据显示第四季度GDP增长减半,决策环境复杂[6] 行业表现与市场结构 - 市场呈现狭窄的行业领涨格局,能源和公用事业是主要驱动力量,近期科技股虽有反弹但整体疲软[11][12] - 从技术指标看,目前仅有公用事业和能源两个行业有超过50%的成份股股价位于200日移动均线上方[12] - 尽管主要股指跌幅看似不大(约3-5%),但市场内部个股调整剧烈,标普500指数内部分股票下跌25-30%,纳斯达克指数内跌幅更深[13] - 在这种市场结构下,投资者应考虑在投资组合中超配能源股作为对冲,同时减少对部分高贝塔值股票的敞口[13][14] 科技行业细分表现 - 科技行业内部表现分化,不能一概而论,例如当日英伟达股价上涨而其他多数科技股下跌[15][16] - 软件行业和内存芯片领域展现出持续的强势,例如美光科技年初至今涨幅超过50%[17][18] - 美光科技即将公布财报,市场预期其营收将达到创纪录的197.7亿美元,较去年同期的80亿美元大幅增长146%[18][19] - 市场已为美光科技的股价定价了约9%或10%的波动,该股目前交易价格高于450美元[19] - 投资科技股需要精选个股,不能只关注“七巨头”,市场存在指数之外的结构性机会,有利于选股者[20][21] 特定公司催化剂 - 英伟达首席执行官黄仁勋提及H200订单,并称Open Claw将成为下一个ChatGPT,相关中国ADR公司可能从中受益[16] - 美光科技的财报成为市场下一个关键催化剂,尽管今日股价仅小幅上涨,但分析师对内存领域正变得更加乐观[21]
英伟达CEO黄仁勋称“已重启对华生产”
日经中文网· 2026-03-18 11:21
英伟达对华AI半导体出口业务动态 - 公司已获得面向众多中国客户的出口许可 面向中国的生产已在重启 [1] - 对华出口情况与两周前相比已经发生变化 公司已接到许多中国客户的订单 [3] - 特朗普政府曾在2025年批准公司高性能半导体H200对华出口 但许可范围仍然较为有限 [3] 公司对行业政策与竞争格局的看法 - 公司认为特朗普总统的意图是让美国在获取最先进技术方面占据主导地位 [3] - 公司曾向美国政府反映 如果对华出口管制持续 可能反而会助长中国国产AI半导体的崛起 [3] 对全球半导体供应链转移的评估 - 对于美国商务部长提出的将台湾约四成半导体生产转移到美国的目标 公司首席执行官认为非常困难 [5] - 尽管其委托生产的台积电正在扩大对美投资 但对台湾的依赖仍将持续 [5]
大摩闭门会:中国AI GPU前景展望以及台积电最新资本支出预期; 上调阿里巴巴为互联网首选
2026-03-16 10:05
涉及的行业与公司 * **行业**:中国人工智能(AI)行业、AI芯片(GPU/ASIC)行业、半导体制造与封装行业、互联网科技行业[2][3][4] * **公司**: * **互联网/科技公司**:阿里巴巴(含阿里云、平头哥、千问模型)、百度、字节跳动、腾讯[4][11][12][25] * **AI芯片公司**:华为、寒武纪、昆仑芯、天数智芯、海光[16][36][41] * **半导体制造/封装**:台积电(TSMC)、中芯国际(SMIC)、华力微、三星[27][28][40] * **半导体材料/部件**:华虹(PMIC)、Nara MEC、ACMRA(HBM及封装)[40] 核心观点与论据 * **上调阿里巴巴为互联网首选**:核心原因是其在AI全产业链的领先布局,具体包括:1)芯片层(平头哥是国内第一梯队);2)云服务层(阿里云是国内最大、全球领先);3)模型层(千问模型全球下载量最高);4)应用层(虽起步慢但追赶迅速)[3][11][12][13] * **中国AI芯片需求强劲增长**:预计中国国产AI芯片市场规模(TAM)将从2024年的190亿美金增长至2030年的670亿美金,复合年增长率(CAGR)为23-24%[26] 主要需求来自:1)中国云服务提供商(CSP),占资本开支六成多;2)运营商、国企及主权支出,占三成左右;3)大模型及电动汽车公司,占一成左右[25] * **中国AI芯片供给与自给率快速提升**:预计国产AI芯片产值将从2024年的62亿美金上升至2030年的508亿美金,CAGR达42%[27] 国内晶圆厂先进制程代工产能预计从2025年的8000片/月增长至2030年的5万片/月[27] 自给率将从2024年的33%提升至2030年的76%,2027-2028年即可满足一半以上需求[27] * **国产AI芯片已具备商业竞争力**:在推理(inference)场景下,许多国产芯片性能已超越英伟达A100,单位性能成本(performance per cost)也超越A100和H20[9][10] 预计半年到一年后,性能可达到H200水准[32] 虽然制程(7纳米 vs 3纳米)有差距,但在封装(2.5D)、系统层级及电力供应等方面有优势,整体竞争力强[29][30][32] * **行业竞争格局与长期赢家**:短期(未来12个月)是供给驱动,能获得晶圆厂产能的公司即有营收[37] 长期看,市场将向头部集中,华为、寒武纪将是头部玩家,昆仑芯、平头哥将维持较高的个位数市场份额(high single digit)[16][17] 拥有国家队支持或与大型互联网公司深度绑定的芯片公司更具优势,独立第三方商业模式较艰难[36][37] 随着竞争加剧,行业毛利率有下降压力[37] * **上调台积电资本支出预期**:基于AI芯片的强劲需求,预计台积电资本支出今年为540亿美金,明年将升至650亿美金,后年达700亿美金[39][40] 其他重要内容 * **互联网公司自研芯片的重要性**:1)降低对第三方供应商的依赖;2)可根据自身应用需求定制芯片设计;3)可灵活调动产能,应对算力需求波动[5][6][7][8] * **具体公司估值分析**: * **昆仑芯**:预计2026年收入100亿人民币,采用26倍PS(较寒武纪33倍PS给予20%的A/H股折价),估值约450亿美金[18][19] * **平头哥(阿里巴巴)**:预计2026年GPU+CPU总收入200亿人民币(假设GPU占比50%),采用26倍PS,估值约500亿美金[20] * **全球AI投资趋势**:全球AI芯片市场规模预计2030年达1万亿美元,主要驱动力来自内存需求增加[38] 服务器供应链提升按计划进行,库存无需过度担心[38] * **调研信息补充**:天数智芯的芯片算力已接近H200,其第二代产品(台积电合规版本)合理假设为约300 TFLOPS(FP16),并支持FP8精度[41][43] 当前毛利率有50-60%,但未来可能下降[41] * **风险与不确定性**:部分中国互联网公司(如字节跳动)将超过一半的AI资本开支用于海外,这部分不计入国产芯片需求[25] 海外晶圆厂(如三星)对国产芯片的产能贡献不确定性较大[27] 国产HBM预计今年底小量生产[30]
AI上游持续供不应求,应用落地
国金证券· 2026-03-11 13:45
报告投资评级 * 报告未明确给出对行业的整体投资评级 [1][6][7][8][9][10] 报告核心观点 * 全球AI产业需求持续强劲,上游硬件(存储、光互联、算力芯片)呈现供不应求态势,资本积极投入以解决供应链瓶颈 [8][12][18][22][31] * AI大模型能力持续突破并加速商业化,头部公司营收高速增长,应用层创新活跃,正从云端向边缘和终端设备渗透 [7][14][15][17][26][28] * 国内AI算力需求旺盛,推动数据中心(IDC)行业增长,同时海外芯片供应受限,为国产芯片替代带来发展机遇 [8][23][31][32] 产业前沿总结 AI基础层 * 存储芯片持续涨价:三星电子计划在第二季度将主要NAND产品价格上调约100%,与第一季度涨幅相近,意味着价格较去年底累计上涨约两倍,SK海力士、铠侠等其他厂商也在筹备进一步涨价 [7][12] * 特定AI芯片对华供应变化:英伟达已停止生产原本面向中国市场的H200人工智能芯片,将产能转向下一代AI运算平台“Vera Rubin” [7][12][13] AI模型层 * 头部模型公司营收高增:OpenAI年化营收已突破250亿美元,较其年末的214亿美元增长约17%;Anthropic年化营收超过190亿美元,较2025年底的90亿美元增长一倍以上 [7][14][15] * 模型能力取得突破:OpenAI发布的GPT-5.4首次实现原生电脑操控能力,在OSWorld-Verified基准测试中成功率达到75.0%,超过了72.4%的人类基准线 [7][14] AI应用层 * 用户增长迅猛:Anthropic旗下AI产品Claude日均注册量突破100万,在部分应用商店的排名已超越ChatGPT [7][17] * 视频生成模型商业化:Seedance2.0价格公布,按不含视频输入的价格(46元/百万tokens)计算,生成一条15秒视频约需15元,即平均每秒1元 [7][17] 资本风向总结 AI基础层 * 英伟达大手笔投资上游硅光技术:分别向Coherent和Lumentum各投资20亿美元,并签订包含大规模采购承诺的战略协议,共同开发下一代硅光子技术 [7][8][18] * 上游公司业绩普遍高增,印证AI需求: * 博通2026财年第一季度营收193.11亿美元,同比增长29% [7][19][31] * Marvell 2026财年第四季度营收22.19亿美元,同比增长22%,并上调未来财年营收预期 [7][20][31] * Ciena 2026财年第一季度营收14.27亿美元,同比增长33.1%,但供应链问题导致订单积压从约50亿美元攀升至约70亿美元 [7][21][22][31] AI模型层 * 阿里巴巴大模型业务调整:千问模型负责人林俊旸离职,公司同时将大模型B端和C端应用品牌统一为“千问” [7][24][25] * MiniMax业绩亮眼:2025财年总收入达7904万美元,同比大增158.9%;毛利达2008万美元,同比暴增437.2% [7][26][31] AI应用层 * 巨头合作深化:苹果与谷歌在AI领域继续深入绑定,新版Siri数字助手可能由Gemini驱动并在谷歌数据中心运行 [7][27] * 硬件产品创新:阿里巴巴千问宣布上线AI眼镜并开启预约,顶配G1系列补贴后价格下探至1997元 [7][28] * 终端应用竞争激烈:腾讯、小米、美团等公司纷纷推出或测试新的AI终端应用或智能体产品 [29][30] 产业链数据更新 * 智能手机市场:2026年1月,中国智能手机销量约2670万台,同比下滑约14%;市场份额前五名为苹果(约23%)、华为(约19%)、小米(约12%)、荣耀(约12%)、OPPO(约11%) [10][32] * PC市场:2026年1月,中国台式机销量约200万台,同比上升约15%;笔记本电脑销量约148万台,同比上升约7% [10][32]
CoreWeave (NasdaqGS:CRWV) 2026 Conference Transcript
2026-03-05 06:07
公司:CoreWeave 核心观点与业务表现 * 公司经历了前所未有的增长算法,需求旺盛且持续,其积压订单和增长率令人瞩目[1] * 公司预计到2026年底年度经常性收入将达到170亿至190亿美元,到2027年底将超过300亿美元[4] * 公司2025年底的年度经常性收入需求为67亿美元,显示出收入的巨大跃升[4] * 公司拥有668亿美元的积压收入,这些合同加权平均期限为5年,部分合同长达6年[4] * 公司指导2026年的资本支出在300亿至350亿美元之间,中点为325亿美元[18] * 公司拥有43个活跃的运营站点,展示了其执行和扩展能力[45] 市场需求与客户行为 * 市场需求被描述为“势不可挡、永不满足”,预计到2026年,市场上可计费的计算容量将基本售罄[3] * 需求来源已从最初的AI实验室,扩展到超大规模云客户,并迅速发展到企业客户[3] * 企业采用正在快速扩大,Anthropic等公司的数据可以佐证[4] * 客户行为正在发生变化,主要体现为两点:一是寻求更长期限的合同,二是对旧一代基础设施(如A100、H100、H200)以及最新一代Blackwell都有特定需求[4][5] * 对旧一代基础设施的强劲需求主要由推理工作负载驱动[5] * 客户需求具有高度可持续性,不仅针对最新一代计算,也针对当前市场上提供的广泛基础设施[5] 竞争优势与运营 * 公司的竞争优势在于能够比任何人更快地构建基础设施、更快地推出最新技术,并且最重要的是能够更持久地保持其运行[6][7] * 公司的平台是围绕可并行化工作负载的概念构建的,这需要不同的基础设施和运营要求[7] * 公司的产品被广泛认为是运行超大规模可并行化计算性能最高的解决方案[7] * 公司的运营基础设施套件使其能够稳定地交付超级计算机[8] * 第三方咨询公司(如SemiAnalysis)的基准测试认可了其解决方案的优越性,公司在其前两个报告周期中均名列前茅[8] * 公司拥有极其紧密的工程合作关系,贯穿整个供应链,并与供应商、客户和数据中心运营商密切合作,以大规模交付最有效的工程解决方案[8] * 公司通过解决全球最密集AI用户的日常问题,积累了大量的专有信息,使其能够预见技术发展趋势[9] * 公司能够快速响应技术范式转变,例如思维链模型的引入导致了对内存需求的重新认识[10] * 公司对代理工作负载等新兴趋势有前瞻性洞察,预计CPU需求将随之增加[11] 产品与附加服务 * 公司的存储产品年度经常性收入已远超1亿美元,并且对于收入超过100万美元的客户,其附着率超过80%[11] * 附加外围设备(如存储)的能力对于留住客户和提升运营吸引力是一个令人兴奋的机会[11] * 公司正在构建应用层和外围基础设施,其存储产品的快速扩展表明了客户采用这些附加组件的速度[85] 与英伟达的合作关系 * 公司与英伟达扩大了合作关系,包括一笔20亿美元的增量投资,但更重要的是软件方面的合作[13] * 软件方面的合作承认了CoreWeave软件栈是运行此类基础设施的最佳方式[15] * 公司有机会将其软件解决方案出售给其他实体(例如那些希望将GPU保留在资产负债表上或出于数据主权考虑需要拥有基础设施所有权的实体),这是一条利润率很高的路径[15][16] 财务状况与融资 * 公司采用“母公司”和“资产公司”的结构来分解业务,所有资产都位于资产公司[18] * 资产公司能够引入融资工具,市场对其债券有极高的参与需求[18] * 公司正在推进资产层面的融资,这反映了其执行记录以及合同和数据中心协议的持久性[19] * 公司的融资成本已从12%降至9%,并且预计将继续下降[25] * 在资本支出上线并稳定后(例如合同期的第3个月到第60个月),每个部署能为母公司贡献25%的边际贡献[20][69] * 在快速增长期,由于需要为快速增长的活跃电力支付费用,短期内会压低母公司利润率[21] * 公司预计第一季度是利润率曲线的低谷,之后将开始扩张[33][36] * 积压订单将在资产公司层面获得融资,母公司也会部分参与[19] 供应链、成本与执行挑战 * 供应链极其困难,涉及庞大的工程项目[39][42] * 市场瓶颈在于电力(特别是将电力输送至机架和服务器的基础设施)和熟练劳动力(如电气工程师),而非电网电子可用性[44][45] * 公司主要通过租赁获得数据中心容量,同时也进行少量自主开发[45] * 公司在其预测中已经包含了大量的保守估计以应对供应链问题[46] * 内存价格飙升对公司影响有限,因为GPU成本在节点成本中占绝对主导地位[49][50] * 组件成本(如内存)和电力成本的上涨最终会转嫁给终端客户[50][52] * 公司更关注供应链的稳定性,确保能够获得组件以向客户交付基础设施[50] 电力与数据中心战略 * 公司的目标是到2030年增加5吉瓦的电力[56] * 公司认为电力资源是存在的,挑战更多在于数据中心侧的供应链导航[57] * 公司仅在有需求时才采购容量,与最大客户的对话节奏通常提前12至18个月[58] * 公司优先考虑的是按照客户要求的时间表获得“活跃电力”(即可用于交付基础设施的电力)[61] * 一旦获得活跃电力,公司能够在数周内(约4-6周)交付稳定的超级计算机[63][65] * 公司将继续在自建与租赁之间保持机会主义的混合模式,并可能增加自主开发的比例,尤其是在5吉瓦目标的背景下[67][68] * 最终策略将由客户需求决定[68] 资产寿命与折旧 * 公司坚持6年的GPU有用寿命,这与同行保持一致[76] * 有迹象表明市场开始接受6年是有用寿命的正确数字,并且实际使用寿命可能超过6年[76] * 以A100为例,作为2020年的SKU,目前已接近6年,但其在2025年的定价实际上有所上涨,保持了定价能力[77] * 对旧一代基础设施的强劲需求(主要由推理驱动)和签订的多年期照付不议合同,为6年以上的有用寿命提供了经验支持[78] * 超过6年的有用寿命对利润率前景来说是一个令人兴奋的可能性[78] 硬件战略与供应商关系 * 公司目前是英伟达的忠实用户,客户目前只要求英伟达的硅芯片[80] * 公司的软件是硬件无关的,能够运行任何类型的基础设施,并且能够快速适配新硬件[80] * 公司采取客户主导的策略,根据客户需求来构建基础设施,这使得其资本支出的风险得以降低[80] * 目前没有收到对其他类型硅芯片的需求[80] 软件战略 * 公司的软件战略遵循一个成熟的路线图:首先构建正确的基础设施和平台,然后在此基础上构建应用层和添加外围设备[84] * 公司通过收购(如Weights & Biases, OpenPipe, Monolith, Merino)来扩展软件能力[82] * 存储产品的成功(ARR远超1亿美元,高附着率)表明了客户采用这些外围软件组件的速度,这为公司带来了令人兴奋的前景[85]