Workflow
算力
icon
搜索文档
刚刚,全球首个GB300巨兽救场,一年烧光70亿,OpenAI内斗GPU惨烈
36氪· 2025-10-11 19:27
算力需求与投入 - 公司2024年在算力上的总投入达到70亿美元,其中50亿美元用于大模型研发,20亿美元用于推理计算[1] - 公司内部对GPU资源的争夺非常激烈,分配过程被描述为“痛苦与煎熬”[2][12][13] - 公司对算力的需求被描述为“无底洞”,GPU数量直接决定了AI应用的能力上限[1][17] 微软GB300超算集群技术规格 - 微软交付全球首个生产级超大规模AI集群,配备超过4600个GB300 NVL72,并计划未来扩展到十万块GPU[4][6] - 该系统每个机架包含18个虚拟机,共计72个GPU,通过下一代InfiniBand网络互联[7][10] - 机架内通过NVLink和NVSwitch实现高达130TB/s的数据传输速率,连接总计37TB的高速内存[8][10] - 系统提供高达1,440 PFLOPS的FP4 Tensor Core性能,并实现每GPU 800 Gb/s的跨机架带宽[10] 算力资源分配机制 - 公司建立三层决策机制:由高层领导团队决定研究与应用团队的总体算力划分;研究团队内部由首席科学家决定资源分配;运营层由专门团队负责GPU的具体分配和调动[19] - 当项目接近尾声时,硬件资源会被重新分配以支持新启动的项目[17] - 算力资源主要分配给“研究”和“应用产品”两个方向[13] 行业合作与影响 - 甲骨文、英伟达、AMD等芯片及云服务巨头纷纷与公司建立合作关系以缓解算力瓶颈[4] - 微软专为公司打造的GB300超算可使万亿参数大模型的训练时间从数周缩短至数天[4][6] - 公司正在推出“算力密集型服务”,探索在海量算力投入下创造新可能性的机会[21]
OpenAI算力账单曝光:70亿美元支出,大部分钱花在了“看不见的实验”
量子位· 2025-10-11 17:01
OpenAI算力支出结构 - 2024年OpenAI在计算资源上总支出为70亿美元 [1] - 其中约50亿美元用于研发算力,约20亿美元用于面向用户的推理算力 [3] - 这70亿美元支出主要以向微软租用云算力的形式支付,不包括对数据中心的前期投入 [2] 研发算力分配详情 - 研发算力支出中,用于最终训练运行(如GPT-4.5)的成本约为4亿美元,仅占50亿美元研发支出的一小部分 [5][6][18] - 研发算力的大部分(约45.5亿美元)分配给了基础研究、实验性/排险运行以及未发布模型的训练 [5][6] - 这表明公司的研发策略侧重于幕后的探索性实验,而非直接面向产品的最终训练 [6][19] 主要模型训练成本估算 - GPT-4.5最终训练运行的成本估算:集群规模在4万至10万颗Nvidia H100之间,训练时长90至165天,云成本每H100小时1.5至3美元,总成本约4亿美元 [5][14][15] - GPT-4o的训练计算量估计在1e25至5e25 FLOP之间,GPT-4o mini在1e24至1e25 FLOP之间,Sora Turbo在1e24至1e26 FLOP之间 [17] - o系列模型(如o1, o3)的训练计算量估计占基础模型(GPT-4o及GPT-4o mini)的1%至30% [17] 算力投入与公司财务及行业趋势 - 公司2024年营收为37亿美元,但研发算力支出高达50亿美元,这解释了其严重亏损的原因 [20][21] - 行业观点认为,AI公司收入与算力供给高度相关,算力翻倍可能带来收入同步翻倍 [26] - AI发展对算力的需求被视作没有上限,掌控算力被视为掌控AI的关键 [27][28] - 为防止被算力制约,公司已开始自建数据中心 [30]
连云区以精准考核引领海洋特色产业高质量发展
新华日报· 2025-10-11 14:36
核心观点 - 连云区通过优化考核机制引导资源向海洋产业集聚 塑造差异化发展优势 [1][2][3] 考核机制改革 - 整合多头考核体系 全区仅保留一个综合考核体系 为基层松绑减负 [1] - 2025年乡街考核指标数量较上年锐减28% 剔除不符合基层实际的指标 [1] - 取消普适性奖项 清理缺乏依据的达标活动 让干部精力回归主责主业 [1] 海洋产业导向 - 设置新增签约项目中海洋产业项目投资占比指标 并增设海洋经济专项加分项 [2] - 强力引导资金人才土地等要素向海洋电力业 现代海洋渔业 滨海特色旅游等优势产业集聚 [2] - 2024年全区实现海洋渔业增加值18.66亿元 年均增速达26.3% [2] 差异化发展策略 - 实施一板块一赛道错位考核 力避同质化竞争 [2] - 自贸片区重点考核港航贸易 跨境电商发展成效 [2] - 海滨旅游度假区侧重海洋文体旅游品质提升 健康疗养产业培育 [2] - 开发区突出重大项目尤其是海洋新兴产业项目招引与培育实效 [2] 重点项目进展 - 中核田湾200万千瓦滩涂光伏 海洋生物医药等一批引领性海洋新兴产业项目相继落地 [2] 考核结果应用 - 配套制定年度综合考核激励约束事项清单 树立奖优罚劣有为有位的鲜明导向 [3] - 2025年以来已提拔重用23名实绩突出的干部 对3名履职不力的干部进行组织调整 [3]
Waymo自动驾驶最新探索:世界模型、长尾问题、最重要的东西
自动驾驶之心· 2025-10-11 07:32
Waymo自动驾驶技术框架 - 公司开发名为Waymo基础模型的大规模AI模型,该模型支持车辆感知环境、预测其他车辆行为、模拟场景并做出驾驶决策[5] - 模型功能类似于ChatGPT等大型语言模型,基于海量数据集训练学习模式并进行预测,能够整合多源传感器数据理解周围环境[5] - 车端部署较小模型,通过知识蒸馏技术从云端大型教师模型提炼而来,针对速度和效率优化,在每辆车上实时运行[5] - 感知和行为任务包括物体感知、行为预测和行动规划均可实时在车上执行[7] - 云端大模型可模拟真实驾驶环境,在部署前进行虚拟测试和验证决策[7] 世界模型技术特性 - 世界模型能够编码所有传感器数据(摄像头、雷达、激光雷达)并内置世界知识,解码所有驾驶相关任务[11] - 通过蒸馏缩小后放置在车端进行感知和控制,在云端进行虚拟仿真,实现强大泛化能力和快速适应不同平台[11] - 该模型基本解决自动驾驶日常问题,重点转向解决长尾问题[11] 长尾问题解决方案 天气挑战 - 雨后路况水坑及不常发生洪水需要算法判断水深和大量上下文信息,对精确度和召回率要求极高[12] - 采用视觉语言模型解法,但需要大量此类语料库支持[12] - 雪地驾驶对硬件要求高,传感器需加热和清洁功能应对堵塞,挑战包括行驶路线决策、车辙识别和摩擦力估计[14] 能见度与遮挡处理 - 极端低能见度情况下如夜间高速公路,需要多模态传感器协同检测[15] - 凤凰城沙尘暴环境中激光雷达可在尘暴中清晰看到行人[15] - 遮挡推理需解决视线不佳区域物体存在状态判断,挑战包括定义不明确、非确定性、缺乏真值基准等[18] - 解决方案包括估计不确定物体先验信息(通过驾驶数据统计和微弱传感器线索)以及准确估计自车速度先验[21] 复杂场景理解 - 施工场景需识别标志、推理驾驶几何形状,根据锥筒等物体调整路线[24] - 动态场景如交通警官手势需要实时响应动态信号[24] - 活跃事故现场涉及大量应急车辆和路况堵塞,需要整体场景理解而非单个物体识别[24] - 复杂场景需使用大语言模型理解场景内容并做出决策,公司表示仍在探索阶段[24] 自动驾驶核心要素 - 自动驾驶作为人工智能落地场景,核心要素为数据、算法、算力三大件[25] - 公司特别强调数据重要性,认为大量数据是基础,但数据筛选和整理更为关键[25] - 高效高质数据能确保模型专注于解决正确问题[25] - 数据挖矿中视频搜索能力对理解事件含义至关重要,如汽车碰撞、漂移等[30] 系统响应性能要求 - 快速实时决策被强调为安全性和流畅性关键,算法到执行链路用时越短越优[30] - 响应速度拆解为传感器输入响应、算法运算结论输出、底盘执行机构三个环节[30] - 当前快速响应决策主要受限于各家算法处理输出响应频率[31] - 摄像头帧率大于24Hz,算法输出帧率需达到10Hz或20Hz,底盘刹车ESP响应频率达上百Hz[36] 运营基础设施 - Depots运营停车场和改装工厂被公司视为L4运营最重要设施[33] - 车辆可自动进入停车场寻找充电空位,充完电拔枪后自动驶出运营[33] - 改装车间完成传感器安装后,车辆可自动驶出生产线,直接进入运输卡车或开始运营[33] 行业发展趋势 - 辅助驾驶与自动驾驶产业最终将交叉融合,因算法软件底层逻辑相同[4] - 中国辅助驾驶算法公司如Momenta、元戎、大疆与L4公司共同在欧洲和中东市场拓展[4] - 工程落地是行业较大壁垒,需要协同汽车开发与测试运营,优秀自动驾驶公司多挖角传统汽车工程师[34]
为什么 OpenAI 们都要搞 AI 基建?Groq 创始人把背后的逻辑讲透了
Founder Park· 2025-10-10 21:27
AI算力供需格局与市场动态 - AI应用增长完全受限于算力供给,推理算力翻倍可令OpenAI和Anthropic的收入在一个月内几乎翻倍[3][23] - 市场算力供给远不应求,大量接近五年前发布的英伟达H100 GPU仍在被高价租用,且其产生的收入远高于运营成本[7][46][47] - 全球约有35或36家公司贡献了99%的AI收入或算力开销,市场集中度极高[14] - 在算力稀缺时代,交付能力和供应链的确定性本身构成强大的护城河,价值主张从速度转向算力容量的可获得性[3][7][49][51] 自研芯片的战略意义与挑战 - 科技巨头自研芯片的核心动机并非单纯追求性能超越,而是为了掌控自身命运和获取供应链议价权[7][32] - 自研芯片的挑战远超硬件设计,涉及极为复杂的软件生态、持续工程优化以及对技术生态演进节奏的精准把握[7][27] - 芯片成功的关键在于系统视角而非单一芯片性能,SRAM单位成本虽比DRAM贵10倍,但在系统层面因所需芯片数量大幅减少,总成本可能更具优势[145][147] - 行业预测五年后英伟达营收份额仍将超过50%,但芯片出货量占比可能低于10%,品牌溢价和客户决策惯性将维持其高端市场地位[140] 芯片行业竞争与投资逻辑 - 芯片行业存在极高的进入壁垒,首版流片成功率仅14%,从设计到量产理想情况下需三年,构成了时间护城河[159] - 投资应关注真实价值而非情绪价值,AI领域存在实打实的价值兑现,例如私募基金寻求廉价算力以直接改善被投企业利润表[104] - 英伟达的买方垄断地位体现在HBM市场,其通过大额预付款提前两年锁定产能,使得其他玩家难以获得关键组件[30][36] - Groq等新进入者通过缩短交付周期(6个月对比传统18-24个月)和独特的LPU架构切入市场,其最新一轮融资规模达7.5亿美元,估值接近70亿美元[52][53][126][127] AI三要素与经济影响 - AI三要素(数据、算法、算力)中,算力是当前最容易调整、见效最快的要素,提升任意一项都能改善AI整体表现[3][90] - AI与工业革命不同,其增长不受单一要素制约,增加算力可直接提升模型质量、用户数和经济活动,产生强烈的通缩压力[90][96][97] - AI将导致大规模的用工短缺而非失业,通缩压力使人们减少工作时间,同时催生目前难以想象的新岗位和新兴产业[98][99] - 芯片的摊销周期应更为激进,甚至按一年一换的节奏看待,其价值分为覆盖资本支出的部署阶段和覆盖运营成本的持续运行阶段[40][41][43] 地缘政治与能源制约 - AI竞赛存在主场和客场优势,中国在主场依靠政府补贴和能源建设(如计划建设150座核电机组)具备优势,但在客场能效更高的芯片是关键[68][70][74] - 欧洲在AI竞赛中面临落后风险,若无法解决算力基础设施建设(如利用挪威风电等可再生能源),其经济可能沦为旅游经济[74][78][86] - 美国及其盟友通过将算力中心建在能源便宜的地方可获得比中国更多的可用能源,行动速度和对不作为风险的恐惧是其优势[70][74][76] - 算力是AI的基础,而能源是算力的基础,未来竞争的核心在于能源基础设施的建设速度与规模[84][86] 商业模式与未来展望 - AI商业模式不同于SaaS,增加算力投入可直接提升产品质量,导致按量计费成本几乎贴着营收走,形成算力投入与收入的强正反馈[61][90] - 开源模型并不总是更便宜,某些中国模型的运行成本估计比美国模型高出十倍,价格差异源于市场锁定而非实际成本[66][67] - 大模型被视为心智的望远镜,短期让人感到自身渺小,长期将展现智能的广阔前景,未来可能从七巨头演变为九巨头甚至二十巨头[122][123][174] - 推理与训练形成正向循环,推理越多越需要追加训练优化效果,训练越多又需要铺开更多推理摊薄成本,相互促进[89]
AI日报丨富国银行力挺半导体设备牛市,英特尔盘前走高
美股研究社· 2025-10-10 20:53
AI产业整体趋势 - 国内外AI产业进展超预期,商业化与货币化有望加速[4] - AI科技巨头加速算力部署,算力布局在AI产业中占据核心地位[4] - 国内AI产业加速追赶,在模型能力与算力集群部署上均有亮眼表现[4] 算力基础设施投资机会 - 看好国内外光模块、光纤光缆、液冷等算力相关环节的龙头公司[4] - AI算力热浪推动3nm及以下先进制程芯片扩产与先进封装产能扩张[10] - 半导体设备板块长期牛市逻辑坚挺,富国银行看好阿斯麦、应用材料、科磊等设备巨头[11] 芯片与硬件技术进展 - 英特尔公布Panther Lake处理器架构细节,基于18A工艺节点,性能较上一代提升逾50%[5] - Panther Lake集成CPU、GPU及专用AI加速器,AI算力最高可达180 TOPS[5] 主要科技公司动态 - 英伟达领投Reflection AI公司8亿美元,该公司完成20亿美元融资,估值达80亿美元[8] - Reflection AI成立仅一年,估值从3月份的5.45亿美元大幅跃升至80亿美元[8] - 亚马逊云科技推出Agentic AI应用Amazon Quick Suite,可连接企业内部知识库并集成超过1000个应用[6] - Meta旗下Instagram探索开发电视应用,计划进军大屏视频领域与YouTube竞争[9] AI模型与开源生态 - Reflection AI押注开源AI模型,试图打造美国版"DeepSeek"[8] - 公司认为美国存在"DeepSeek形状的空白",需要能与顶级闭源模型竞争的开源模型开发商[8]
算力行业逐渐回归理性?海南华铁36.9亿合同解除的背后
国际金融报· 2025-10-10 20:40
公司这一战略转型,与当时人工智能产业的爆发式发展紧密相关。ChatGPT的横空出世,标志着AI进 入"大模型时代",模型参数规模从千亿级向万亿级跃进,对算力资源的需求呈指数级增长。华经产业研 究院数据显示,2024年我国智能算力规模已达725.3EFLOPS,市场规模约为1479.6亿元,2025年我国智 能算力规模将达到1037.3EFLOPS,市场规模也将攀升至2116.1亿元,同比增长幅度超过43%,未来市场 空间广阔。 10月10日,被市场视为"算力新星"的海南华铁(603300.SH)再度以跌停收盘,报7.84元/股,单日跌幅 9.99%,换手率0.86%。 消息面上,9月30日晚间,海南华铁发布公告称,其全资子公司"华铁大黄蜂"已于近日向合作方杭州X 公司发出《关于解除〈算力服务协议〉的函》。该协议签署于2025年3月,约定由华铁大黄蜂向X公司 提供为期五年的算力服务,合同总金额高达36.9亿元(含税)。公告指出,因协议所涉交易及设备的市 场环境与供需情况发生较大变化,且自签署以来未收到任何采购订单,公司决定解除协议。 据此前公司披露的信息计算,海南华铁此番取消36.9亿元订单后,剩余在手的算力订 ...
光模块需求喷涌 中国企业领跑“新光年”
21世纪经济报道· 2025-10-10 18:03
全球算力需求前景 - 华为报告预测至2035年全球算力总量将激增10万倍,AI存储需求增长500倍[1][2] - 通信网络连接对象将从90亿人扩展到9000亿智能体,实现从移动互联网到智能体互联网的跃迁[2] - 2025年全球AI算力市场规模将达1.2万亿美元,中国占比38%,智能驾驶、工业AI、医疗影像三大场景贡献62%的算力消耗[2] 中国光模块行业竞争格局 - 中国厂商已主导全球光模块中游市场,中际旭创、新易盛市占率跻身全球前三[1][5] - 中际旭创全球市占率稳固在25%-30%区间,在800G放量及1.6T起量的过渡期形成明显交付优势[3] - 头部厂商通过高端产品迭代、海外产能布局与差异化技术路线构建先发优势[3] 主要公司业绩与技术优势 - 中际旭创2025年上半年营收147.89亿元同比增长36.95%,净利润39.95亿元同比增长69.4%,毛利率39.96%[3] - 新易盛2025年上半年营收104.37亿元同比增长282.64%,净利润39.42亿元同比增长355.68%,光模块毛利率达47.48%[4] - 天孚通信2025年上半年营收24.56亿元同比增长57.8%,光有源器件业务增长91%,作为英伟达CPO光引擎独家供应商深度绑定AI算力龙头供应链[4] 光模块技术发展趋势 - 技术沿速率迭代-材料创新-封装突破路径加速演进,800G批量交付方兴未艾,1.6T已迎来规模化前夜[1][6] - 2024年800G光模块出货量同比增长超300%,头部企业已实现1.6T产品批量交付,预计2025年下半年起1.6T产品将逐渐起量[6][7] - CPO技术预计在2026年实现商用,LPO方案使800G模块功耗较传统方案降低30%-50%[9] 技术创新与成本优化 - 华为发布全球首个单波速率1.6T硅光模块,体积缩减70%,功耗降低40%[6] - 天孚通信通过核心器件自研实现封装成本降低30%[4] - 华工正源展出突破3.2T光模块的核心技术产品单波400G光引擎,首次采用国产硅光芯片流片平台[9]
OPENAI发布Sora2,国产算力存力持续看好
东方财富证券· 2025-10-10 17:03
行业投资评级 - 电子行业投资评级为“强于大市”(维持)[2] 核心观点 - 当前时点持续看好算力和存力产业链的整体机会 [2][31] - 国产算力芯片供给侧因国内先进制程良率及产能爬升将有较大幅度改善,需求侧因国内CSP厂商商业化模式明朗、AI资本开支持续向上及国内模型迭代,有望带动训练侧放量需求 [2][31] - 国产存力需求侧因大模型持续推出对DRAM、NAND需求将大幅提升,供给侧因长江存储新产品和长鑫的HBM3等产品突破,叠加数据中心对SSD及HBM需求快速提升造成供需错配,激发长存及长鑫扩产动能,判断明年有望是两存扩产大年 [2][31] - AI商业化各类前置配套需求高速增长,供应链扩产加速,新技术层出不穷,建议继续关注重点海外算力产业链 [5][31] 行情回顾 - 本周(9月29日至9月30日)市场整体上涨,申万电子指数上涨2.78%,在31个申万一级行业中涨幅排名第6 [1][12] - 主要市场指数表现:沪深300指数上涨1.99%,上证指数上涨1.43%,深证成指上涨2.40%,创业板指上涨2.75% [1][12][13] - 年初以来(截至2025年9月30日)申万电子指数累计上涨53.51%,在31个申万一级行业中排名第3 [1][12][13] - 细分板块层面,半导体、消费电子、其他电子、元件、电子化学品和光学光电子本周分别上涨3.57%、2.71%、2.59%、1.92%、1.36%和0.75% [17] - 个股层面,本周申万电子行业340家公司上涨,133家下跌;涨幅前五为江波龙(26.26%)、联芸科技(19.85%)、华虹公司(19.62%)、德明利(18.80%)、香农芯创(17.23%);跌幅前五为深华发A(-12.54%)、显盈科技(-9.78%)、ST宇顺(-9.76%)、蓝黛科技(-9.47%)、新亚电子(-7.01%)[20][21] - 截至2025年10月9日,电子行业估值水平(PE-TTM)为67.72倍,处于历史中部水平 [21][23] 本周关注要点 - OpenAI于9月30日发布旗舰级音视频生成模型Sora 2,其被视为视频领域的“GPT-3.5时刻”,相较于LLM模型,Sora 2对算力和存力需求将大幅提升 [25] - 韩国三星电子与SK海力士已签订意向书,将为OpenAI资料中心供应内存芯片,共同应对Stargate计划日益攀升的需求 [26] - OpenAI与AMD达成战略合作协议,OpenAI将在未来数年内部署总计6吉瓦(GW)的AMD GPU算力,首批1吉瓦芯片于2026年下半年部署;AMD授予OpenAI可购买多达1.6亿股普通股的认股权证,若完全行使,OpenAI可能持有AMD约10%股份;该协议预计为AMD带来数百亿美元收入 [27][28] - 长鑫科技集团股份有限公司(长鑫存储)已披露上市辅导备案,正式启动IPO进程;公司注册资本601.9亿元,无控股股东,国家大基金二期持股9.8%;2024年3月最新一轮融资估值达1508亿元 [28][29] - 韩国和美国DRAM巨头已暂停对企业客户报价一周,预计今年第四季度DRAM报价可能上涨30%以上,部分规格涨幅可能突破50%;未来三季度内DDR4内存供应缺口预计达10-15% [30] 建议关注产业链及公司 - 国产算力产业链:先进工艺制造(中芯国际(港股)、华虹半导体(港股))、国产算力龙头(寒武纪、海光信息、芯原股份)、CoWoS(通富微电、长电科技、甬矽电子)[5][31] - 国产存力产业链:NAND&DRAM半导体相关产业链(中微公司、拓荆科技、安集科技、京仪装备、中科飞测、芯源微)、长鑫&HBM存储芯片相关产业链(北方华创、兆易创新、精智达、上海新阳、雅克科技、百傲化学、德明利、江波龙、香农芯创)[5][31] - 海外算力产业链:PCB有较大增量产能(沪电股份)、PCB扩产带动上游材料需求(生益科技)、机柜方案核心受益标的(工业富联)[5][6][31]
研报掘金丨信达证券:首予东方国信“买入”评级,战略性布局算力领域
格隆汇APP· 2025-10-10 15:13
公司战略与收购 - 公司收购C端算力龙头AutoDL运营商视拓云 [1] - 收购后叠加原有资源,公司或整合形成近4万张GPU卡的算力资源池 [1] - 公司战略性布局算力领域,开辟新赛道,为长期发展奠定基础 [1] 被收购业务概况 - 视拓云运营全国最大C端AI算力云平台AutoDL [1] - 该平台业务规模超过细分市场第2至第10名竞争对手的总和 [1] - 平台服务超70万C端用户和6000多家企业 [1] 技术与资源实力 - 视拓云具备从服务器生产制造、AIDC建设到算力云服务的全产业链能力 [1] - 拥有近3万张、20多个型号的GPU和国产AI加速芯片 [1] - 具备"十万卡"、"万P"级别的算力调度能力 [1] 行业前景与主业 - 公司所处的行业回暖趋势初显,且具备可持续特征 [1] - 运营商IT集中建设或带动公司主业扩张 [1]