Workflow
算力主权
icon
搜索文档
马斯克疯了!1.75 万亿 IPO 前夕官宣自研 GPU,要和英伟达正面硬刚!
搜狐财经· 2026-04-24 17:05
公司战略与计划 - SpaceX计划通过IPO实现1.75万亿美元的估值,并宣布将自主设计制造GPU,正式加入全球算力芯片竞争 [1] - 自研GPU的核心动机是摆脱对英伟达的依赖,解决供应链风险和高昂的“英伟达税”问题,该计划与特斯拉、xAI联合推进的Terafab芯片制造园区深度绑定 [2] - 公司采取“自建+外购”的双线策略,在推进Terafab项目的同时,继续向英伟达、AMD大额采购芯片,并与台积电、三星保持代工合作 [4] 技术规划与目标 - SpaceX明确目标是打造通用型GPU,直接对标英伟达H100、H200系列,而非专用AI加速器(ASIC) [2] - Terafab芯片制造园区选址得州奥斯汀,将整合英特尔14A工艺等先进技术,目标实现2纳米制程全链条自主化,年产能直指1太瓦算力 [2][3] - 特斯拉已推出的AI5芯片算力达2500TOPS,是HW4芯片的5倍,推理成本仅为英伟达同级方案的1/10,为自研GPU积累了技术经验 [2] 市场影响与竞争格局 - 此举旨在打破英伟达在全球AI算力市场的垄断地位,重塑全球AI算力格局,一场围绕“算力主权”的战争正式打响 [1] - 若自研GPU成功量产,将打破英伟达一家独大的局面,降低AI算力成本,推动技术创新,其规划的产能规模足以撼动现有市场格局 [3] - 马斯克的野心是打造“算力帝国”,不仅满足自身生态需求,更有望对外输出,与英伟达、AMD正面竞争 [3] 生态整合与应用 - 自研GPU将全面服务马斯克旗下生态,包括xAI大模型训练、特斯拉FSD与Cybercab、SpaceX星链数据处理、Optimus机器人,构建“芯片 - 模型 - 应用”全栈闭环 [3] - 这一垂直整合策略揭示了算力已成为AI时代的核心战略资源 [4] 挑战与展望 - 自研GPU面临巨大挑战,包括芯片设计、制造、生态构建均需巨额投入,且英伟达已构建深厚壁垒,短期内难以撼动 [3] - SpaceX的跨界突围,将成为影响全球科技产业格局的关键变量,其最终结局取决于技术突破的速度以及平衡野心与风险的智慧 [4]
为什么地缘冲突越烈,阿斯麦反而会越稳?
RockFlow Universe· 2026-03-26 18:31
文章核心观点 - 全球地缘政治动荡(如2026年3月中东局势)非但没有打击半导体设备行业,反而通过强化各国“算力主权”意识、加速本土晶圆厂建设,成为行业增长的催化剂,使半导体设备巨头成为比黄金更具成长属性的避险资产 [5][6][8][9] - 半导体行业正经历从“量的扩张”到“质的跃迁”,2026年作为2纳米制程的量产元年,技术红利集中爆发,推动设备价值量和厂商盈利能力实现阶跃式提升 [12] - 美股半导体设备“三巨头”(ASML、AMAT、KLAC)在“算力军备竞赛”中各自拥有不可替代的垄断地位和确定性增长逻辑,是震荡行情下的核心配置选择 [3][13][36] 地缘政治与行业逻辑重构 - 地缘冲突重构了传统宏观逻辑,AI成为国家级战略资源,刺激美国、欧洲、日本乃至中东(如阿联酋MGX基金)疯狂兴建本土晶圆厂以确保供应链韧性,而采购设备是建厂“占坑”的第一步 [8] - 市场避险资金发生“结构性转移”,半导体设备公司凭借长达18至24个月的在手订单提供了极高的业绩透明度,使其成为具有成长属性的避险资产 [9] - 无论最终哪国在先进制程竞赛中胜出,ASML的光刻机和AMAT的沉积设备都是必须抢购的尖端货,设备巨头成为人类算力进化的“过路费”收取者 [6][8] 技术节点跃迁驱动价值提升 - 2026年是全球半导体进入2纳米制程的量产元年,技术红利集中爆发,台积电、Intel和三星在2纳米工艺上的决战推动了对尖端设备的密集需求 [12] - ASML的高数值孔径(High-NA)EUV光刻机进入密集交付期,单台售价超过3.5亿美元,单位价值量(ASP)的阶跃直接拉升了其毛利中枢 [12][15] - 晶体管架构从FinFET转向GAA(全环绕栅极),制造流程剧变,对原子层沉积(ALD)和选择性刻蚀等精密工艺依赖度大增,使AMAT在每片晶圆上捕捉的价值量相比5纳米时代提升约30% [12] - 工艺越复杂,制造工序的复杂性提升近50%,检测点必须更密集,这显著增加了对过程控制设备的需求,利好检测量测龙头 [27] 半导体设备“三巨头”的确定性逻辑 ASML:光刻垄断者 - 作为全球唯一掌握先进制程入场券的公司,只要人类对尖端芯片的追求不停止,它就是永远的赢家 [3][15] - 截至2026年3月,其在手订单飙升至388亿欧元,足以覆盖全年营收预期的80%以上,提供了极强的确定性 [15] - High-NA EUV光刻机(如Twinscan EXE:5200)是2纳米以下工艺的唯一选择,单台售价高达3.5亿至4亿欧元,几乎是前代产品的两倍,实现了“价格阶跃”和利润的指数级收割 [15] - 庞大的装机量管理(Installed Base Management)业务是其业绩的“压舱石”,2026年相关服务收入预期将突破85亿欧元,带来了类似SaaS公司的经常性收入,对冲硬件销售波动 [16] - 公司已成功从“半导体周期股”转型为“AI基础设施股” [16] 应用材料(AMAT):工艺覆盖与深度绑定 - AMAT的产品线覆盖了晶圆制造约80%的关键步骤,包括ALD、CVD、PVD、离子注入、刻蚀、CMP等,无论哪种芯片路线胜出都无法绕开 [3][18] - 它是全球先进制程研发的底层共建者,与台积电、英特尔、三星的研发实验室“背靠背”工作,其营收增速直接预告了全球半导体资本开支的流向 [18][21] - 在2纳米GAA架构下,AMAT在每片晶圆上捕捉的价值量显著跳升,对材料工程设备的依赖度相比5纳米节点提升了近35% [12][18] - 公司拥有数万台存量设备,服务收入(AGS业务)模式类似“刀片与刀头”,提供稳定的现金流 [19] - 通过先进封装技术成功转型为AI基建的“溢价收割者” [22] 科磊(KLAC):检测领域的隐形冠军 - KLAC作为2纳米时代的“质量审计官”,在检测与量测领域拥有统治力,工艺越难其议价能力越强 [3][25] - 在光学晶圆检测和掩模版检测领域,市场份额超过50%,部分细分领域高达80%,具有极强的先发优势和专利壁垒 [28] - 工艺从2D转向3D结构使检测需求暴增,2纳米节点所需检测次数(如2000次)可能比5纳米节点(1000次)翻倍,其“过程控制强度”成为晶圆厂资本开支中增长最快的部分 [27] - 高良率对先进制程至关重要,KLAC的设备是晶圆厂避免数十亿美金损耗的“保险单”,售卖的是“确定性” [27] - 公司财务表现顶级,过去五个财季非GAAP毛利率维持在62%以上,净利润率接近33%,高毛利源于极强的议价权 [29] 驱动行业突破估值天花板的三大催化剂 - **先进封装与HBM**:2026年,CoWoS等先进封装技术从“选配”变成“标配”,其制造工序越来越像前道,需要大量沉积、刻蚀和CMP工序,为AMAT等前道设备巨头开辟了高毛利的“第二战场”,拉升了综合平均单价(ASP) [31][32] - **美国政策落地**:2026年美国大选后,《芯片法案》进入实质性拨款深水区,消除了政策观望情绪,英特尔、美光等公司的本土建厂计划开始密集安装机台,数千亿美金补贴为设备商订单提供了“保单” [33] - **“主权算力”全球化**:以沙特MGX基金、印度塔塔集团为代表的非传统区域玩家,基于“算力即国力”的认识,开始一步到位采购最先进设备,其增量订单成为设备巨头财报中的最大“惊喜”,对冲了传统市场增长放缓的风险 [34][35]
【太平洋科技-每日观点&资讯】(2026-01-27)
远峰电子· 2026-01-26 20:12
板块行情表现 - TMT板块领涨,其中SW通信线缆及配套上涨4.32%,SW通信应用增值服务上涨3.69%,SW通信网络设备及器件上涨0.51% [1] - TMT板块领跌,其中SW集成电路封测下跌5.97%,SW军工电子Ⅲ下跌5.32%,SW其他通信设备下跌5.06% [1] 国内半导体行业动态 - 富满微发布产品调价通知函,自2026年1月19日起对LED显示屏系列产品在原价格基础上统一上调,调整幅度不低于10% [1] - 康希通信发布公告,其相关子公司未违反美国《1930年关税法》第337节规定,未侵犯Skyworks Solutions, Inc.等公司主张的两项专利权 [1] - 福建晶旭半导体二期项目进入收官阶段,总投资达16.8亿元,将建成全球首条超宽禁带半导体高频滤波芯片生产线,首批产线可实现每年400kk产能,企业产值约10亿元 [1] - 南亚科公告两笔厂务设备取得案,交易对象分别为亚翔与汉科系统,合计金额逾新台币33亿元,标志着其扩产规划已进入施工与系统导入期 [1] 海外半导体与科技产业 - 韩国去年半导体进口总额达775亿美元,较上年增长4.9%,增长归因于人工智能驱动的需求激增,但韩国在高性能系统半导体领域的设计、生产和技术分别依赖美国、中国台湾省和欧洲 [2] - 全球通信运营商正加大对AI基础设施的资本投入,以应对激增的AI计算需求和“算力主权”要求 [2] - 由于CPU阶段性供给缺口、价格调涨及PCB、电池、电源管理IC等零部件成本上行,预估2026年第一季全球笔电出货将季减14.8% [2] - 英特尔晶圆代工展示“厚核心层玻璃基板”设计,采用EMIB进行小芯片互连,锁定高性能运算与AI服务器市场,为业界首个“玻璃基板+EMIB”组合实例 [2] AI技术与应用进展 - 腾讯启动AI助手“元宝”的新功能“元宝派”内测,主打AI社交,可总结聊天、创建兴趣打卡活动并担任“监督员” [3] - MiniMax发布M2-her大型语言模型,专为沉浸式角色扮演、人设驱动的聊天及多轮对话打造,适用于故事创作、虚拟伴侣等场景 [3] - 影眸科技发布新模型Rodin Gen-2 "Edit",针对3D领域修改现有资产,宣称Hyper3D成为首个真正的3D AI生成编辑平台 [3] - 腾讯混元团队发布混元图像3.0图生图模型,总参数量80B,采用混合专家架构,支持图片编辑、多图融合等多样化视觉创作功能 [3] “十五五”前沿产业追踪 - 美国蓝色起源公布大规模卫星通信星座计划“TeraWave”,采用低地球轨道与中地球轨道混合设计,包括5280颗LEO卫星和128颗MEO卫星 [4] - 国内首款深度融合非侵入式脑机接口技术的人形诊疗机器人福小智F1-D亮相,适用于需要全身协调和情景互动的康复场景 [4] - 2025年制造业数智化转型扎实推进,累计建成3.5万余家基础级、8200余家先进级、500余家卓越级、15家领航级智能工厂 [4] - 美的威灵推出新一代高精度关节模组系列产品,为人形机器人提供一站式全套关节解决方案,并可定制化供应无框电机及人形专用减速机方案 [4] 公司业绩预告 - 芯源微2025年预计实现营业收入17.6亿至20.0亿元,同比微增0.36%至14.05%,归母净利润预计为5,200万至7,600万元,同比下降62.53%至74.36% [6] - 艾森股份2025年实现营业收入5.94亿元,同比增长37.54%,归母净利润为5,046.33万元,同比增长50.74% [6] - 思特威2025年预计实现营业收入88亿至92亿元,同比增长47%至54%,归母净利润预计达9.76亿至10.31亿元,同比大幅增长149%至162% [6] - 至纯科技2025年预计实现营业收入30.50亿至32.50亿元,同比下降9.85%至15.40%,归母净利润预计为-4.5亿至-3.0亿元,由盈转亏 [6] 高频数据更新 - 2026年1月26日国际DRAM颗粒现货价格中,DDR5 16Gb (2G×8) eTT盘均价为19.300美元,日涨幅0.52%;DDR4 8Gb (1G×8) 3200盘均价为30.900美元,日涨幅0.65%;DDR3 4Gb 512M×8 1600/1866盘均价为5.148美元,日涨幅2.45% [6] - 2026年1月26日百川盈孚半导体材料价格显示,部分高纯金属材料价格稳定,如6N高纯铟市场均价为3,650元/千克,7N高纯铟市场均价为4,150元/千克 [7] - 晶片衬底价格方面,导电N型6寸P级单晶碳化硅衬底市场均价为5,550元/片,半绝缘6寸P级单晶碳化硅衬底市场均价为10,800元/片 [7]
Anthropic打响“去CUDA”第一枪,210亿美元豪购谷歌100万块TPU
36氪· 2026-01-04 15:29
文章核心观点 - Anthropic凭借其专注编码的Claude Opus 4.5模型展现出卓越的智能编码能力,在AI行业竞争中占据先机,其“少即是多”的战略和自建超算的计划可能标志着AI军备竞赛的拐点 [1][5][6] Claude Opus 4.5的技术实力与市场反响 - Claude Opus 4.5仅用一小时便复现了一个曾让谷歌工程师钻研整年的AI系统 [1] - 借助Opus的智能编码能力,一位科学家早期长达六年的探索工作可被高度浓缩至几个月内完成 [2] - 有开发者在半小时内不写一行代码便构建出一款iOS应用 [27] - 有人在20分钟内打造了类似ESPN风格的应用 [29] - 该模型可根据系统设计指导完成任何要求的编程任务,并被用于接入智能家居系统、分析原始DNA数据等广泛场景 [25][34][36] Anthropic的战略与商业模式 - 公司采取“少即是多”的战略,押注用最少的资源做更多的事,专注于更高质量的训练数据、加强模型推理能力的后训练技术以及让模型跑得更便宜、更容易被大规模采用的现实目标 [5][17] - 公司并非否认规模的重要性,但认为规模不是唯一的杠杆,下一阶段的胜利取决于每一美元算力能交付多少能力 [17][19] - 公司定位为企业优先的模型供应商,Claude的主要收入来源是被嵌入到别人的产品、工作流和内部系统中,这类场景黏性更强、更接近真实生产力 [20][23] - 公司收入已经连续三年实现同比十倍增长,并构建了独特的销售策略,使Claude几乎出现在所有主流云平台上,包括那些同时也在卖自家竞争模型的云厂商 [24] 算力基础设施与供应链布局 - Anthropic计划购买近100万块谷歌TPU v7芯片以自建超算,芯片将从博通直接下单,交易金额或达210亿美元 [6][8][11] - 依据行业推测,TPU v7单价大概在15,000–25,000美元之间 [11] - 该交易结构意味着Anthropic自有超算将不再依赖CUDA生态和云厂商,将算力主权握在手中,这可能导致英伟达丢失300亿美元的潜在大订单 [11][12] - 部署架构为Anthropic持有TPU所有权,基础设施由TeraWulf、Hut8和Cipher Mining提供,现场运维外包给Fluidstack [9] 行业竞争格局与资本动态 - 2026年AI行业演变为“暴力规模与效率”的较量,作为规模派代表的OpenAI投入1.4万亿美元用于算力和基础设施建设 [17] - Anthropic目前已经锁定了约1000亿美元规模的算力承诺 [19] - 谷歌持有Anthropic公司14%的股份,亚马逊向Anthropic追加投资40亿美元,Zoom也持有其部分股权 [39] - 谷歌被传出正在洽谈追加投资Anthropic,新一轮融资或将使Anthropic的估值突破3500亿美元 [40] - 有猜测认为谷歌可能在2026年收购Anthropic,但此举可能因Anthropic的成功及其“安全AI”的标榜而面临挑战,并可能终结当前的AI竞赛格局 [43][46][47]
商汤科技的选择:拥抱AI国产化,做那个「修塔」的人
36氪· 2025-12-18 17:26
文章核心观点 - 商汤科技通过其“大装置-大模型-应用”三位一体战略,全面拥抱国产化,致力于构建和优化国产AI算力生态,推动中国AI产业从依赖进口算力走向自主可控,并已在多模态模型适配、工程化效率提升及商业化落地方面取得关键突破,走出一条长期主义发展道路 [2][4][7][16][27] 市场信心与战略融资 - 商汤科技于12月18日完成由不少于六家机构积极认购的B类股份配售,配售款项将主要用于扩大AIDC“大装置”规模及提高国产化比例,反映了市场对其长期价值的坚定信心 [3] 国产AI产业的关键节点 - 寒武纪于12月15日宣布完成对商汤“日日新”Seko系列多模态模型的“Day 0”级别同步支持,标志着国产算力在高带宽、高并发的多模态场景中实现关键跨越 [3] - 中国AI行业重心已从云端转向算力层的自主可控,AI产业下半场不再是参数规模竞逐,而是回归物理现实与系统级协同 [4][5] - 原生AI企业正成为国产芯片成熟化的“加速器” [4] 国产化挑战与商汤的路径 - AI国产化面临硬件架构不统一导致的“孤岛”与高迁移成本问题 [6] - 商汤科技选择全面拥抱国产化,致力于解决生态“可战性”问题,而非仅死磕芯片制程工艺 [7][9][10] 大装置:国产芯片的练兵场与生态构建者 - 商汤大装置(SenseCore)是一个巨大的异构调度与适配平台,充当国产芯片的“练兵场”和“试飞中心” [8][11] - 其在千亿参数级、超大规模并发的真实业务场景中激发国产芯片潜能,并通过抽象统一软件介质,实现跨异构加速卡的统一训练,为开发者提供标准化接口 [13] - 与国产芯片厂商合作进入深度耦合阶段,构建“多维共生”的算力生态 [14] - 与寒武纪:构建“阶梯式产品创新体系”,实现软硬协同 [14] - 与摩尔线程:形成互补的“技术共生”,满足AIGC视频生成的复合算力需求 [14] - 与沐曦:确立“算力集群+行业拓展”合作,通过大装置提供场景验证,沐曦提供高性价比算力以降低建设成本 [14] - 在国内市场首次完成基于384卡超大规模集群的华为昇腾910C超节点全面适配,通过了工业级标准的严苛考验,意味着国产算力从“可用”走向“好用” [15] 工程化创新与效率提升 - 商汤展示的工程化能力表明,在计算方式和架构创新下,国产算力集群未来有望实现效率反超,获得成本优势 [18][19] - 与记忆张量合作,通过PD(Prefill-Decoding)分离技术的大规模商用落地,使国产GPU的推理性价比提升150% [19] - 在视频生成领域,开源LightX2V推理框架,下载量已突破350万次,该框架支持昇腾910B、海光DCU等主流国产芯片,并通过硬件友好机制将推理性能提升3倍以上 [19] - 商汤Seko系列模型作为行业首个多剧集生成智能体,在视频一致性上取得突破,依托自研技术底座与国产算力的长期磨合 [21] - 通过开源生态将复杂的硬件适配工作封装在底层,使上层应用开发者无需关心芯片差异 [22] 应用落地与商业化验证 - 商汤的产品矩阵涵盖从大装置、日日新多模态模型到端侧应用的全栈生态 [25] - 端侧应用如AI办公应用“小浣熊”和AI数字人生成平台“如影”均已完成国产芯片适配,并实现高效运行,打破了“国产算力难以在终端普及”的认知 [26] - 在城市管理、金融、医疗等对数据主权敏感的领域,商汤提供全栈国产化私有化部署方案,解决了高性能、便捷性、自主可控的“不可能三角”问题,并已实现全面适配与正式交付 [27] - 基于国产算力和国产大模型的解决方案已从技术验证走向真正的商业化 [27]
坤元资产FOF生态伙伴再启“芯”潮 收获科创板最赚钱新股沐曦股份
财富在线· 2025-12-17 17:15
沐曦股份科创板上市表现 - 公司于2025年12月17日在科创板上市,成为A股第二家国产GPU领军企业 [1] - 上市首日开盘价700元,高开568.83%,收盘涨幅达692.95%,市值突破3320亿元人民币 [1] - 按盘中最高价计算,单签盈利近40万元,成为近10年来最赚钱新股 [1] 政策与行业宏观背景 - 中央经济工作会议明确提出“深化拓展‘人工智能+’”与“完善人工智能治理”并行的双轨部署,政策转向系统性产业赋能 [2] - 2025年中国智能算力规模预计达1037.3 EFLOPS,增长43% [5] - 预计到2028年,中国智能算力规模将达2782 EFLOPS,未来五年复合增长率超过40% [5] 国产GPU行业意义与公司战略 - 沐曦股份与摩尔线程被视为国产GPU“双子星”,其上市暴涨反映了资本市场对中国“算力安全”的信任 [3] - 公司坚持自主研发,致力于实现从指令集架构到软件生态的全流程自主可控 [3] - 上市募集资金将投入新型高性能通用GPU、新一代AI推理GPU及前沿高性能GPU技术研发三大项目 [5] 坤元资产的生态布局 - 坤元资产已完成“全栈式”布局,精准卡位算力、算法、应用三大核心要素 [2] - 生态圈内除沐曦股份外,还包括冲击“中国AI第一股”的智谱AI,以及人形机器人公司宇树科技 [2] - 早在2023年布局沐曦股份,是基于对底层算力需求是“确定性锚点”的洞察 [5] 大模型领域进展(智谱AI) - 智谱AI估值已超400亿元人民币,正冲刺“AI第一股” [6] - 其GLM-4.5及GLM-4.6模型在权威基准测试中稳居全球第一梯队,与OpenAI分庭抗礼 [6] - 面向开发者的软件工具和模型业务年度经常性收入已突破1.4亿元人民币 [7] - 2024年总收入达4200万美元,预计2025年销售额将实现翻倍增长 [7] 人形机器人领域进展(宇树科技) - 宇树科技已提交IPO辅导报告,计划募集30亿元用于扩建人形机器人生产线,距离“具身智能第一股”仅一步之遥 [8] - 公司2025年营收预计突破10亿元人民币 [9] - 其人形机器人G1售价为9.9万元人民币,累计交付量超1500台,订单总额超5亿元 [9] - 公司走高性能、低成本、量产化的“中国特色”道路,致力于让通用人形机器人进入工厂替代人力 [8]
鹏城实验室主任高文:“中国算力网”是争夺“算力主权”的关键基础设施
新浪证券· 2025-11-28 17:51
大湾区交易所科技大会概况 - 2025年大湾区交易所科技大会于11月28日至29日举行,主题为“迈向人工智能+时代” [1] - 大会由深圳证券交易所联合香港交易所、广州期货交易所共同举办 [1] - 鹏城实验室主任、北京大学博雅讲席教授高文出席并发表主题演讲 [1] 中国算力网计划 - “中国算力网”研究计划的初衷源于国家发展和改革委员会的“东数西算”工程 [3] - “东数西算”工程旨在结合西部丰富的能源优势与东部密集的计算需求,实现全国算力资源优化配置 [3] - 加快建设“中国算力网”是保障国家在数字时代拥有“算力主权”的关键举措 [3] 国际竞争背景 - 美国正在布局“星际之门计划”、“创世纪任务”等国家级战略工程 [3] - 美国相关工程的意图被描述为建立全球性的“算力霸权” [3] - 发展“中国算力网”被视为避免在未来竞争中受制于人的需要 [3]
一个月市值蒸发5万亿元 英伟达遭遇谷歌自研芯片冲击波
21世纪经济报道· 2025-11-28 07:25
AI芯片市场竞争格局变化 - 谷歌加速自研AI芯片TPU商业化步伐,正与Meta等科技公司洽谈外部采购合作,若合作落地TPU将进入谷歌体系外超大规模数据中心,可能冲击英伟达GPU主导的算力市场[1] - 谷歌推动TPU走向外部客户,Meta考虑从2027年开始在数据中心部署谷歌TPU,并可能最早于2025年通过Google Cloud租用TPU容量,潜在合同金额或达数十亿美元[4] - 全球科技巨头普遍加速自研AI芯片争夺算力主权,从训练到推理、从通用模型到专业应用,企业将掌握自有算力视为下一阶段竞争力关键[6] 英伟达市场反应与应对策略 - 谷歌TPU商业化消息导致英伟达股价震荡,周二美股早盘一度下滑7%,最终收跌约2.6%,自10月29日以来市值从5.03万亿美元跌至4.32万亿美元,缩水超7000亿美元[1] - 英伟达正面回应竞争,强调继续向谷歌供货,自称"领先行业整整一代",是唯一能运行所有AI模型并在所有计算场景中部署的平台[1] - 英伟达创始人黄仁勋指出AI ASIC企业虽多但极少有产品能真正投入生产,强调加速计算技术栈异常复杂[7] 技术路线与市场趋势演变 - 业内观点认为随着AI训练与推理负载增长和多元化,未来更可能呈现ASIC、GPU异构部署,而非单一架构一统天下[2] - 行业正从GPU单线制向多架构、多供应商异构化体系演进,Anthropic同时采用英伟达Blackwell、Rubin系统和谷歌Ironwood TPU,体现"多路线并行"采购趋势[7] - AI基础设施行业从单一硬件竞争转向系统级竞争,随着软件框架、模型体系、能效变化,AI芯片格局持续演变[8] 谷歌TPU发展现状 - 谷歌TPU研发始于2013年,与谷歌云服务紧密结合,最新一代为TPU v7(Ironwood),最近迭代出Gemini 3[4] - 谷歌通过模型和硬件耦合方式强化大模型时代技术闭环,Gemini 3已大量使用TPU完成训练和推理,为TPU商业化提供更强验证场景[4] - 谷歌表示自家定制TPU和英伟达GPU需求都在加速增长,谷歌依然采购英伟达GPU[5] 竞争对手动态 - AWS持续迭代Graviton、Trainium、Inferentia系列自研芯片,势头凶猛,微软在发布自研AI芯片Maia系列后新芯片计划有所推迟[7] - 中国市场后起之秀如华为昇腾、寒武纪、百度昆仑芯等正在快速推进[7] - TPU、Gaudi、Trainium等ASIC芯片往往根据特定框架或任务场景,在特定负载上取得极高效率[5]
英伟达市值一个月内蒸发5万亿元
21世纪经济报道· 2025-11-26 21:05
AI芯片市场竞争格局变化 - 谷歌正加速自研AI芯片TPU的商业化步伐,并与Meta等科技巨头洽谈外部采购合作,潜在合同金额或达数十亿美元[2][6] - 若合作落地,谷歌TPU将进入其体系外的超大规模数据中心,可能对英伟达GPU主导的算力市场构成冲击[2] - 英伟达股价受此消息影响出现震荡,周二美股早盘一度下滑7%,最终收跌约2.6%[2] - 自10月29日至11月25日,英伟达市值从5.03万亿美元跌至4.32万亿美元,不到一个月缩水超过7000亿美元(约合人民币5万亿元)[2] 英伟达的回应与市场地位 - 英伟达公开回应竞争,强调其技术"领先行业整整一代",是唯一能运行所有AI模型并在所有计算场景中部署的平台[4] - 公司表示与谷歌的合作稳定且持续,将继续向谷歌供货[4] - 英伟达目前在AI芯片市场占据超过90%的份额[6] - 尽管面临竞争,谷歌自身也表示对定制TPU和英伟达GPU的需求都在加速增长[4] 行业技术发展趋势 - 随着AI训练与推理负载增长和高度多元化,未来更可能呈现ASIC、GPU异构部署的格局,而非单一架构主导[4][9] - 大型AI公司如Anthropic采取"多路线并行"采购策略,同时采购英伟达和谷歌的芯片,以保持算力供应链多元化[9] - AI基础设施行业正从单一硬件竞争转向系统级竞争,涉及软件框架、模型体系、能效等多方面演变[10] 全球科技巨头自研芯片动态 - 除谷歌外,AWS持续迭代Graviton、Trainium、Inferentia系列自研芯片,微软也发布了自研AI芯片Maia系列[9] - 中国市场上,华为昇腾、寒武纪、百度昆仑芯等厂商正在快速推进[9] - 自研芯片成为科技巨头降低能耗、控制成本的关键路径,特别是在大模型训练成本几何级上升的背景下[6]
AI基建赛道灼热
21世纪经济报道· 2025-11-14 07:20
行业投资趋势 - 人工智能竞争焦点转向基础设施,巨额资本正以前所未有的规模投向算力基石 [1] - 摩根大通预计全球AI和数据中心基础设施投资规模将达到5万亿美元 [1][5] - 头部AI公司和科技巨头均在疯狂押注算力基建,投资规模巨大,例如OpenAI计划未来8年投入约1.4万亿美元,Meta计划未来三年在美国投资6000亿美元 [1][4] Anthropic公司动态 - Anthropic宣布将投入500亿美元建设全美人工智能基础设施网络,首批数据中心选址得克萨斯州与纽约州 [1] - 此次500亿美元投资是与英国AI云平台企业Fluidstack合作进行 [3] - 公司业务增长强劲,目前服务超30万家企业客户,其中年贡献额超10万美元的大客户数量过去一年激增近7倍 [4] - 公司有望在2028年实现盈亏平衡,远快于其竞争对手OpenAI [4] - 此前已获得大型基础设施支持,包括亚马逊在印第安纳州为其建成的投资110亿美元、占地1200英亩的数据中心园区,以及与谷歌达成的数百亿美元算力合作协议 [3] 科技巨头资本开支 - 在第三季度财报电话会上,亚马逊、微软、Meta等均表示将继续投资AI [1][4] - 亚马逊预计2025年总投入1250亿美元 [4] - 谷歌将2025年资本支出上调至910亿至930亿美元 [4] - Meta预计2025年资本支出为700亿至720亿美元,几乎是去年的两倍 [4] - 微软上季度投入创纪录的349亿美元,并宣布下一财年将投入1000亿美元 [4] 投资驱动因素与行业观点 - 巨额投资指向同一目标:争夺算力主权 [1] - 诺贝尔经济学奖得主迈克尔·斯宾塞指出,在战略竞争背景下,投资不足的代价远高于投资过度 [1] - 科技企业若在AI竞赛中落后两三步,就可能被淘汰出局 [1] - 微软CFO表示,尽管已投入数百亿美元,仍难以满足当前对AI及其他服务的需求 [7] - OpenAI发言人指出,当前人工智能的需求已超过现有计算资源的供给能力 [7] 面临的挑战与瓶颈 - 电力保障是主要瓶颈,AI训练集群需数百兆瓦甚至吉瓦级电力,但输电线路建设周期远长于数据中心 [6] - 微软CEO坦言面临“不缺AI芯片但缺电力”的局面,大量已采购的GPU因电力问题闲置 [6] - 摩根士丹利警告,到2028年美国可能因AI数据中心消耗大量电力而面临高达20%的电力缺口,潜在缺口达13至44吉瓦 [6] - 科技巨头资本开支增速远超收入增速,引发投资者对盈利路径的担忧,例如Meta公布财报后股价大跌逾11% [6]