Workflow
百度昆仑芯
icon
搜索文档
国产AI芯片看两个指标:模型覆盖+集群规模能力 | 百度智能云王雁鹏@MEET2026
量子位· 2025-12-18 10:34
编辑部 整理自 MEET2026 量子位 | 公众号 QbitAI 当国产AI芯片接连发布、估值高涨之际,一个尖锐的问题依然悬在头顶:它们真的能撑起下一代万卡集群与万亿参数模型的训练吗? 一边是市场对替代方案的迫切期待,另一边是英伟达在利润与估值上仍高歌猛进…… 百度智能云 A I计算首席 科 学家王雁鹏 在量子位MEET2026智能未来大会上,基于百度昆仑芯在大规模生产环境中的实战经验指出: 评判芯片实力的标准已从单纯的算力数值,转向了能否稳定支撑从百亿到万亿参数、从稠密模型到MoE架构、从单模态到多模态的完整模型谱 系训练,并能在万卡乃至更大规模集群上实现高效扩展。 在演讲中,王雁鹏系统拆解了大规模训练中集群稳定性、线性扩展与模型生态三大核心挑战的攻坚路径,并回应了行业对MoE时代硬件路径的 关切。 他认为,即便是参数激增的MoE模型,"小芯片搭大集群"的路径依然可行,其关键在于极致的通信优化与系统级协同设计。 为完整呈现王雁鹏的思考,在不改变原意的基础上,量子位对演讲内容进行了整理编辑,希望能给你带来更多启发。 MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众 ...
2026年海外&互联网&传媒行业年度策略报告:恒生科技:再出发,奔赴山海-20251212
财通证券· 2025-12-12 19:14
报告行业投资评级 * 报告未明确给出恒生科技指数的整体投资评级,但指出其已进入“慢牛通道”[7],并强调应自下而上寻找“安全边际高+基本面边际变化预期向好”的个股机会[29] 报告的核心观点 * 恒生科技指数在2025年表现强劲,上涨24%,跑赢上证指数(18%)和纳斯达克100(16%),业绩增长是核心驱动力,贡献了约60%的市值涨幅[10][16] * 展望2026年,投资机会的把握要点在于:从分子端(EPS)入手寻找相对确定的机会,并密切关注AI进展是否超预期以寻找弹性[27][29] * 分母端(流动性)已进入中期宽松趋势,美联储自2024年9月进入降息通道,为估值提供支撑[22][29] * 个股层面,2025年涨幅居前的公司(如华虹半导体涨260%、京东健康涨142%)核心驱动力在于业绩上调、自主可控预期及AI进展超预期[23] 根据相关目录分别进行总结 回顾与复盘:2025年发生了什么? * **指数走势与驱动因素**:恒生科技指数2025年初至今(截至11月21日)上涨24%,业绩增长贡献了约60%的市值涨幅[10][16]。剔除受外卖大战影响的阿里、美团、京东后,指数收入同比增长13.6%,非公认会计准则净利润增长21.7%[10][16] * **季度行情复盘**:一季度受AI主题和流动性改善驱动,指数上涨约30%[12]。二季度受外卖大战(阿里宣布投入500亿元)和中美贸易环境趋紧影响出现回调[12]。三季度在政策预期转向、中美关系缓和及龙头业绩超预期推动下重拾升势[12]。四季度初因涨幅过大、估值偏高及对AI泡沫的担忧出现约20%的技术性回调[12] * **分母端(流动性)环境**:美联储已从2024年9月进入降息通道,南向资金大幅流入,市场流动性短期偏多[20][22]。恒生科技指数过去5年估值分位数在22%附近,短期偏多[20] * **个股表现启示**:业绩能被不断上修的公司股价涨幅更好,如京东健康(涨142%)、腾讯音乐(涨68%)、腾讯控股(涨50%)[17][18]。寻找短期或长期业绩预期差、或AI进展可能有惊喜的标的是核心任务[23] 产业与趋势:哪些细分赛道值得关注? * **AI应用**: * **技术进展**:中美前沿模型差距已缩小至季度级别,DeepSeek R1在关键基准上对齐OpenAI o1[37][39]。多模态生成能力稳步提升,谷歌Nano Banana Pro和Veo-3.1分别代表图像与视频方向的前沿落点[45] * **商业化与成本**:模型API均价持续下调,前沿全量模型现价处于约4美元/百万Tokens位置[47][52]。Token周度调用量达6T,较去年末提升20倍,推理需求旺盛[49][52] * **市场行情**:板块行情对情绪敏感,年初由DeepSeek R1发布驱动重估,下半年受“AI吞噬软件”叙事影响,资金转向算力板块,应用板块β有所钝化[53][55][77] * **细分场景**: * **原生应用**:Chatbot年化收入增速远高于流量增速,OpenAI年化经常性收入于2025年6月达到100亿美元,较2024年12月接近翻倍[59]。文生图/视频头部应用商业化加速,MidJourney年化经常性收入达5亿美元,快手可灵年化经常性收入超过1亿美元[62][63] * **创意设计**:AI冲击本质是生成与编辑壁垒的赛跑,传统软件厂商通过接入模型并强化编辑闭环来应对[67] * **搜索**:AI搜索可能减少广告位与点击率,短期对传统搜索广告收入造成负面影响,长期影响取决于流量变化与新的计费体系[72] * **企业服务**:越靠近前台、流程闭环短的AI应用商业化进展更快,如北森AI招聘产品新签合同额超2600万元;中后台ERP场景的AI落地更偏向推动客户增购,如金蝶AI合同金额超1.5亿元[75][76] * **自主可控(硬科技)**: * **核心方向**:下一阶段科技自立围绕芯片、消费电子、具身智能展开[80][81] * **AI芯片**:国产芯片正加速在稀疏计算、支持FP8计算及提升算力密度(如Chiplet)等方面寻求突破[83][84]。国内科技大厂(阿里、百度、字节、腾讯)积极自研芯片,旨在打破依赖、降本增效并巩固生态[86][88] * **云计算**:作为AI落地载体,2024年中国AI公有云市场规模达196亿元,同比增长55%,百度、阿里、腾讯、华为云占据领先份额[90][91] * **市场与投资逻辑**:芯片代工(如中芯国际、华虹半导体)因需求确定性和稀缺性,2025年涨幅明显[93][94]。投资应围绕核心技术优势、国产替代紧迫性及供应链地位展开[94] * **游戏**: * **行业环境**:2025年游戏版号保持稳定发放,截至10月总量达1441个,已超越2024年全年[101][104]。高抽成渠道模式受到挑战,头部厂商凭借强势产品争取到更低分成,如腾讯与华为的分成比例降至10%-20%[103][104] * **国内市场**:腾讯游戏占据主导地位,iOS流水TOP10中占7席[105][107]。腾讯、网易通过“平台化”、“轻量化”策略运营长青游戏,如《王者荣耀》打造IP宇宙,《蛋仔派对》创作者超5000万[109]。中小厂商通过深耕细分品类取得成功,如巨人网络的《超自然行动组》(女性向搜打撤玩法)和吉比特的《杖剑传说》(放置+MMO)[113] * **海外市场**:SLG和休闲类游戏主导,世纪华通旗下《Whiteout Survival》流水达10.3亿美元(增30%),其新作《Kingshot》登顶2025年海外流水增量榜(增量4.2亿美元)[118][119]。柠檬微趣的二合游戏《Gossip Harbor》流水达5.5亿美元,同比增长201%[118][119] * **端游市场**:在《三角洲行动》、《燕云十六声》等双端互通产品推动下,2025年客户端游戏市场收入增速持续提升,10月收入达72.27亿元,同比增长29.4%[125][126] * **消费互联网**:报告目录提及,但提供内容中未展开详细分析[33] * **智驾赛道**:报告目录提及,但提供内容中未展开详细分析[33] * **内容+IP**:报告目录提及,但提供内容中未展开详细分析[33]
解读:特朗普突批H200入华,抽成25%背后的大棋局
美国对华AI芯片出口政策转向 - 2025年12月8日,美国总统特朗普宣布批准英伟达向中国出口H200人工智能芯片,但要求从每笔销售中抽取25%的分成[1] - 此举与一周前美国国会讨论全面禁止对华出口高端AI芯片的《SAFE法案》形成180度大转弯[1] - 政策转向源于12月2日英伟达CEO黄仁勋与特朗普政府的闭门会谈,旨在挽救英伟达在中国市场的颓势[4] 政策方案的具体设计 - 选择性放行:仅开放技术代差约为18个月的H200芯片,而非最新的Blackwell或即将发布的Rubin芯片[4] - 高额抽成:英伟达需将H200对华销售额的25%上缴美国政府,且此模式将推广至AMD、英特尔等其他AI芯片企业[5] - 条件限制:反复强调出口前提是“保障美国国家安全”,并保留随时收回许可的权力[5] 政策背后的商业算计 - 美国政府预计每季度可从价值20亿至50亿美元的芯片出口中,按保守估计获利5亿美元,全年达20亿美元,被视为“无本万利”的生意[6] - 对英伟达而言,虽然利润被压缩,但相比因出口禁令导致在华销售额几乎停滞、并减记约55亿美元相关费用的局面,恢复部分市场准入仍具吸引力[4][7] - 该政策被解读为一种“利益捆绑机制”,使英伟达与美国政府成为利益共同体,以确保出口政策的持续性[7] 中国AI芯片产业的崛起态势 - 根据Bernstein Research报告,到2026年,华为将占据中国AI芯片市场50%的份额,而英伟达的份额将从目前的39%大幅萎缩至仅8%[13] - 2025年,华为AI芯片市场份额已冲至40%,与英伟达并列第一;预计2026年华为占50%,AMD占12%,寒武纪占9%[15] - 未来三年,中国本土AI芯片销售额的复合年增长率预计高达74%,到2028年本土产量将超过国内需求,供需比达104%[16] 本土厂商的技术进展与产能规划 - 华为昇腾系列持续迭代,并公布了未来三年的产品路线图[16] - 寒武纪构建了完整的云边端产品矩阵,并宣布2026年将把AI加速器产量提升逾两倍至50万枚[16] - 百度昆仑芯新一代产品在性能和成本上实现大幅改善[17] - 海光在GPU通用计算领域持续发力,逐步打破英伟达在某些场景的垄断[18] 中国市场对美政策的冷静反应 - 中国市场对H200芯片的态度并不热情,主因在于美国政策反复无常导致信任破裂,企业更看重算力供应的稳定性[31][32] - H200需承担25%额外成本,其综合性价比可能与采购多张国产芯片相当,而国产芯片的成长空间更大[33] - 政策导向鼓励优先采购国产算力,且中国企业已在国产芯片生态上投入大量研发资源,转换成本高[36][37] - 安全隐患(如“后门”或远程“断供”风险)以及中兴事件的教训,使得中国企业在选择核心技术供应商时格外谨慎[34][35] 政策逻辑的悖论与战略影响 - 以25%分成来化解所谓的“国家安全”威胁,暴露了该政策本质是商业利益问题而非安全问题[20] - 与拜登政府“一刀切”封锁不同,特朗普政府的“收保护费”式放行是试图通过“技术代差+高额抽成”维持市场影响力和科技霸权[22][23] - 外部封锁反而成为中国技术突破的催化剂,加速了中国的技术自主化进程和全球半导体供应链的“去美国化”趋势[24][25][40] 全球产业格局与多方博弈结果 - 英伟达并未真正获胜:长期市场份额面临灾难性下滑(从39%至8%),利润空间被压缩,且无法摆脱政治风险[38] - 美国政府也未获胜:短期获利无法弥补长期战略失误,其政策加速了全球对美技术依赖的警惕和各国的自主半导体计划[39][40] - 对中国而言,进口H200可短期缓解算力短缺,但若因此放松自主研发则将陷入“技术依赖陷阱”;真正的胜利在于实现自主技术创新[42][43][44]
AI周报|摩尔线程上市首日股价涨4倍;DeepSeek推出两款新模型
第一财经· 2025-12-07 09:35
国产GPU公司摩尔线程上市表现 - 摩尔线程于12月5日在科创板上市,首日收盘价600.5元/股,较发行价114.28元/股上涨425.46% [1][2] - 公司上市首日市值达到2823亿元,投资者中一签可盈利24万元 [1][2] - 公司主要从事GPU及相关产品的研发、设计和销售,面向AI、云与数据中心、高性能渲染和视频加速场景 [2] - 按发行价计算,公司上市时总市值为537.15亿元,对应的2024年摊薄后静态市销率为122.51倍,高于同行业可比公司平均水平111.23倍 [2] AI大模型竞争与发布动态 - DeepSeek于12月1日上线两款新模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,新模型在推理能力上全球领先 [3] - DeepSeek-V3.2-Speciale在多个推理基准测试中超越谷歌最先进的Gemini3 Pro [3] - OpenAI CEO于12月3日宣布拉响“红色警报”,调配更多内部资源以加速改进ChatGPT,同时延迟其他项目推进 [5] - 有消息称OpenAI将于下周发布GPT‑5.2,与谷歌的最新大模型Gemini 3竞争 [5] - 米哈游联合创始人蔡浩宇创立的AI公司Anuttacon发布AI聊天大模型AnuNeko,被称作“游戏版 ChatGPT” [12] AI芯片与算力产业链动态 - 有消息称百度昆仑芯已启动在香港上市的筹备工作,计划最早于2026年一季度递交上市申请,目标2027年初完成IPO [6] - 百度昆仑芯第三代产品P800系列累计部署数万片,单集群规模超过三万卡,百度内部绝大多数推理任务跑在P800上 [7] - 联想于12月5日公布“AI工厂”解决方案、高端大模型训练AI服务器及升级万全异构智算平台4.0 [8] - 联想在千卡训练场景中将MFU从30%提升至60%,全速运转满血版DeepSeek R1模型极限吞吐量超12,000 Tokens/s [8] - 亚马逊于12月2日推出定制AI芯片Trainium3,其运算速度是上一代芯片的四倍 [15] - 与使用同等GPU的系统相比,Trainium3可将训练和操作AI模型的成本降低多达50% [15] 行业合作与战略投资 - 字节豆包与中兴通讯合作发布首款“豆包AI手机”努比亚M153,该机型售价3499元,具备视觉感知、长期记忆及操作手机能力 [4] - 发布后第二天,中兴商城显示努比亚M153已售罄 [4] - 英伟达CFO于12月2日表示,未来OpenAI希望专注于直接与英伟达合作构建计算基础设施 [9] - Anthropic考虑未来与英伟达直接达成1吉瓦算力的合作 [9] - 英伟达每个季度收入中50%或以上来自大型云服务厂商,但大模型厂商希望对算力有更强把控,客户结构可能改变 [9] - 英伟达于12月1日宣布以约20亿美元认购新思科技普通股,持股比例约2.6%,成为其第七大股东 [11] 行业趋势与市场观点 - 瑞银证券报告认为,现阶段中国出现AI泡沫的可能性不大,因国内循环融资有限且资本支出较为审慎 [10] - 国内领先的AI大模型开发商由母公司内部现金流提供资金,中国互联网龙头以务实态度开展AI投资,注重ROI和运营效率 [10] - 美光科技于12月3日宣布退出Crucial消费级业务,以更专注于为AI场景提供存储产品 [14] - 用于数据中心的存储产品热销导致存储缺货及涨价,云服务厂商对存储涨价的态度较为宽容 [14]
国泰海通|AI应用· 合集
大模型技术突破 - 谷歌Gemini 3发布,在推理、多模态、代码生成等核心能力上实现断层式领先,在Humanity's Last Exam中得分从Gemini 2.5 Pro的21.6%跃升至37.5%(无工具),在ARC-AGI-2中以31.1%的成绩超越GPT-5.1(17.6%)近一倍[8] - Gemini 3采用稀疏MoE的全新设计,支持百万级token上下文长度,工具使用能力较前代提升30%,并推出生成式UI与智能体平台Antigravity[9][10] - DeepSeek R1的发布助推通用模型推理能力跃迁和成本锐减,并实现模型开源,成为金融机构本地化部署AI的行业拐点[13] AI应用生态加速 - 阿里巴巴基于Qwen模型推出个人AI助手"千问App",全面对标ChatGPT,并计划推出国际版,加入全球AI应用顶级竞赛[5][17][28] - 国务院办公厅印发《关于加快场景培育和开放推动新场景大规模应用的实施意见》,要求2027年新一代智能终端、智能体等应用普及率超70%,2030年应用普及率超90%[5] - OpenAI正式发布视频生成模型Sora 2,支持10秒沉浸式内容生成,Sora 2 Pro生成时长提升到15秒,同时推出Sora App打造AI驱动的短视频社区[42] 算力基础设施发展 - 英伟达推出下一代Vera Rubin超级芯片,其FP4推理算力达3.6 Exaflops,较前代提升3.3倍,计划在2027年推出性能再提升14倍的Rubin Ultra[21] - 英伟达与韩国政府及主要企业达成协议,将供应高达26万块基于Blackwell架构的GPU,将韩国AI算力总规模推升至30万块GPU以上[22] - 百度发布新一代自研AI芯片昆仑芯M100和M300,以及天池256与天池512超节点,其中天池512超节点单节点即可完成万亿参数模型训练[18] 金融AI应用落地 - 金融行业作为典型的数据、信息、决策密集型产业,数智化转型需求与大模型技术特性高度契合,AI应用已在各类金融机构的核心业务领域及中后台场景中加速渗透[13] - 2024年以来金融行业大模型相关招投标已开始明显加速,AI与金融结合主要有通用模型结合金融语料训练和开发金融垂类大模型两条技术路径[14] - 华泰证券推出AI涨乐,九方智投推出AI股票机,中金财富升级"投顾平台+数字化平台+APP"铁三角,百融云创与湖北消金联合推出贷后语音质检"硅基员工"[52] 政务AI应用推进 - 中央网信办、国家发改委联合印发《政务领域人工智能大模型部署应用指引》,为各级政务部门提供人工智能大模型部署应用的工作导向和基本参照[24] - 指引提出四类高频场景:政务服务类、社会治理类、机关办公类和辅助决策类,要求加强政务领域人工智能大模型部署应用经费保障[25] - 2024年中国AI+政务服务市场整体规模达25.4亿元人民币,随着指引要求推进,AI政务应用市场空间广阔[25] 产业资本动态 - 阿里巴巴公布3800亿元投入AI基础设施,百度创始人李彦宏指出AI应用能创造比芯片高100倍的价值[17][18] - OpenAI完成架构重组且筹备IPO,估值或达1万亿美元,xAI筹得100亿美元,英伟达计划投1000亿美元与OpenAI共建10吉瓦算力基建[51][56] - 摩尔线程智能科技科创板IPO注册申请正式获批,成为AI GPU领域首家登陆科创板的企业,计划募资80亿元投向新一代自主可控AI训推一体芯片研发[22]
百度Q3营收312亿,AI增长缓解传统业务压力
36氪· 2025-11-19 08:30
AI业务成为核心增长引擎 - 公司首次披露AI业务收入,三大类别合计96亿元,同比增长逾50% [1] - 智能云基础设施收入42亿元,同比增长33% [1][9] - AI应用收入26亿元,同比增长6% [1][9] - AI原生营销服务收入28亿元,同比增长262%,为增长最快板块 [1][9] 自动驾驶业务(萝卜快跑)加速商业化 - 第三季度全球出行服务次数达310万,同比增长212%,增速较二季度的148%持续加速 [1] - 截至11月,累计全球出行服务次数超1700万,覆盖全球22座城市 [1] - 全无人驾驶里程突破1.4亿公里,自动驾驶总里程超2.4亿公里 [1] - 前三季度订单量是“国内最接近的竞争对手的15倍之多”,所有服务均实现全程无安全员驾驶 [3] - 公司预计明年将有更多城市的Robotaxi业务实现正向单位经济效益 [3] 全球化扩张战略与合作伙伴关系 - 下半年出海速度加快,已进入全球22座城市,在欧洲、中东及中国香港市场取得重大进展 [3][4][6] - 7月与Uber合作,瞄准北美及以外市场 [6] - 8月与Lyft合作,计划明年落地英国、德国,并在欧洲部署数千台无人驾驶汽车 [6] - 9月在迪拜获得测试许可,建立中东首支规模化测试车队 [6] - 10月与瑞士邮政合作,计划2025年12月启动测试,最晚于2027年第一季度实现完全无人驾驶运营 [6] - 11月在阿布扎比获得全无人驾驶商业化运营许可,建成当地最大规模运营车队 [6] 传统核心业务面临压力 - 第三季度公司总营收312亿元,同比下降7% [11] - 核心业务营收247亿元,同比下降7% [11] - 在线营销营收153亿元,同比下降18% [12] - 非在线营销营收93亿元,同比增长21%,增长主要由智能云业务推动 [12] 盈利能力与成本结构变化 - 归属百度的净利润为亏损112.32亿元,上年同期为盈利76.32亿元 [14] - 非美国通用会计准则下归属于百度的净利润为38亿元,同比下降36% [12][14] - 营收成本183亿元,同比增长12%,主要因智能云相关成本增加 [13] - 公司计提长期资产减值162亿元,以优化资产结构适配高端AI需求 [15] 技术投入与未来展望 - 自文心大模型推出以来,公司在人工智能领域累计投入已超1000亿元 [16] - 新一代AI芯片昆仑芯M100预计2026年初上市,M300计划于2027年初推出 [11] - 天池256超节点与天池512超节点将于明年上市,单个天池512超节点能完成万亿参数模型训练 [11] - 公司认为第三季度是利润率的阶段性低点,明年非公认会计准则下的营业利润和利润率有望改善 [17]
利空,全球股市跳水!瑞银、大摩,唱多中国股市
搜狐财经· 2025-11-18 23:12
全球市场波动原因 - 全球股市遭遇大幅下跌,日经225指数收跌3.22%至49000点下方,创四月以来最大单日跌幅,韩国KOSPI指数收跌3.32% [1] - 避险资产价格同步回落,比特币七个月来首次跌破9万美元,黄金白银价格亦跳水 [2] - 市场波动主要受三大因素驱动:美联储降息预期降温、日本国债遭遇大幅抛售、以及市场对AI泡沫的担忧 [4][5][7] - 美联储12月降息25个基点的概率已降至不足50%,市场关注即将公布的10月FOMC会议纪要 [4] - 日本10年期国债收益率一度攀升至1.75%以上,接近2008年以来最高水平,其3.7万亿美元净对外资产及7.8万亿美元国债市场规模对全球流动性产生重大影响 [5][6] - 投资者在英伟达三季报公布前态度谨慎,部分资金流出科技股以规避风险 [8][10] 外资机构对中国股市展望 - 瑞银预计中国股市将迎来又一个丰年,MSCI中国指数明年末目标位为100,较当前有14%的上涨空间 [10] - 驱动因素包括创新领域发展,瑞银预计中国公司2026年每股收益将增长10%,由反内卷措施和折旧摊销费用下降所拉动 [11] - 瑞银看好互联网、硬件科技和券商板块,同时移除高股息股,并加入看好部分"出海"股票 [11] - 尽管全球AI相关股票回调可能拖累中国科技股,但中国与全球AI股票的相关性较低,且科技行业国产化进程及估值优势或能缓解影响 [11] - 摩根士丹利同样预测中国股市2026年有望进一步上涨,延续今年强劲涨势 [11] 百度AI业务进展 - 百度2025年第三季度总营收312亿元,百度核心营收247亿元 [12] - 公司首次披露AI业务收入,显示同比增长超50%,其中AI云收入同比增长33% [12] - AI应用收入达26亿元,AI原生营销服务收入同比增长262%至28亿元 [12] - 百度AI业务的三项关键组成部分被市场关注,包括AI云、昆仑芯和萝卜快跑 [13] A股市场近期表现 - A股市场明显分化,题材股因部分公司停牌而降温,两市超4100家个股下跌 [15] - 沪指出现自9月中旬以来首次日线3连阴,盘中银行和券商板块尝试护盘但力度不足 [3][15] - 市场短期可能考验60日均线(约3890点附近),但从技术角度看存在反弹预期 [15] - 近期活跃的储能锂电板块下跌,原因包括涨幅过大及市场传闻影响,类似情况此前在光伏板块亦有发生 [15]
AI算力与模型应用月报:计算机专题报告:超节点渐成共识,产业链成长动能明确-20251117
国海证券· 2025-11-17 19:35
行业投资评级 - 报告对计算机行业维持“推荐”评级 [1][141] 核心观点 - 超节点逐渐成为AI基础设施建设共识,产业链成长动能明确 [5] - 大模型训练与推理带动AI算力需求增长,AI芯片、服务器、液冷、电源、存储、光模块、IDC等环节有望持续受益 [141] 需求端:资本开支上修与算力交易活跃 - 主要云服务厂商(CSP)持续上修资本开支指引:谷歌将2025年资本开支上调至910-930亿美元(原指引850亿美元)[5];Meta上调至700-720亿美元(原区间660-720亿美元)[5];亚马逊上修至1250亿美元 [5] - OpenAI达成大规模算力合作:与英伟达(10GW)、AMD(6GW)和博通(10GW)的合作涉及资金有望超1万亿美元,计划2026年开始部署 [5];与甲骨文签署自2027年开始为期5年、4.5GW、总值超3000亿美元的算力采购合约 [5] - 主权AI加速推进:鸿海预计未来五年内主权AI投资或达1万亿美元,主要项目包括美国Stargate(5000亿美元)、欧盟InvestAI(2000亿欧元)以及沙特Humain AI(1000亿美元)[5] 供给端:芯片迭代与超节点进展 - 英伟达GPU持续迭代:Blackwell Ultra采用双光罩设计、HBM3E内存,NVLink带宽达1.8TB/s [37];2026年将推出Rubin架构,2027年推出Rubin Ultra,2028年推出Feynman架构 [38][39] - 华为昇腾超节点:昇腾384超节点(Atlas 900 A3 SuperPoD)已部署300多套,FP16算力300PFlops,HBM总容量49.2TB [48];Atlas 950 SuperPoD计划2026年Q4上市,支持8192卡无收敛全互联 [50][51] - 中科曙光发布640卡超节点scaleX640:单机柜集成640卡,FP16算力630PFlops,HBM总容量81.9TB,HBM总带宽2304TB/s [53][54] - 阿里云发布磐久128超节点AI服务器:单柜支持128个AI计算芯片,采用无背板正交互联技术 [60] - 百度发布天池256超节点与天池512超节点:分别支持256卡和512卡极速互联,计划2026年上市 [63] 产业链各环节成长动能 - AI服务器出货量增长显著:鸿海Q3 AI机柜出货量环比增长300%,Q4预计实现高双位数增长 [68][70];纬创已达成全年三位数以上增长目标,2026年有望实现双位数增长 [71][74];广达预计2026年AI服务器营收仍将实现三位数增长,占整体服务器营收比重达80% [75][77] - 液冷散热需求快速提升:奇鋐科技1-10月营收同比维持高双位数增长,10月同比增速达132% [79];双鸿10月营收同比增长67%,GB300冷板出货放量 [82] - 电源架构升级:英伟达800V高压直流(HVDC)架构将于2027年全面部署,台达电与光宝科技10月营收同比分别增长48%和23% [85][91] - 存储芯片进入“严重短缺”期:威刚董事长表示大型CSP对存储需求量远高于预期,DRAM价格进入强劲上行周期 [98] - CoWoS产能扩张:SEMI Vision预计2025年CoWoS年产能达78-90万片,2026年有望达到百万片水平 [106] 多模态与应用生态进展 - 模型迭代加速:OpenAI发布GPT-5、Sora 2和Codex [109];阿里发布包括通用、多模态及专用类在内的7款大模型 [121];DeepSeek发布V3.1和V3.2-Exp模型 [108] - Tokens调用量持续高增:谷歌10月日均tokens调用量达41.9万亿个,较7月增长32.71% [127];字节跳动9月日均tokens调用量达30万亿个,较5月增长82.93% [127] - 聊天助手月活规模:2025年9月,ChatGPT月活总量达12.51亿,位列第一;Gemini月活总量达5.2亿,实现较高增速 [136] - 模型厂商收入预期乐观:Anthropic预计2025年收入90亿美元,2026年达260亿美元,规模接近OpenAI [138][139]
软银被曝曾计划收购百亿美元半导体公司,谷歌也刚刚祭出大动作
选股宝· 2025-11-07 07:30
并购动态 - 软银在数月前向定制芯片公司Marvell提出收购意向,但双方未能就条款达成一致,此消息导致Marvell美股盘中大涨 [1] - Marvell主营业务为定制芯片,其ASIC业务提供从网络接口、内存到封装的全套解决方案,服务模式与博通类似 [1] 产品与技术进展 - 谷歌宣布将在未来几周推出第七代张量处理单元Ironwood,该芯片专为高要求工作负载设计,在训练和推理方面的性能较第六代Trillium TPU提升四倍 [1] - 单个超级计算机单元可通过芯片间互联网络连接多达9216颗Ironwood TPU,并访问1.77 PB的共享高带宽内存 [1] - 谷歌TPU v5的能效比为英伟达H200的1.46倍,亚马逊Trainium2的训练成本较GPU方案降低40%,推理成本降低55% [2] 市场规模与财务表现 - 博通2024年AI ASIC收入达122亿美元,2025年前三季度收入达137亿美元,其季度环比增速已超越英伟达 [2] - 根据AMD预测,2028年全球AI ASIC市场规模有望达到1250亿美元,博通预计2027年大客户ASIC服务市场规模为600-900亿美元 [2] 国内厂商动态 - 国内头部云厂商自研ASIC取得成果:百度昆仑芯已迭代至第三代,实现万卡集群部署并中标10亿元中国移动订单 [2] - 阿里平头哥PPU在显存和带宽上超越英伟达A800,签约中国联通16384张算力卡订单 [2] - 字节跳动于2020年启动芯片自研,计划在2026年前实现量产 [2] 产业链相关公司 - 芯原股份IP丰富且具备5nm工艺能力,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程 [2]
港股异动 | 科网股集体走高 恒科指午后涨超3%创近四年新高 快手-W(01024)大涨7%
智通财经网· 2025-10-02 13:46
恒生科技指数表现 - 恒生科技指数午后涨超3%,创近四年来新高 [1] - 快手-W股价上涨7.03%至90.55港元 [1] - 百度集团-SW股价上涨5.78%至140.9港元 [1] - 阿里巴巴-SW股价上涨4.12%至184.3港元 [1] - 京东集团-SW股价上涨2.82%至142.3港元 [1] - 腾讯控股股价上涨2.49%至679.5港元 [1] 行业估值与趋势 - 9月恒生科技指数上涨9.2%,港股互联网巨头估值与海外差异快速收敛 [1] - 腾讯与Meta、阿里巴巴与谷歌的估值已回到类似水平 [1] - 国内互联网巨头正式进入加码AI投入阶段,类似于海外2023年中旬微软和Meta领衔投入天量资本开支布局AI [1] - 该阶段典型特征为短期利润或受AI投入影响,但股价主要受AI投入力度、模型、技术、应用等边际进展驱动 [1] 公司动态与机构观点 - 阿里巴巴在云栖大会上表示将继续加大AI方面的资本开支投资,并预测2032年其布局的数据中心能耗将较十年前有十倍空间提升 [1] - 摩根大通将阿里巴巴港股目标价大幅上调至240港元 [2] - 阿里云收入增速已连续8个季度加快,2025年第二季度同比增长26%,主要受互联网、自动驾驶和具身智能等领域的生成式AI需求驱动 [2] - 国泰海通证券调整百度目标价至176港元,维持"增持"评级 [2] - 多家机构认为百度昆仑芯、Robotaxi、数字人等AI商业化变现和生态价值逐渐被市场重估 [2] - 东方证券表示,快手可灵依靠底模迭代保持领先,2.5 Turbo版本在"性能升级+降价30%"策略下有望带动用户增长和流水上行 [2] - 国信证券推荐AI投入最坚决的阿里巴巴、腾讯控股和快手公司 [1]