Workflow
Ascend 950PR
icon
搜索文档
一颗芯片的新战争
半导体行业观察· 2025-10-07 10:21
文章核心观点 - AI推理芯片市场竞争加剧,成为AI下半场商业化关键,市场规模预计2028年达1500亿美元,年复合增长率超40% [3] - 华为、英伟达、谷歌三大巨头及初创公司Groq相继发布推理芯片,竞争焦点从原始算力转向成本、能效、软件生态和应用场景的综合较量 [3][5][10][25][28] 华为Ascend 950PR - 华为宣布昇腾芯片规划,未来3年将推出950、960、970系列,目标算力一年一代翻倍 [3] - Ascend 950PR专攻推理Prefill阶段和推荐业务,采用自研低成本HBM(HiBL 1.0),预计2026年一季度面世 [3] - 芯片采用同一Die设计,低成本HBM策略可解决HBM供给紧缺并降低总成本(内存成本占推理支出40%以上) [3][4] - 互联带宽相比Ascend 910C提升2.5倍,达2TB/s,支持低精度数据格式如FP8,算力达1P和2P [6] 英伟达Rubin CPX - 英伟达推出专为大规模上下文设计的GPU Rubin CPX,预计2026年底上市,标志公司向推理市场延伸 [5][8] - 单机架算力达8 Exaflops,较GB300 NVL72提升7.5倍,配备100TB快速内存和1.7PB/s带宽 [5] - 芯片针对百万Token级上下文,峰值算力30 Petaflops,内存128GB GDDR7,系统专注力提升3倍 [8] - 支持NVFP4精度,集成视频编解码器,旨在解决AI Agent长上下文瓶颈(80%AI应用将涉及多模态长序列处理) [8][9] 谷歌Ironwood TPU - 谷歌推出第七代TPU推理芯片Ironwood,以应对内部推理请求量激增(2024年4月至2025年4月令牌使用量增长50倍) [10][13] - 提供256芯片和9,216芯片两种配置,后者总算力42.5 Exaflops,是El Capitan超算的24倍;单芯片峰值算力4.614 Exaflops [15] - 功率效率为Trillium的1.5倍,每瓦性能翻倍,较首代TPU提升30倍;单芯片内存带宽7.37 TB/s,容量192 GB,为Trillium的6倍 [17][20] - 通过光路交换机(OCS)互连集群,提供1.77 PB HBM内存容量,支持动态重构和故障修复,软件栈支持PyTorch和JAX [20][21] - 软硬件协同优化可帮助客户降低推理延迟高达96%,吞吐量提高40%,每个令牌成本降低多达30% [24] Groq推理芯片初创公司 - Groq在2025年9月融资7.5亿美元,估值从2021年10亿美元跃升至69亿美元,投资者包括Disruptive、三星、思科等 [25] - 公司计划到2025年第一季度部署超108,000个LPU(14纳米),已获沙特阿拉伯15亿美元订单和贝尔加拿大独家合作 [26] - LPU采用张量流架构,单大核心设计,延迟比GPU低10倍,内存带宽优势达10倍,适合实时AI推理 [27] 行业趋势与竞争格局 - AI推理市场增长速度快于训练市场(推理年复合增长率40% vs 训练20%),支撑智能推荐、内容生成等实时应用需求 [3] - 推理阶段是实现AI商业化的关键,芯片竞争围绕成本控制(如华为HBM策略)、能效提升(如谷歌TPU)和长上下文处理(如英伟达)展开 [3][4][8][17][28]
Wall Street Breakfast Podcast: Jimmy Kimmel Pulled From Air
Seeking Alpha· 2025-09-18 18:46
华特迪士尼公司及媒体行业 - ABC网络无限期停播吉米·坎摩尔直播秀 该决定在主持人关于共和党活动人士查理·柯克的言论引发强烈反对后做出 [2][3] - 拥有多家ABC附属电视台的Nexstar媒体集团以坎摩尔的言论“具有冒犯性且麻木不仁”为由 在可预见的未来停播该节目 [3] - 最大的ABC附属台所有者Sinclair广播集团也发表声明 将继续停播坎摩尔的节目 [5] - 此事发生在媒体公司面临复杂政治气候之际 迪士尼去年支付1500万美元了结前总统特朗普提起的诽谤诉讼 [4] 华为技术有限公司及人工智能芯片行业 - 华为发布新的AI芯片路线图以挑战英伟达 计划到2028年进行四款昇腾系列芯片的发布 [2][6] - 公司公布SuperPod技术 该技术可支持连接多达15,488块包含华为昇腾AI芯片的显卡 这标志着对英伟达在大规模AI基础设施领域主导地位的直接挑战 [5] - 具体发布计划包括:2025年初推出昇腾950PR 2026年末推出昇腾950DT 2027年末推出昇腾960 2028年末推出昇腾970 [6] - 此举正值中国网信办禁止国内大型科技公司购买英伟达AI芯片 该机构本周已告知包括字节跳动和阿里巴巴在内的公司停止测试和订购英伟达为中国定制的RTX Pro 6000D产品 [6][7] Krispy Kreme公司及市场反应 - Krispy Kreme经历剧烈交易日后最终上涨1.0% 此前交易员关注到联邦调查局局长卡什·帕特尔在众议院司法委员会听证会上的评论 帕特尔称看到了该公司的良好投资机会 [8] - 该股盘中涨幅一度高达8% 最终回落 当日交易量比正常日均活动量高出50% [9] - 帕特尔的投资披露并非新信息 其在7月披露购买了价值1.5万至5万美元的Krispy Kreme股票以及价值5万至10万美元的安森美半导体股票 [9] - Krispy Kreme在盘前交易中继续上涨5% 安森美半导体在午后交易中出现短暂飙升 但收盘仅上涨0.5% 其盘前上涨1.4% [10] 其他市场动态及公司事件 - 纽柯钢铁股价盘前下跌4% 此前该钢铁制造商将第三季度每股收益指引定为2.05至2.15美元 远低于2.56美元的普遍预期 [11] - 今日投资者活动包括GitLab参与AWS都柏林云日 Intuit在其加州山景城总部举办年度投资者日 杜邦举办其投资者日活动 [11] - 今天是阿拉斯加航空与夏威夷航空合并交易完成一周年纪念日 [11]
Global Markets React to Huawei’s Chip Ambitions, UAE Rate Cut, and Geopolitical Tensions
Stock Market News· 2025-09-18 11:39
华为AI芯片发展路线图 - 华为计划推出多款昇腾和Atlas系列AI芯片,其中昇腾910C芯片已于2025年第一季度推出,并计划于2025年5月开始大规模出货,旨在作为英伟达H20芯片的国内替代品[3] - 尽管面临美国制裁,华为目标在2025年第一季度量产昇腾910C,但其采用中芯国际N+2工艺的良品率据报道仅为20%左右,远低于商业可行阈值[3] - 华为计划在2026年发布昇腾950PR和昇腾950DT芯片,Atlas 950超级集群预计在2025年底推出,被誉为全球最强大的计算集群[4] - 华为进一步规划在2027年推出昇腾960芯片,2028年推出昇腾270芯片,下一代Atlas 960芯片预计在2027年第四季度发布,公司强调通过基于国内芯片制造能力的"超节点+集群"解决方案支持AI长期发展[4] 阿联酋利率调整与市场表现 - 阿联酋中央银行将基准利率下调25个基点,将隔夜存款便利利率从4.40%降至4.15%,此次调整紧随美联储的类似降息行动,原因是阿联酋迪拉姆与美元挂钩[5] - 阿联酋将其2025年通胀预测从2%小幅下调至1.9%,2026年通胀预测从2.1%下调至1.9%[5] - 香港恒生指数突破27000点大关,为两年多来首次,反映了亚太地区的积极市场情绪[6] 韩国电商合资企业获批 - 韩国公平贸易委员会有条件批准了阿里巴巴国际旗下的阿里速卖通韩国公司与新世界集团旗下公司成立的合资企业,合资公司名为"Grand Opus Holding"[7] - 合资安排为易买得关联公司Apollo Korea贡献Gmarket的100%股权,而阿里巴巴关联公司BK4投资2.25亿美元现金以及阿里速卖通韩国的100%股权[7] - 此次合并预计将显著重塑韩国国内电子商务格局,可能形成与Coupang和Naver的三方竞争结构,公平贸易委员会的有条件批准解决了对海外直购市场可能限制竞争的担忧[7][9]