Ascend 950PR
搜索文档
一颗芯片的新战争
半导体行业观察· 2025-10-07 10:21
文章核心观点 - AI推理芯片市场竞争加剧,成为AI下半场商业化关键,市场规模预计2028年达1500亿美元,年复合增长率超40% [3] - 华为、英伟达、谷歌三大巨头及初创公司Groq相继发布推理芯片,竞争焦点从原始算力转向成本、能效、软件生态和应用场景的综合较量 [3][5][10][25][28] 华为Ascend 950PR - 华为宣布昇腾芯片规划,未来3年将推出950、960、970系列,目标算力一年一代翻倍 [3] - Ascend 950PR专攻推理Prefill阶段和推荐业务,采用自研低成本HBM(HiBL 1.0),预计2026年一季度面世 [3] - 芯片采用同一Die设计,低成本HBM策略可解决HBM供给紧缺并降低总成本(内存成本占推理支出40%以上) [3][4] - 互联带宽相比Ascend 910C提升2.5倍,达2TB/s,支持低精度数据格式如FP8,算力达1P和2P [6] 英伟达Rubin CPX - 英伟达推出专为大规模上下文设计的GPU Rubin CPX,预计2026年底上市,标志公司向推理市场延伸 [5][8] - 单机架算力达8 Exaflops,较GB300 NVL72提升7.5倍,配备100TB快速内存和1.7PB/s带宽 [5] - 芯片针对百万Token级上下文,峰值算力30 Petaflops,内存128GB GDDR7,系统专注力提升3倍 [8] - 支持NVFP4精度,集成视频编解码器,旨在解决AI Agent长上下文瓶颈(80%AI应用将涉及多模态长序列处理) [8][9] 谷歌Ironwood TPU - 谷歌推出第七代TPU推理芯片Ironwood,以应对内部推理请求量激增(2024年4月至2025年4月令牌使用量增长50倍) [10][13] - 提供256芯片和9,216芯片两种配置,后者总算力42.5 Exaflops,是El Capitan超算的24倍;单芯片峰值算力4.614 Exaflops [15] - 功率效率为Trillium的1.5倍,每瓦性能翻倍,较首代TPU提升30倍;单芯片内存带宽7.37 TB/s,容量192 GB,为Trillium的6倍 [17][20] - 通过光路交换机(OCS)互连集群,提供1.77 PB HBM内存容量,支持动态重构和故障修复,软件栈支持PyTorch和JAX [20][21] - 软硬件协同优化可帮助客户降低推理延迟高达96%,吞吐量提高40%,每个令牌成本降低多达30% [24] Groq推理芯片初创公司 - Groq在2025年9月融资7.5亿美元,估值从2021年10亿美元跃升至69亿美元,投资者包括Disruptive、三星、思科等 [25] - 公司计划到2025年第一季度部署超108,000个LPU(14纳米),已获沙特阿拉伯15亿美元订单和贝尔加拿大独家合作 [26] - LPU采用张量流架构,单大核心设计,延迟比GPU低10倍,内存带宽优势达10倍,适合实时AI推理 [27] 行业趋势与竞争格局 - AI推理市场增长速度快于训练市场(推理年复合增长率40% vs 训练20%),支撑智能推荐、内容生成等实时应用需求 [3] - 推理阶段是实现AI商业化的关键,芯片竞争围绕成本控制(如华为HBM策略)、能效提升(如谷歌TPU)和长上下文处理(如英伟达)展开 [3][4][8][17][28]
极度稀缺!国际巨头掀涨价潮 最高30%
证券时报网· 2025-09-29 08:35
行业供需与价格动态 - AI算力革命引发存储芯片行业供需重构,供应紧张和云端企业需求激增导致主要产品价格大幅上调,三星电子将LPDDR4X、LPDDR5和LPDDR5X内存价格上调30%,NAND闪存价格上涨5%至10%,美光科技通知客户价格将上涨20%至30% [2] - 行业从2024年第三季度触底后,2025年第二季度已进入明确复苏通道,周期反转为相关企业带来业绩弹性 [3] - 随着AI服务器出货规模持续扩大,下半年服务器NAND市场备货需求升温,四季度存储市场价格将迎来全面上涨 [8] 主要厂商业绩与预期 - 美光科技2025财年第四财季营收113.2亿美元,超出分析师预期的112亿美元,其高带宽内存营收创下新高,推动数据中心业务全年业绩创新高 [3] - 美光科技预计2026财年第一财季营收将达到122亿至128亿美元,远高于分析师预期 [3] - 2025年第一季度,中国长鑫存储与长江存储季度营收均突破10亿美元大关,标志着国内存储企业在全球舞台崭露头角 [6] 市场规模与增长预测 - 根据预测,全球存储芯片行业市场规模持续增长,2027年或超过1380亿美元,2023年至2027年复合增速达到5.5% [4] - 2025年中国存储芯片市场规模有望达到5500亿元人民币,2020年至2025年复合增速达到20%以上 [4] 国内产业突破与出海进展 - 华为在2025年全联接大会上透露,其自研的Ascend 950PR芯片将于2026年第一季度推出,该芯片采取了华为自研HBM [6] - A股市场涉及存储芯片的概念股接近120只,截至2024年这些概念股整体境外营收超过2200亿元,占总营收比重超过30%,今年上半年占比提升至31%以上 [7] - 兆易创新约七成营收来自于存储芯片,其2024年境外业务收入占比超过75% [7] - 江波龙主控芯片全系列产品累计实现超过8000万颗批量部署,自研UFS4.1产品正处于多家Tier1厂商导入验证阶段 [7] 资本开支与产能投入 - 国内外科技巨头加大资本支出,阿里巴巴宣布未来三年投入3800亿元建设云和AI基础设施,腾讯2025年资本开支或达千亿元 [8] - 存储芯片概念股资本开支持续加大,2024年接近1250亿元,较2020年增加近55%,今年上半年资本开支整体接近608亿元 [8] - 资本开支占营收比重自2022年以来持续增加,2024年达到17.11%,有9家公司2024年该比重超过50% [8] 特定上市公司动态 - 股东户数显著下降且年内涨幅相对较低的存储芯片概念股有9只,其中东方中科、精测电子、光韵达、深科技最新股东户数较二季度末下降幅度均超过10% [9] - 东方中科股东户数下降超过25%,其国产高性能测试机对EEPROM、NOR Flash等存储器有良好支持 [9] - 精测电子与长江存储、合肥长鑫等客户建立良好合作关系 [9] - 光韵达拥有中国第一条12英寸全自动集成电路芯片制造生产线,其存储芯片制造工艺处于国际先进水平 [9]
Wall Street Breakfast Podcast: Jimmy Kimmel Pulled From Air
Seeking Alpha· 2025-09-18 18:46
华特迪士尼公司及媒体行业 - ABC网络无限期停播吉米·坎摩尔直播秀 该决定在主持人关于共和党活动人士查理·柯克的言论引发强烈反对后做出 [2][3] - 拥有多家ABC附属电视台的Nexstar媒体集团以坎摩尔的言论“具有冒犯性且麻木不仁”为由 在可预见的未来停播该节目 [3] - 最大的ABC附属台所有者Sinclair广播集团也发表声明 将继续停播坎摩尔的节目 [5] - 此事发生在媒体公司面临复杂政治气候之际 迪士尼去年支付1500万美元了结前总统特朗普提起的诽谤诉讼 [4] 华为技术有限公司及人工智能芯片行业 - 华为发布新的AI芯片路线图以挑战英伟达 计划到2028年进行四款昇腾系列芯片的发布 [2][6] - 公司公布SuperPod技术 该技术可支持连接多达15,488块包含华为昇腾AI芯片的显卡 这标志着对英伟达在大规模AI基础设施领域主导地位的直接挑战 [5] - 具体发布计划包括:2025年初推出昇腾950PR 2026年末推出昇腾950DT 2027年末推出昇腾960 2028年末推出昇腾970 [6] - 此举正值中国网信办禁止国内大型科技公司购买英伟达AI芯片 该机构本周已告知包括字节跳动和阿里巴巴在内的公司停止测试和订购英伟达为中国定制的RTX Pro 6000D产品 [6][7] Krispy Kreme公司及市场反应 - Krispy Kreme经历剧烈交易日后最终上涨1.0% 此前交易员关注到联邦调查局局长卡什·帕特尔在众议院司法委员会听证会上的评论 帕特尔称看到了该公司的良好投资机会 [8] - 该股盘中涨幅一度高达8% 最终回落 当日交易量比正常日均活动量高出50% [9] - 帕特尔的投资披露并非新信息 其在7月披露购买了价值1.5万至5万美元的Krispy Kreme股票以及价值5万至10万美元的安森美半导体股票 [9] - Krispy Kreme在盘前交易中继续上涨5% 安森美半导体在午后交易中出现短暂飙升 但收盘仅上涨0.5% 其盘前上涨1.4% [10] 其他市场动态及公司事件 - 纽柯钢铁股价盘前下跌4% 此前该钢铁制造商将第三季度每股收益指引定为2.05至2.15美元 远低于2.56美元的普遍预期 [11] - 今日投资者活动包括GitLab参与AWS都柏林云日 Intuit在其加州山景城总部举办年度投资者日 杜邦举办其投资者日活动 [11] - 今天是阿拉斯加航空与夏威夷航空合并交易完成一周年纪念日 [11]
徐直军:华为对为人工智能发展提供充裕算力充满信心
证券时报· 2025-09-18 18:26
核心观点 - 华为发布全球最强算力超节点及集群 并公布昇腾芯片未来规划 彰显公司在AI算力基础设施领域的技术领先地位和对可持续算力供应的信心 [1][2][6] 产品发布 - 推出Atlas 950 SuperPoD超节点 支持8192张昇腾卡 [1] - 推出Atlas 960 SuperPoD超节点 支持15488张昇腾卡 [1] - 发布Atlas 950 SuperCluster集群 算力规模超50万卡 [1] - 发布Atlas 960 SuperCluster集群 算力规模达百万卡 [1] - 推出全球首个通用计算超节点TaiShan 950 SuperPoD 可取代大型机和小型机 [2] - Atlas 900超节点保持全球算力最大 满配支持384卡 最大算力300 PFLOPS [2] 技术突破 - 通过系统性创新实现光互联可靠性提升100倍 互联距离超过200米 [4][5] - 突破多端口聚合与高密封装技术 实现TB级超大带宽和2.1微秒超低时延 [5] - 开创超节点架构及新型互联协议 支持万卡级规模像单台计算机一样工作 [5] - 解决长距离高可靠互联挑战 在协议各层引入高可靠机制 [4][5] - 解决大带宽低时延挑战 将跨柜时延从3微秒降至2.1微秒 提升24% [4][5] 芯片规划 - 昇腾芯片将持续演进 未来三年规划三个系列:Ascend 950/960/970 [6] - Ascend 950系列包含两颗芯片:950PR和950DT [6] - Ascend 950PR芯片将于2026年第一季度推出 采用自研HBM [6] 战略意义 - 超节点技术重新定义AI基础设施范式 成为主导性产品形态 [3] - 混合超节点为下一代生成式推荐系统提供全新架构选择 [3] - 昇腾芯片为AI算力战略基础 自2018年以来持续迭代升级 [2][6] - 万卡超节点架构实现"一台计算机"的逻辑统一性 [5]
Global Markets React to Huawei’s Chip Ambitions, UAE Rate Cut, and Geopolitical Tensions
Stock Market News· 2025-09-18 11:39
华为AI芯片发展路线图 - 华为计划推出多款昇腾和Atlas系列AI芯片,其中昇腾910C芯片已于2025年第一季度推出,并计划于2025年5月开始大规模出货,旨在作为英伟达H20芯片的国内替代品[3] - 尽管面临美国制裁,华为目标在2025年第一季度量产昇腾910C,但其采用中芯国际N+2工艺的良品率据报道仅为20%左右,远低于商业可行阈值[3] - 华为计划在2026年发布昇腾950PR和昇腾950DT芯片,Atlas 950超级集群预计在2025年底推出,被誉为全球最强大的计算集群[4] - 华为进一步规划在2027年推出昇腾960芯片,2028年推出昇腾270芯片,下一代Atlas 960芯片预计在2027年第四季度发布,公司强调通过基于国内芯片制造能力的"超节点+集群"解决方案支持AI长期发展[4] 阿联酋利率调整与市场表现 - 阿联酋中央银行将基准利率下调25个基点,将隔夜存款便利利率从4.40%降至4.15%,此次调整紧随美联储的类似降息行动,原因是阿联酋迪拉姆与美元挂钩[5] - 阿联酋将其2025年通胀预测从2%小幅下调至1.9%,2026年通胀预测从2.1%下调至1.9%[5] - 香港恒生指数突破27000点大关,为两年多来首次,反映了亚太地区的积极市场情绪[6] 韩国电商合资企业获批 - 韩国公平贸易委员会有条件批准了阿里巴巴国际旗下的阿里速卖通韩国公司与新世界集团旗下公司成立的合资企业,合资公司名为"Grand Opus Holding"[7] - 合资安排为易买得关联公司Apollo Korea贡献Gmarket的100%股权,而阿里巴巴关联公司BK4投资2.25亿美元现金以及阿里速卖通韩国的100%股权[7] - 此次合并预计将显著重塑韩国国内电子商务格局,可能形成与Coupang和Naver的三方竞争结构,公平贸易委员会的有条件批准解决了对海外直购市场可能限制竞争的担忧[7][9]