AI推理
搜索文档
高通上“芯”,A股“伙伴”振奋
上海证券报· 2025-10-29 23:26
当地时间10月27日,高通推出面向数据中心的下一代AI推理优化解决方案——基于高通AI200和AI250芯片的加速卡及整机柜产品,并预计于2026年和 2027年分别实现商用化。 有分析人士表示,此次高通推出机架级解决方案,或标志着公司业务正从销售芯片拓展至提供数据中心系统,这一举措与英伟达和AMD的发展路径相一 致,并使公司在数据中心市场与英伟达和AMD展开竞争。 记者注意到,多家A股上市公司在存储等领域与高通存在紧密联系,或将受益于高通进军数据中心解决方案市场。 高通推出机架级解决方案 具体来看,高通AI200是一款专为机架级AI推理打造的解决方案,旨在降低总体拥有成本(TCO),并针对大语言模型及多模态大模型(LLM、LMM) 推理和其他AI工作负载实现性能最优化。每张加速卡支持高达768 GB的LPDDR内存,不仅显著提升了内存容量,还有效降低了成本,从而为AI推理带来 扩展性和灵活性。 高通表示,两款机架级解决方案均配备直液冷散热系统,整机柜的功率消耗控制在160千瓦,充分满足大规模部署的需求。 "通过高通AI200和AI250,我们正重新定义机架级AI推理的无限可能。这些全新AI基础设施解决方案, ...
高通新发AI推理芯片,瞄准每年3000亿美元市场
36氪· 2025-10-29 19:12
新产品发布 - 公司发布AI200及AI250两款AI数据中心推理芯片,计划分别于2026年和2027年投入商用 [2] - 新产品基于高通NPU技术,AI200解决方案支持每张卡768GB LPDDR内存,AI250将采用创新内存架构以提升带宽并降低功耗 [4] - 两款芯片的机架级解决方案均采用直接液冷散热,单机架功耗为160kW,并采用PCIe和以太网进行扩展 [4] 市场反应与公司动态 - 新品发布当天公司股价盘中一度飙升22%至205美元,创2024年6月下旬以来最高,收盘报188美元,涨幅11.09% [2] - 多家投行包括摩根大通、美银证券更新评级,维持买入,最高目标价看至200美元 [2] - 公司宣布与沙特阿拉伯AI企业HUMAIN合作,共同推进新芯片的落地应用 [2][11] 战略布局与市场竞争 - 公司致力于制定按年推进的数据中心路线图,专注于领先的AI推理性能、能源效率及总拥有成本 [3] - AI推理市场前景广阔,巴克莱预测到2026年AI推理需求将占通用AI总计算需求的70%以上,达到训练需求的4.5倍,可能需近3000亿美元芯片资本支出 [6] - 公司面临激烈竞争,英伟达、谷歌、华为等厂商均已公布计划在2026年左右推出AI推理芯片新品 [6][7] 财务贡献与业务历史 - 公司AI推理业务目前营收贡献几乎可忽略不计,2025财年第三季度QCT半导体业务营收为89.93亿美元,主要来自手机、汽车和物联网芯片 [9] - 公司过往在数据中心市场成效甚微,2018年服务器部门曾裁员50%,被市场解读为放弃该业务 [9] - 公司总裁兼CEO表示,正与一家超大规模云端服务商深入洽谈,数据中心相关营收最快于2028财年开始贡献 [13] 相关业务拓展 - 公司于2025年5月计划采用英伟达技术定制生产数据中心CPU,以搭配英伟达GPU使用 [11] - 公司于2025年6月宣布以24亿美元收购半导体IP企业Alphawave,以增强数据中心市场竞争力,收购预计2026年第一季度完成 [11]
高通挑战英伟达
21世纪经济报道· 2025-10-29 11:56
公司战略与产品发布 - 公司宣布推出面向数据中心的下一代AI推理优化解决方案,包括基于Qualcomm AI200和AI250芯片的加速卡及机架级解决方案 [1] - AI200和AI250预计将分别于2026年和2027年实现商用,公司计划每年更新一次数据中心路线图,专注提升AI推理性能、能效和总拥有成本 [1] - 两款产品采用直接液冷散热,整机架级功耗为160千瓦,并采用LPDDR内存方案以降低成本,这与公司强调的低总拥有成本逻辑一致 [8] 市场反应与财务表现 - 产品发布消息使公司股价在10月27日一度猛涨20%,最终以11.09%涨幅收盘,但次日股价回落3.54%至181.03美元/股 [1] - 数据中心业务目前尚未在财报层面体现明显增量,公司第三季度芯片业务收入主要仍由手机业务主导,占比达70.37% [14] - 公司手机业务收入同比增速为7%,低于芯片部门整体11%的增速,也远低于物联网业务24%和汽车业务21%的增速 [14] 客户合作与市场进入 - 公司官宣首位客户为沙特阿拉伯国家级AI公司HUMAIN,双方计划自2026年起部署200兆瓦的Qualcomm AI200和AI250机架式解决方案 [9][11] - 公司总裁兼首席执行官指出,云服务提供商构建专用推理集群、市场向定制Arm兼容CPU转变等趋势为公司创造了市场切入点 [8] - 公司在7月业绩会上透露,正与一家领先的超大规模企业进行深入洽谈,若成功预计将在2028财年开始产生收入 [9] 历史背景与能力构建 - 此次并非公司首次进军数据中心市场,2017年其曾推出基于Arm架构的服务器处理器Centriq 2400,但最终未能成功 [3][16] - 相比上一次,公司通过收并购持续强化能力,例如2021年以14亿美元收购专注于数据中心CPU的Nuvia公司,并正在推进对Alphawave IP Group的收购 [16][17] - 外部市场公认AI推理市场空间将高于AI训练市场,众多玩家正试图以不同于英伟达GPU的差异化打法挖掘增量空间 [17] 产品技术细节 - Qualcomm AI200是专用机架级AI推理解决方案,旨在为大语言模型和多模态模型推理提供低总拥有成本,每张加速卡支持768 GB LPDDR内存 [5] - Qualcomm AI250解决方案首发基于近存计算的内存架构,实现超过10倍的有效内存带宽和更低功耗,支持解耦式AI推理 [5] - 公司官网显示,其数据中心产品/服务已形成包括Cloud AI 100 Ultra、AI 200、AI 250、人工智能推理套件和服务器CPU在内的五大产品矩阵 [11]
高通挑战英伟达
21世纪经济报道· 2025-10-29 11:52
记者丨 骆轶琪 编辑丨包芳鸣 高通在今年7月的第三季度财报业绩会上释放出进军数据中心市场的明确信号,如今这一规划已迅速变为现实。 当地时间10月27日,高通宣布推出面向数据中心的下一代AI推理优化解决方案:基于Qualcomm AI200和AI250芯片的加速卡及机架级解决方 案。 根据规划,AI200和AI250预计将分别于2026年和2027年实现商用。高通计划制定一个数据中心路线图,每年更新一次,专注提升AI推理方面 的性能、能效和总拥有成本(TCO)。 受此消息影响,10月27日当天高通公司股价一直猛拉到20%涨幅,最终以11.09%涨幅收盘。截至10月28日收盘,高通股价有所回落,跌 3.54%报181.03美元/股。 这其实不是高通第一次尝试挖掘数据中心市场机会,在2017年,其曾尝试推出基于Arm架构的数据中心CPU产品,但遭遇折戟。 如今看来,相比于上一次,高通通过收并购、合作等方式持续强化软硬件方面的能力,已经在数据中心领域有不同于前一次的能力储备。 当然目前在数据中心市场,新进入者面临的核心挑战之一是应用生态,高通同步公布了这批产品的第一位客户,为其对数据中心市场的再度进 攻迎来良好开局。 ...
高通新款云端芯片公开!借推理抢英伟达蛋糕,市值一夜暴涨197.4亿美元
量子位· 2025-10-28 22:24
公司战略转型 - 高通宣布推出AI200和AI250两款AI芯片,正式进军数据中心市场[1][2] - 公司从端侧/轻量级推理转向大型数据中心市场,撕掉端侧标签[5][6] - 此次转型基于公司在手机芯片领域的技术积累,核心计算单元源自Hexagon神经处理单元[17] 产品技术规格 - AI200预计2026年商用,支持作为独立芯片或整机架服务器系统提供,每张加速卡支持768GB LPDDR内存[11][12] - AI250计划2027年推出,采用近存计算的全新内存架构,带来超过10倍的有效内存带宽提升并显著降低功耗[13] - 两种机架方案均支持直液冷散热、PCIe与以太网扩展、机密计算等企业级功能,面向160kW级别高密度机架场景[13] 市场竞争格局 - 消息公布后高通股价一度飙升超20%,创自2019年以来最大单日涨幅[3] - 目前数据中心市场英伟达占据90%以上份额,但巨头们都在寻找替代方案[21] - 麦肯锡预测到2030年全球数据中心投资将达到6.7万亿美元[20] 市场进展与规划 - 高通已获得沙特AI初创公司Humain订单,计划从2026年起部署基于AI200/AI250的机架级算力系统,总功率达200兆瓦[23] - 公司未来将以每年一代的节奏推进数据中心产品路线图,持续提升AI推理性能与能效表现[14] - 同时推进面向超大规模推理的端到端软件栈,支持主流框架与工具链以降低客户总拥有成本[13]
高通发布AI200与AI250,升级数据中心AI推理解决方案
环球网· 2025-10-28 20:47
产品发布概述 - 公司宣布推出面向数据中心的下一代AI推理优化方案,包括基于Qualcomm AI200与AI250芯片的加速卡及机架系统 [1] - 该系列方案聚焦机架级性能与内存容量优化,旨在为生成式AI推理提供高效能支持,助力各行业推进可扩展、高效率的AI部署 [1] Qualcomm AI200方案 - 方案专为机架级AI推理设计,重点服务大语言模型和多模态模型推理及其他AI工作负载 [3] - 核心优势在于低总体拥有成本与性能优化,每张加速卡支持768GB LPDDR内存,以满足更高内存容量需求并控制成本 [3] Qualcomm AI250方案 - 方案首发近存计算创新内存架构,该架构可实现10倍以上有效内存带宽提升,同时显著降低功耗 [3] - 支持解耦式AI推理功能,能实现硬件资源高效利用,适配不同客户的性能与成本需求 [3] 机架解决方案共性技术 - AI200与AI250的机架解决方案均支持直接液冷散热以提升效率,并兼容PCIe纵向扩展与以太网横向扩展 [3] - 方案内置机密计算功能以保障AI工作负载安全,整机架功耗统一控制为160千瓦,符合数据中心能耗管理标准 [3] 软件支持 - 公司提供超大规模级AI软件栈,覆盖从应用层到系统软件层的全链路,并针对AI推理场景进行优化 [4] - 软件栈支持主流机器学习框架、推理引擎、生成式AI框架及解耦服务等LLM/LMM推理优化技术 [5] - 开发者可通过高效Transformer库与AI Inference Suite实现模型无缝接入,并能一键部署Hugging Face模型 [5] 商业化时间表与未来规划 - Qualcomm AI200预计于2026年实现商用,Qualcomm AI250则计划在2027年推向市场 [5] - 未来公司将按年度迭代节奏推进数据中心产品技术路线图,持续聚焦AI推理性能、能效与总体拥有成本优化 [5]
英特尔打破连续亏损!华人CEO扭转局势
首席商业评论· 2025-10-28 12:37
核心财务表现 - 第三季度净利润为41亿美元,实现扭亏为盈,去年同期为亏损166亿美元 [5] - 第三季度营收为137亿美元,同比增长3% [5][8] - Non-GAAP毛利率提升至40%,运营现金流为25亿美元 [5][8] - 公司股价在盘后交易中上涨逾7%,今年迄今股价已上涨约90% [6][20] 各业务板块业绩 - 客户端计算业务营收为85亿美元,同比增长5% [5][8] - 数据中心与人工智能业务营收为41亿美元,同比减少1% [5][8] - 晶圆代工业务营收42亿美元,同比减少2%,净亏损为23亿美元,较去年同期的58亿美元显著改善 [5][8] - 所有其它业务营收为10亿美元,同比增长3% [5][8] 成本削减与运营效率 - 第三季度员工数量减少13%,从101,400人减少到88,400人 [6] - 公司总员工人数同比减少29% [6] - 扭亏为盈得益于PC处理器销量增长及成本下降措施 [5] 战略重点与产品路线图 - AI加速器战略聚焦于成为AI推理的首选计算平台,认为推理市场规模将远超训练市场 [9] - 计划每年推出推理优化的GPU,以满足企业需求 [10] - 下一代服务器产品至强6+(Clearwater Forest)基于Intel 18A节点,展示了显著的功耗和性能提升 [10] - 新成立的中央工程事业部将简化自主芯片设计,并为外部客户提供定制芯片服务 [11] 资金状况与合作伙伴关系 - 第三季度获得美国政府57亿美元、软银集团20亿美元资金,并从Altera交易获得43亿美元 [13] - 预计英伟达的50亿美元投资将在第四季度完成 [13] - 公司与英伟达宣布合作,共同开发多代定制数据中心和PC产品 [17] - 第三季度结束时公司持有309亿美元现金和短期投资 [15] 制造进展与市场预期 - 亚利桑那州Fab 52已全面投入运营,Intel 18A正按计划推进 [5] - Intel 18A节点的良率尚未达到所需水平,可能要到2027年才能达到行业可接受水平 [16] - 预计第四季度销售额为128亿美元至138亿美元,数据中心与人工智能业务将环比强劲增长 [20] - 预计2025年总资本投资约为180亿美元,资本支出将超过270亿美元 [20]
20cm速递丨科创芯片ETF国泰(589100)涨超2%,存储芯片可能进入“超级周期”
每日经济新闻· 2025-10-27 16:35
相关机构表示,AI推理需求的快速增长推动对服务器存储芯片用量大幅提升,除服务器存储价格提升 外,由于进一步挤占产能,根据CFM闪存市场,Q4手机、PC等终端的存储价格也将同步提升。另一方 面,随着下游需求复苏、消费类库存水位下降以及新产品推出等叠加因素,推动存储价格或进一步上 涨,存储芯片可能进入"超级周期"。 科创芯片ETF国泰(589100)跟踪的是科创芯片指数(000685),单日涨跌幅限制为20%,该指数从科 创板市场中选取涉及芯片材料、设计、制造、封装测试等全产业链环节的上市公司证券作为指数样本, 由50只代表性证券组成,以反映中国半导体行业相关上市公司证券的整体表现和发展趋势。该指数具有 较高的成长性和行业代表性。 (文章来源:每日经济新闻) ...
这家AI芯片独角兽,考虑出售
半导体行业观察· 2025-10-26 11:16
公司概况与最新动态 - 人工智能芯片初创公司SambaNova Systems因融资困难,正考虑出售公司[2] - 公司成立于2017年,总部位于美国加州,曾致力于为训练和推理打造基于统一架构的AI芯片[2] - 公司在2023年发布了一款专为大语言模型微调和推理设计的芯片[2] - 公司上一轮融资是2021年的D轮融资,融资总额超过11亿美元,估值超过50亿美元[2] - 2024年4月下旬,公司大幅偏离最初目标,放弃训练雄心,裁掉15%的员工,将全部精力转向AI推理[3] 团队与技术优势 - 公司由芯片和AI/ML领域的三位传奇人物共同创立:CEO Rodrigo Liang、Kunle Olukotun和Christopher Ré[3] - 公司内部承接了大量Sun Microsystems芯片部门的员工,拥有丰富的芯片开发经验和供应链管理能力[3] - 过去两年中,团队围绕大模型技术路线培养了数十名LLM模型工程师,并在服务部署环节建立了先发优势[3] - 公司曾投入大量时间和精力实现高效的训练,针对训练设计和优化了硬件和软件功能[4][7] - 分析师曾认为公司凭借单芯片满足推理和训练市场需求,相较于Groq等竞争对手拥有独特优势[4][6] 战略转型与行业趋势 - 公司战略转型的主要原因包括:推理是更容易解决的问题、推理市场可能比训练市场更大、英伟达在AI训练芯片领域占据绝对主导地位[4][7] - 许多分析师认为,人工智能推理市场规模可能是训练市场的十倍[4] - 公司的转变反映了AI芯片领域的一个普遍趋势,即从训练转向推理,Groq和Cerebras等公司也曾做出类似调整[3][5][6] - 推理过程中无需存储梯度,激活函数使用后可丢弃,减少了内存占用,降低了芯片内存层次结构的复杂性[4] - 推理所需的芯片间联网相对简单,更适合许多初创公司的AI芯片网络功能[4]
英特尔CEO确认:18A工艺已进入大规模量产,为三代产品奠定基础
搜狐财经· 2025-10-24 11:01
IT之家 10 月 24 日消息,科技媒体 Wccftech 今天(10 月 24 日)发布博文,报道称在 2025 年第 3 季度财报会议上,英特尔首席执行官陈立武(Lip-Bu Tan)详细阐述了公司在客户端、服务器及晶圆代工业务的未来战略蓝图。 更引人注目的是,下一代 Coral Rapids 处理器被确认将重新引入同步多线程(SMT,即超线程)技术,此举旨在显著提升处理器的多任务处理性能,目前该 产品正处于定义阶段(definition stage)。 工艺技术方面 IT之家援引博文介绍,会议的核心信息围绕新工艺节点的应用和下一代 CPU 产品的具体规划,明确了公司未来的技术方向与市场策略。陈立武确认,其先 进的 18A 工艺节点将支撑未来至少三代客户端与服务器产品,并已进入大规模量产阶段。 客户端处理器 客户端处理器方面,英特尔确认首款基于 18A 工艺的 Panther Lake 处理器(隶属酷睿 Ultra 3 系列)将于 2025 年底前推出首个高端型号,并计划在 CES 2026 上全面揭晓,其余型号则在 2026 年上半年陆续上市。 紧随其后的是代号为 Nova Lake 的下一代产品,计 ...