人工智能推理 - 财报，业绩电话会，研报，新闻 - Reportify

人工智能推理

搜索文档

国产GPU第二股沐曦股份大涨近560% 单签盈利近30万元

新华财经· 2025-12-17 09:54

沐曦股份本次发行价为104.66元／股，在年内发行的科创板新股中仅次于摩尔线程的114.28元／股，为年内科创板第二高。IPO募集资金将用于新型高性能通用GPU研发及产业化项目、新一代人工智能推理 GPU研发及产业化项目和面向前沿领域及新兴应用场景的高性能GPU技术研发项目。公开资料显示，沐曦股份致力于自主研发全栈高性能GPU芯片及计算平台，主要产品包括用于智算推理的曦思N系列GPU、用于训推一体和通用计算的曦云C系列GPU，以及正在研发用于图形渲染的曦彩G 系列GPU。公司最新一代产品曦云C600系列，性能介于A100和H100之间，实现了从芯片设计到封装测试的全流程国产供应链闭环，预计今年年底进入风险量产阶段，明年上半年正式量产。公司此前发布的网上发行申购情况及中签率公告显示，参与沐曦股份新股网上申购的投资者达517.52万户，超过摩尔线程的482.66万户；回拨机制启动后，网上发行最终中签率约万分之三点三。数据显示，A股市场半导体行业年内共有7只新股上市，分别为昂瑞微、摩尔线程、恒坤新材、西安奕材、屹唐股份、新恒汇和矽电股份，上述7股的上市首日平均涨幅约242.94%。新华财经北京12 ...

沐曦股份(SH:688802)

人工智能推理

曦云C600系列

曦思N系列GPU

曦云C系列GPU

人工智能推理

曦云C600系列

曦思N系列GPU

曦云C系列GPU

苹果首款服务器芯片，更多细节曝光

半导体行业观察· 2025-12-16 09:22

公众号记得加星标⭐️，第一时间看推送不会错过。众所周知，苹果公司热衷于垂直整合，尽可能将关键技术节点保留在公司内部，其庞大的定制芯片设计工作或许是这种模式最恰当的例证。当然，推理芯片的架构与用于训练人工智能模型的芯片的架构有着根本的不同，前者更加注重延迟和吞吐量。人工智能推理芯片还采用了精度较低的基于数学的架构，例如 INT8。因此，鉴于此背景，我们可以合理推断，苹果和博通在推进 Baltra 的整体设计过程中，可能会重点关注这些方面。与此同时，苹果庞大的定制芯片产品线仍在不断扩展。除了广为人知的A系列和M系列芯片外，苹果现在还使用其自主研发的C1调制解调器芯片。此外，这家库比蒂诺巨头可能还会推出一款基于其 Apple Watch专用S系列芯片的衍生产品，用于其计划于明年发布的AI智能眼镜中。参考链接 https://wccftech.com/apples-ai-server-chip-baltra-likely-to-be-used-primarily-for-ai-inference/ （来源：编译自wccftech ）当然，这些定制人工智能芯片的实际部署预计将在 2027 年进行 ...

苹果(US:AAPL)

人工智能推理

Baltra人工智能服务器芯片

人工智能推理

Baltra人工智能服务器芯片

明日（12月5日）！摩尔线程登陆A股沐曦股份开启申购

新华财经· 2025-12-04 22:25

摩尔线程科创板上市 - 公司将于12月5日在科创板上市，发行价格为114.28元/股，对应2024年摊薄后静态市销率为122.51倍 [2] - 按发行价预估，上市时市值约为537.15亿元，本次公开发行7000万股新股，募集资金净额预计为75.76亿元，为年内募资金额最高的科创板新股 [2] - 公司成立于2020年，以全功能GPU为核心，提供加速计算基础设施和解决方案 [2] - 募集资金将用于新一代自主可控AI训推一体芯片、图形芯片、AI SoC芯片研发项目及补充流动资金 [2] - 财务数据显示，2022年至2024年营业收入分别为0.46亿元、1.24亿元、4.38亿元，归母净利润分别亏损18.94亿元、17.03亿元、16.18亿元 [2] - 2025年上半年实现营业收入7.02亿元，超过过去三年年度总和，归母净利润亏损2.71亿元 [2] 沐曦股份开启申购 - 公司将于12月5日开启申购，发行价格为104.66元/股，对应2024年摊薄后静态市销率为56.35倍 [3] - 按发行价格预计，上市时市值约为418.74亿元，本次发行数量为4010万股，占发行后总股本10.02% [3] - 预计募集资金总额41.97亿元，将用于新型高性能通用GPU、新一代AI推理GPU研发及产业化等项目 [3] - 公司是国内高性能通用GPU产品主要领军企业之一，致力于自主研发全栈高性能GPU芯片及计算平台 [3] - 旗舰产品曦云C系列训推一体GPU芯片在多项指标上达到国内领先水平，据测算，公司在2024年中国AI芯片市场份额约为1% [3] - 财务数据显示，2022年至2025年一季度营业收入分别为42.64万元、5302.12万元、7.4亿元和3.2亿元 [4] - 同期归属于母公司所有者的净利润分别为-7.77亿元、-8.71亿元、-14.09亿元和-2.32亿元，尚未实现盈利 [4] 行业动态 - 两家国产GPU公司摩尔线程与沐曦股份于同日（12月5日）分别进行科创板上市和申购 [1]

摩尔线程(SH:688795)

人工智能推理

曦云C系列训推一体GPU芯片

人工智能推理

曦云C系列训推一体GPU芯片

博通：AI 推理需求爆发，有望大幅上涨

美股研究社· 2025-11-28 19:06

人工智能生态系统转型 - 人工智能生态系统正从训练阶段向推理阶段转型，推理需求激增成为超大规模科技公司的强劲收入引擎 [1] - 数百万用户频繁与人工智能助手交互，使得推理成为OpenAI、谷歌等提供商的核心焦点，需要更多加速器、网络设备和互联产品以满足持续增长的需求 [1] - 博通、英伟达、字母表、微软等公司指出人工智能推理需求激增，这一快速增长将推动2026年下半年定制芯片需求上升 [1] 博通的竞争地位与机遇 - 博通凭借成功的关键要素，稳固其人工智能领域"明确老二"的地位，人工智能业务收入远超迈威尔和超威半导体等小型同行 [1][19] - 公司从推理增长曲线中看到机遇，推理领域的迫切需求可能会推动2026年下半年XPU需求加速增长 [5] - 首席执行官在最近一个季度强调，公司新增了一位客户，并获得了超过100亿美元的XPU订单，预计2026财年人工智能业务收入展望将显著改善 [5] 定制芯片的成本与性能优势 - 博通定制加速器在推理任务中的成本通常仅为英伟达GPU的数分之一，且其定制芯片的性能每一代都在持续提升 [2] - 大型科技公司通过优化算法可以从大型语言模型中榨取更高性能，这有助于降低成本同时提高特定工作负载的产出 [2] - 英伟达商用GPU的制造成本估计约为3000至5000美元，而售价却高达25000至30000美元，大型科技公司的目标是通过降低硬件成本和优化工作负载来削弱英伟达的定价权 [2] 网络产品与集群部署 - 博通致力于通过战斧6号交换机保持在网络领域的领先地位，这是行业首款102.4太比特每秒的以太网交换机，带宽较上一代翻倍 [9] - 战斧6号使10万个以上人工智能加速器的集群仅需两层架构即可部署，通过更低的延迟、更高的带宽和更低的功耗提供更出色的性能 [10] - 行业正从英伟达的GPU+InfiniBand锁定生态系统转向以太网，这一趋势利好博通，英伟达新的Spectrum-X以太网业务年化收入达100亿美元 [8] 财务表现与增长前景 - 第三季度营收达159.5亿美元，同比增长22%，环比增长6.3%，创季度营收历史新高，管理层给出第四季度营收指引为174亿美元，同比增长23.8% [11][12] - 人工智能半导体业务营收同比激增63%，达52亿美元，占半导体业务收入的57%，占公司总营收的33%，管理层指引第四季度人工智能业务收入为62亿美元，环比增长约19% [13] - 假设公司在2027财年能够维持超过60%的同比增长，那么其人工智能业务收入将接近540亿美元，占公司总营收的比例约为50% [5] 盈利能力与现金流 - 非GAAP每股收益同比增长36.3%，超过22%的营收增长，2026财年调整后每股收益预计同比增长37.9%，达9.31美元 [16] - 公司实现均衡的盈利能力，调整后息税折旧摊销前利润率为67.1%，调整后净利润率达52.7% [14][18] - 自由现金流同比增长46.6%，达70.2亿美元，自由现金流利润率为44%，现金储备达107亿美元，债务降至642亿美元 [18][22] 行业趋势与客户动态 - 大型科技公司在博通的定制芯片客户名单中占据重要地位，包括谷歌和元宇宙，字节跳动于去年夏天成为第三大客户，公司在第三季度还新增了一位客户 [2] - 行业正迈向百万级以上加速器集群的目标，公司三位超大规模客户（现已增至四位）均计划在2027年底前部署100万个XPU集群 [8] - 谷歌宣布其第七代张量处理单元Ironwood是首款专门为推理设计的TPU，提供两种配置，其中9216芯片的性能高达42.5艾字节每秒 [4]

博通(US:AVGO)

人工智能推理

网络交换机

战斧 6 号（Tomahawk 6）

人工智能推理

网络交换机

战斧 6 号（Tomahawk 6）

从iPhone17热卖到“AI推理超级蓝海” 苹果(AAPL.US)悄然踏向新一轮牛市轨迹

智通财经网· 2025-09-30 12:43

iPhone 17系列需求分析 - iPhone 17系列交付周期为19天，远高于iPhone 16系列的5天初步交付周期，表明换机需求非常强劲[2] - 中国市场iPhone 17标准款发货日期最长，为25天，其他国际地区整体约为18天，凸显标准款需求之强劲[3] - iPhone 17 Pro交付时间为14天，iPhone 17 Pro Max交付时间则长达21天，Pro Max机型交付时间小幅高于去年[3] - 美国运营商渠道的iPhone 17 Pro交付周期仅约9天，优于苹果自营渠道的两到三周[3] - 中国市场因政府对低于6000元人民币的消费电子产品提供补贴以及iPhone Air供应不足，iPhone 17标准系列可能卖得非常好[3] - iPhone Air全球平均发货日期仅为三天，表明起始库存更高，苹果已预期到其强劲需求[4] 苹果公司市场表现与预期 - 自9月以来，苹果股价强势反弹超10%，分析师普遍看好股价冲击300美元大关[2] - 截至周一美国股市收盘，苹果股价收于254.430美元，市值稳定在3.8万亿美元，仅次于英伟达与微软[2] - 苹果生态的活跃设备已达23.5亿，系统层集成推理能力可使开发者触达海量终端用户[7] - Apple Intelligence优先本地运行，必要时通过Private Cloud Compute调用云端AI大模型，提供可验证透明性与最小数据驻留[7] AI推理市场前景 - 预计到2030年AI推理系统将带来万亿美元级别市场，企业侧推理成本规模保守估计约为1.3万亿美元，2025-2030年期间预期复合年增长率约为67%[5][6] - AI基础设施支出在2030年前将达到3万亿至4万亿美元，给英伟达等公司带来重大长期增长机遇[5] - 模型持续改进与更新迭代是关键的领先指标，超大规模资本开支可能是一个滞后指标[6] - 苹果被认为是人工智能推理革命的最佳入口之一，人工智能布局最优且最有望受益[6]

苹果(US:AAPL)

人工智能推理

iPhone 17 Pro Max

人工智能推理

iPhone 17 Pro Max

NPU，大有可为

半导体行业观察· 2025-08-28 09:14

AI推理市场趋势 - 全球AI推理市场规模预计从2024年106亿美元增长至2030年255亿美元年均增长率达19% [2] - 行业正减少对GPU依赖转向低功耗高效率的专用芯片NPU（神经处理单元） [2] - NPU因满足高推理吞吐量、低延迟和高能效需求而成为增长核心 [2] NPU技术竞争格局 - CPU和GPU市场进入技术成熟阶段推理型AI半导体转向ASIC架构的NPU [2] - 美国初创公司Sambanova采用数据流架构NPU 集成专有软件覆盖LLM训练与推理 [3] - Grok量产专用推理芯片通过云服务实现百万令牌级实时推理商业模式聚焦LLM服务而非硬件销售 [3] 行业竞争战略 - 企业需确保能效显著优势数据中心功耗已成AI应用主要瓶颈 [3] - 定制化市场成为关键策略针对电信、金融、国防等行业定制推理NPU [3] - 硬件与软件生态整合成为核心竞争力 Sambanova通过捆绑模式获得政府及金融机构客户 [3]

人工智能推理

高效率ASIC（专用集成电路）

神经处理单元 (NPU)

GPU（图形处理单元）

人工智能推理

高效率ASIC（专用集成电路）

神经处理单元 (NPU)

GPU（图形处理单元）

华为发布AI黑科技UCM，下个月开源

证券时报网· 2025-08-12 17:23

文章核心观点 - 华为发布AI推理创新技术UCM，旨在解决AI推理领域的高延迟和高成本挑战，通过提升推理效率和降低时延来改善用户体验，并计划通过开源推动行业标准形成 [1][3][4] 技术发布与背景 - 华为于8月12日举行发布会，正式推出AI推理技术UCM [1] - 国外主流模型的单用户输出速度已达200 Tokens/s（时延5ms），而中国普遍小于60 Tokens/s（时延50-100ms），凸显推理效率差距 [1] - AI推理的高延迟和高成本是当前行业发展的主要挑战 [1] 技术原理与性能提升 - UCM是一款以KVCache为中心的推理加速套件，通过分级管理KVCache记忆数据来扩大推理上下文窗口，实现高吞吐、低时延 [1] - 通过层级化自适应的全局前缀缓存技术，UCM可在多轮对话等场景中直接调用KV缓存数据，避免重复计算，使首Token时延最大降低90% [2] - UCM根据记忆热度在HBM、DRAM、SSD等存储介质中自动分级缓存，融合稀疏注意力算法，使长序列场景下TPS（每秒处理token数）提升2-22倍 [2] - 通过动态KV逐层卸载等技术，UCM将超长序列Cache分层卸载至外置存储，实现10倍级推理上下文窗口扩展 [2] 行业现状与商业影响 - 中国互联网企业在AI领域的投资规模仅为美国的十分之一，国内大模型推理体验与海外存在差距 [3] - 推理体验不足会导致用户流失，进而减缓企业投资，形成恶性循环 [3] - UCM可在算力投入不变的前提下优化推理体验，推动“体验提升-用户增长-投资加大-技术迭代”的商业正循环 [3] - 随着AI应用渗透，用户请求量和生成Token数激增，例如火山引擎2025年5月日均Token调用达16.4万亿，较2024年同期激增137倍 [4] - 巨大的Token处理量带来高昂运营成本，保障流畅体验需加大算力投入，平衡成本与体验成为行业难题 [4] 应用试点与开源计划 - UCM已在中国银联的“客户之声”、“营销策划”、“办公助手”三大业务场景开展智慧金融AI推理加速应用试点 [3] - 华为计划于2025年9月正式开源UCM，届时将在魔擎社区首发，并逐步贡献给主流推理引擎社区 [4] - 开源目的是推动行业内更多企业共同形成推理框架和标准，加速推理领域发展 [4]

人工智能推理

UCM（推理记忆数据管理器）

人工智能推理

UCM（推理记忆数据管理器）

北京亦庄发布“具身智能机器人十条”；华为即将发布AI推理领域突破性成果丨数智早参

每日经济新闻· 2025-08-11 07:21

具身智能机器人政策 - 北京亦庄发布《关于推动具身智能机器人创新发展的若干措施》专项政策，聚焦软硬技术协同攻关、数据要素先行先试、应用场景牵引推广等关键领域 [1] - 政策包含全国首创的8条支持措施，如数据采集实训场奖励、二次开发社区支持、供应链响应平台支持等 [1] - 目标是通过政策支持加快具身智能机器人创新发展，抢占全球机器人产业制高点 [1] - 机器人产业正经历从技术导向到需求导向、从概念验证到商业落地的关键拐点 [1] 华为AI推理技术突破 - 华为将于8月12日发布AI推理领域突破性技术成果，可能降低中国AI推理对HBM技术的依赖 [2] - 该技术有望提升国内AI大模型推理性能，完善中国AI推理生态 [2] - 成果落地将提升自主可控能力，减少关键环节对外依存度，保障AI基础设施安全 [2] - 技术突破将激活推理性能与应用生态，助力金融等高实时性场景的AI应用落地 [2] OpenAI发布GPT-5 - OpenAI正式发布GPT-5，新模型可实现即时按需的软件开发，将改变工作、学习和创新方式 [3] - GPT-5在健康建议方面能力显著提升，答案更准确，幻觉更少，能提供更可靠的病因和应对措施 [3] - OpenAI CEO预测2035年AI工具可帮助治愈或有效治疗许多当前困扰人类的疾病 [3] - 展望GPT-8时代，AI工具或能治疗某种癌症，可能重构科学发现与医疗研发范式 [3]

机器人(SZ:300024)

人工智能推理

具身智能机器人

人工智能推理

具身智能机器人

AI芯片公司，估值60亿美元

半导体芯闻· 2025-07-10 18:33

融资动态 - 美国半导体初创公司Groq正与投资者商谈筹集3亿至5亿美元资金，投资后估值达60亿美元[1] - 2023年8月Groq在D轮融资中筹集6.4亿美元，估值28亿美元，由思科投资、三星催化基金和贝莱德私募股权合作伙伴领投[4] 业务发展 - Groq与沙特阿拉伯签署协议，预计该合同将为公司带来约5亿美元年收入[2][3] - 公司在欧洲建立首个数据中心，选址芬兰赫尔辛基，与Equinix公司合作，旨在加快国际扩张步伐[5] - 目前在美国、加拿大和沙特阿拉伯均设有采用其技术的数据中心[6] 技术优势 - 公司专注于生产优化AI推理速度的芯片，其LPU（语言处理单元）专为推理而非训练设计[5] - LPU芯片可执行预训练模型命令，实现对实时数据的解读，类似聊天机器人生成答案的机制[5] - 在AI推理领域面临SambaNova、Ampere、Cerebras和Fractile等初创企业的竞争[5] 市场战略 - 瞄准欧洲对AI服务增长的需求，北欧地区因可再生能源和凉爽气候成为投资热点[5] - 通过Equinix数据中心部署LPU，使企业能便捷访问其推理能力[6] - 顺应欧洲"主权AI"趋势，本地化数据中心布局可提升服务响应速度[6] 行业背景 - 英伟达凭借GPU主导AI模型训练芯片市场，但推理领域存在更多竞争机会[5] - 英伟达近期在欧洲签署多项数据中心基础设施协议，显示该地区战略重要性[5]

人工智能推理

主权人工智能

语言处理单元(LPU)

图形处理单元(GPU)

人工智能推理

主权人工智能

语言处理单元(LPU)

图形处理单元(GPU)

AI芯片新贵Groq在欧洲开设首个数据中心以扩大业务

智通财经网· 2025-07-07 15:03

公司动态 - 人工智能半导体初创公司Groq宣布在欧洲建立首个数据中心，选址芬兰赫尔辛基，与Equinix公司合作 [1] - Groq公司估值28亿美元，获得三星和思科投资部门支持 [1] - Groq设计的语言处理单元(LPU)芯片专为人工智能推理而非训练设计，功能类似热门聊天机器人生成答案 [1] - Groq目前在美国、加拿大和沙特阿拉伯设有采用其技术的数据中心 [2] 行业趋势 - 欧洲对人工智能服务需求增长，吸引美国公司加大投资，北欧地区因可再生能源和凉爽气候受青睐 [1] - 英伟达首席执行官黄仁勋近期在欧洲签署多项基础设施协议，包括数据中心建设 [1] - 人工智能推理芯片市场竞争激烈，除Groq外，SambaNova、Ampere、Cerebras和Fractile等初创企业参与竞争 [1] 技术合作 - Equinix作为全球数据中心建设商，连接亚马逊、谷歌等云服务提供商，简化企业使用多供应商流程 [2] - Groq的LPU将安装在Equinix数据中心，企业可通过Equinix访问Groq的推理能力 [2] 政策环境 - 欧洲政客推动"主权人工智能"理念，要求数据中心设在本地区以提升服务速度和数据主权 [2]

人工智能推理

主权人工智能

语言处理单元(LPU)

图形处理单元(GPU)

人工智能推理

主权人工智能

语言处理单元(LPU)

图形处理单元(GPU)