Workflow
推理芯片
icon
搜索文档
技术破局|爱芯元智港股上市:角逐边缘推理主战场,旗舰智驾芯片M97回片成功
每日经济新闻· 2026-02-12 18:06
行业趋势:AI推理芯片成为焦点 - 2025年是AI智能体兴起之年,2026年或将成为AI智能体大爆发之年,行业焦点从训练转向推理 [1] - 随着Agentic AI(代理型AI)盛行,业界对AI芯片的需求从堆叠算力转向追求好用、效率与低延时 [3] - 执行GPT-3.5级别系统推理的成本在2022年11月至2024年10月间骤降280多倍,硬件层面年化成本降幅达30%,能效年提升率达40% [3] - 常规模型API输出价格已降至10元/百万Tokens以下,甚至有厂商喊出百万Tokens一分钱的口号 [3] - 全球AI推理芯片市场规模预计从2024年至2030年以31.0%的年复合增长率增长 [5] - 其中,云端推理、边缘推理和端侧推理的年复合增长率预计分别为36.3%、42.2%和20.4%,边缘推理增长潜力最大 [5] - 预计到2030年,边缘推理全球市场规模达7262亿元,端侧推理达8861亿元,合计市场规模超1.5万亿元 [6] 公司定位:边缘与端侧推理芯片的领先者 - 爱芯元智是“中国边缘AI芯片第一股”,是国内边缘侧、端侧推理芯片的佼佼者 [1] - 公司通过底层架构创新,构建了以“双轨开发模式”为核心的技术护城河 [3] - 核心技术支柱为自研的爱芯通元(AXNeutron)混合精度NPU和爱芯智眸(AXProton)AI-ISP [3] - 公司的NPU采用多线程、异构式多核设计,能动态选择INT4、INT8、INT16等数值精度以提升效率 [4] - 根据灼识咨询数据,该NPU的每瓦吞吐量比基于GPU架构的传统解决方案提升高达10倍 [4] - 公司提供从芯片到软件工具链的完整“交钥匙”方案,其自研的Pulsar2工具链集成了模型转换、量化与编译等功能 [8] 市场表现与业务进展 - 在视觉AI端侧推理市场,公司2024年出货量超900万颗,排名前五,市场份额为6.8% [6] - 在中高端芯片细分市场,公司以24.1%的份额高居榜首 [6] - 在国内边缘AI市场,公司2024年出货量达10万颗,市场份额为12.2%,位居第三 [6] - 在智能汽车芯片方面,截至2025年9月30日,公司SoC累计出货量已超51万颗,并获得多家头部车企及Tier 1的定点项目 [7] - 面向高阶智能驾驶的旗舰芯片产品M97已于近日回片并顺利点亮,是公司智能汽车业务迈向高端化的核心产品 [8]
高通,遭受重创
半导体芯闻· 2026-02-05 18:19
如果您希望可以时常见面,欢迎标星收藏哦~ 高通公司警告称,内存价格飙升将导致智能手机行业增速放缓,这一消息令投资者感到恐慌,导致 该公司股价下跌了 11%。 尽管人工智能正在扰乱高通的智能手机业务,但该公司也在试图凭借其自主研发的推理芯片,从人 工智能芯片的蓬勃发展中分一杯羹。阿蒙表示,高通已开始向其唯一确认的客户——Humane公司 ——交付产品,并正在帮助该公司运行第三方工作负载。 阿蒙表示:"你可能会认为,像我们这样规模的公司会与业内一些最大的超大规模数据中心和云服 务提供商展开对话。"他还补充道:"我们目前进展顺利。"人工智能芯片的收益将于明年到账。 阿蒙表示,高通在机器人、汽车和专利许可交易领域也拥有光明的前景。这位首席执行官希望所有 这些领域都能帮助高通实现收入多元化增长,从而在2029年之前实现公司对智能手机依赖程度降 低的目标。 目前,高通仍然依赖智能手机收入,投资者认为这些业绩意味着其股价应在每股 134 美元左右, 远低于当天早些时候他们愿意支付的 150 美元以上。 首席执行官克里斯蒂亚诺·阿蒙在芯片设计公司 2026 年第一季度财报电话会议上宣布,公司营收 达到 123 亿美元,创历史 ...
未知机构:DCJSJ涨价涨价都在涨价-20260128
未知机构· 2026-01-28 09:50
纪要涉及的行业或公司 * **行业**: 人工智能(AI)产业链,特别是上游算力(CPU、GPU、云服务、CDN)及下游应用(Agent、SaaS)[1] * **公司**: 海光信息、协创数据、金山云、网宿科技、云天励飞[1] 核心观点和论据 * **核心观点**: AI产业链正经历全面的“涨价潮”,这一趋势从上游核心部件开始蔓延,并可能传导至更广泛的领域[1] * **核心论据**: 涨价由两方面叙事驱动,一是下游Agent侧的健康需求,二是上游核心部件侧的供给紧张[1] * **具体涨价环节与对应公司**: * **CPU涨价**: 涉及海光信息等公司[1] * **GPU租金涨价**: 涉及协创数据等公司[1] * **云服务涨价**: 涉及金山云等公司[1] * **CDN涨价**: 涉及网宿科技等公司[1] * **投资建议**: 持续看好并建议顺势而为[1] * **后续蔓延方向**: 涨价趋势可能进一步蔓延至供电和SaaS领域[1] * **根源分析**: 本轮涨价的根源在于Agent的火爆,最终将传导至应用软件[1] 其他重要内容 * **对特定公司的提示关注**: 重点关注云天励飞[1] * **供给端**: 公司自去年起已全面转向自研推理芯片[1] * **需求端**: 在计算资源涨价周期中,长尾需求有望部分向二线厂商转移[1] * **潜在催化剂**: 近期可期待其自研推理芯片的产业落地[1] * **关联推荐**: 全面推荐逻辑可参考过往关于“国产AI”的论述[1]
推理需求超越训练,这种芯片为何成为汽车智能化决胜关键?
中国汽车报网· 2026-01-26 16:52
核心观点 - AI推理芯片正成为汽车智能化,特别是自动驾驶领域的关键决胜因素,市场需求已超越训练芯片并持续增长 [2][3][4] 市场趋势与需求转变 - AI芯片市场增长点正从模型训练转向推理,IDC数据显示推理芯片需求已反超训练芯片,成为数据中心算力和智能驾驶应用的新主力 [4] - 行业预言,随着自动驾驶等汽车智能化需求的快速增长,2026年推理芯片占比还将进一步大幅增加 [3] - OpenAI与Cerebras签署协议,计划在2026至2028年间将750MW规模的Cerebras芯片集成到其AI推理计算资源库中,这一部署专门为AI推理服务 [2] 推理芯片的技术与成本优势 - 相比训练芯片,推理芯片可直接应用于自动驾驶等终端设备,没有高功耗、高成本、依赖云端数据中心的短板 [5] - 训练芯片满载运行时功耗高,产生高昂电费成本,且研发生产成本极高,价格动辄数万甚至数十万元 [5] - 新一代推理芯片采用7nm甚至更先进的制程工艺,在保证高性能运算的同时大幅降低能耗 [8] - 推理芯片针对自动驾驶核心任务进行定制化神经网络加速器设计,实现算力与场景的精准匹配,提高处理效率和准确性 [9] 在自动驾驶中的关键作用 - 自动驾驶汽车已成为高度集成的智能移动终端,需要推理芯片提供强大的实时算力支持,以对环境做出迅速准确的判断 [6] - 一辆L4级别自动驾驶汽车正常行驶时,每秒产生的数据量可达数GB,这些海量数据需在极短时间内被处理分析 [6] - 推理芯片具备强大的边缘计算能力,能在车内直接完成数据处理,无需依赖云端传输,确保毫秒级的实时响应 [7] - 推理芯片通过内置神经网络算法,能准确识别行人位置、动作和行进方向,结合雷达数据计算距离和速度,迅速向控制系统发出指令 [7] 车规级应用面临的挑战 - 车规级认证是推理芯片进入汽车市场的第一道门槛,其可靠性和稳定性要求比消费级芯片高出数倍 [10] - 芯片需要通过一系列严苛环境测试,例如在150℃高温环境下持续存储数千小时,以确保全生命周期内稳定运行 [10] - 算法适配是关键挑战,推理芯片需与不同车企各具特色的自动驾驶算法深度融合,要求芯片厂商与车企、Tier1供应商紧密合作构建闭环生态 [11] - 成本控制是推动推理芯片从高端车型向量产车型普及的关键,需在保证性能和质量的前提下优化设计和生产工艺以控制成本 [11] 未来前景与行业影响 - 推理芯片的崛起标志着AI及自动驾驶产业进入新阶段,解决了AI落地应用中的成本、延迟和隐私等核心痛点 [11] - 随着自动驾驶技术从L2向L5演进,对推理芯片的算力、能效和稳定性提出了更高要求 [12] - 未来,高性能、低成本的推理芯片将成为定义下一代智能汽车形态的关键因素 [12] - 车企将围绕推理芯片展开更激烈竞争,通过与芯片厂商深度合作打造更具竞争力的自动驾驶解决方案,推动产业向更高水平发展 [12]
上海:龙腾虎跃闹“芯”春
新华网· 2026-01-26 10:13
文章核心观点 - 上海作为中国集成电路与人工智能产业的核心高地,其产业规模快速增长,资本市场活跃,一批“上海芯”与AI企业密集上市并快速发展,展现出强大的产业集聚效应和创新活力,这得益于上海前瞻性的战略布局、完善的产业生态和全周期的资本支持 [1][3][6][11] 上海集成电路与人工智能产业宏观态势 - 上海人口占全国2%,但算力占全国八分之一,凸显其算力枢纽地位 [1] - 2025年上海集成电路产业营收规模超4880亿元,五年间翻了一番 [1] - 2025年上海规上人工智能产业规模预计超5500亿元,增速超30%,创下新纪录 [1] - 2025年上海地区生产总值突破5.67万亿元,同比增长5.4%,其中集成电路制造业和人工智能制造业产值分别增长15.1%和13.6% [7] - 在世界集成电路协会《全球集成电路产业综合竞争力百强城市》最新排名中,上海位列全球第四、国内第一 [8] 通用GPU市场与“上海芯”企业动态 - 中国通用GPU市场快速扩张,2024年出货量达160万片,2022至2024年复合增长率为72.8%,预计2025至2029年出货量以33%的复合增长率上升 [3] - 国产通用GPU产品市场份额从2022年的8.3%提升至2024年的17.4%,预计到2029年将超过50% [3] - 壁仞科技成为“港股GPU第一股”,是港股18C章特专科技公司上市机制落地以来发行规模最大的新股 [3] - 天数智芯2025年上半年通用GPU出货量交付约1.5万片,接近2024年全年约1.7万片水平,其产品及解决方案已覆盖金融、医疗、交通等领域,促成超过900项部署及应用 [3] - 沐曦股份三大产品系列中,主打推理和训推一体的多款芯片已进入规模量产阶段 [4] - 燧原科技在科创板IPO获得受理 [3] - 上海已建成全产业链的集成电路体系,在芯片设计、制造、封测,设备/材料、EDA/IP等环节培育了一批细分领域龙头企业,包括35家科创板上市企业,位列国内第一 [8] 人工智能大模型与创新企业 - 稀宇科技(MiniMax)专注于多模态通用人工智能技术,累计为超200个国家及地区的逾2.12亿名个人用户、超100个国家及地区的企业客户及开发者提供服务,海外收入占比超70% [4] - MiniMax在2025年将其视频模型从Video 01系列升级到Hailuo 02系列,做到了全球前二,两代视频模型帮助用户生成超过5.9亿个视频 [4] - 稀宇科技自成立至2025年9月累计花费5亿美元,约为OpenAI同期花销的1% [5] - 短短1个多月来,上海已有5家人工智能硬核企业登陆资本市场 [6] - 全国首个大模型创新生态社区“模速空间”成立2年多来,吸引了超200家AI企业入驻,带动所在徐汇区集聚超1500家AI企业,其中约800家为大模型企业,大模型备案数量占全市60% [9] - 无问芯穹专注于人工智能基础设施,通过“多元异构、软硬协同”技术让不同芯片协同工作以降低算力成本,公司现有200多名员工,是“模速空间”里体量最大的企业 [9][10] 前沿技术创新与产业生态 - 曦智科技提出用光子替代电子进行AI计算,2025年推出了首款支持科学计算和复杂商业算法的光电混合计算加速卡,并发布了首款光互连光交换GPU超节点解决方案 [8] - 曦智科技预测未来3至5年,光芯片在数据中心中的占比将会达到30%以上 [9] - 上海已形成“一东一西、一软一硬”的差异化发展格局,重点建设浦东张江和徐汇北杨两个人工智能创新小镇,累计集聚人工智能企业300余家、创新人才6000余人 [12] - 上海通过“链主牵引”与“投孵联动”模式,打造低创新成本、高智力密度的发展环境 [12] 资本与政策支持体系 - 壁仞科技是上海国投先导人工智能产业母基金的首个直投项目,2025年3月该基金联合领投壁仞科技数亿元 [11] - 上海国投已建立全周期基金矩阵,组建1050亿元规模的三大先导产业母基金和未来产业基金,形成对核心技术突破、产业链组织、成果转化的长周期支持机制 [11] - 国资平台根据GPU研发的长周期特性匹配融资节奏,保障企业研发投入的连续性,避免为短期现金流牺牲长期技术路线 [11] - 政府部门积极为企业创新产品对接试点客户和试用场景,对早期产品迭代起到至关重要的作用 [12]
云天励飞董事长陈宁:聚焦推理芯片与智能硬件赛道
搜狐财经· 2026-01-14 19:01
行业趋势 - 从2025年到2026年,人工智能行业正在转向 [1] 公司战略 - 云天励飞正深耕推理芯片与智能硬件赛道 [1]
大摩:对中国芯片设备企业持积极看法 看好中芯国际
智通财经· 2026-01-08 11:08
核心观点 - 摩根士丹利看好中芯国际,认为其是中国人工智能本地化的关键支持者 [1] - 先进逻辑芯片需求将保持强劲 [1] - 对中国芯片设备企业持积极看法 [1] 行业趋势与需求 - 云服务提供商是否获准采购所有H200芯片存在不确定性,因其可能影响国产芯片的普及 [1] - 预计云服务提供商将结合使用H200与本地芯片,特别是在推理需求方面 [1] - H200芯片有助于满足中国的AI训练需求,并可能催生更多对推理芯片的需求,从而扩大整体市场需求 [1] - 预计AI资本支出将有所增长 [1] 市场与自给率预测 - 预计中国芯片自给率将从2024年的24%提升至2027年的30% [1]
云天励飞董事长陈宁:AI推理时代已至 推理芯片崛起将是中国科技复兴巨大机遇
每日经济新闻· 2025-12-29 20:33
人工智能产业发展阶段 - 人工智能产业发展可划分为三个阶段:2012至2020年为“智能感知”时代,以小模型驱动特定场景解决方案为主,市场碎片化[4];2020至2025年为AIGC时代,大模型展现强大内容生成能力,行业寻找盈利闭环[4];2025年进入第三个阶段“代理式人工智能(Agentic AI)时代”,其核心特征是大模型、操作系统与硬件深度融合的智能体(Agent)引发应用爆发[4] 算力范式革命与产业机遇 - 2025年被视为AI应用爆发元年,应用爆发背后是百倍增长的推理算力需求与高昂成本之间的矛盾[1] - 算力范式正从以训练为主转向以推理为主,这是根本性转折,训练追求极致性能,而推理大规模商业化必须追求极高的性价比[5] - 推理芯片赛道的崛起打破了英伟达凭借CUDA生态和GPGPU在训练时代建立的垄断格局,谷歌TPU战略明确“训推分离”,博通为Meta、OpenAI定制推理芯片,证明了该赛道的独立性与巨大潜力[6] - 推理芯片是中国实现“超车”的关键机遇,全球刚刚起步,游戏规则不同,中国在应用、数据、能源、系统集成方面有优势,更擅长为用户提供高性价比产品[3][6] 推理芯片的技术挑战与架构创新 - 推理任务的计算范式发生根本变化,尤其是Prefill(预填充)和Decode(解码)两个阶段对算力和带宽需求不同,传统GPGPU架构面临瓶颈[7] - 云天励飞提出了新的GPNPU芯片架构,旨在融合三大核心能力:顶层结合GPGPU的SIMT编程范式以兼容CUDA生态;结合指令集微架构设计优化矩阵计算硬件;基于国产工艺和先进封装技术打破内存瓶颈并降低成本[7] - GPNPU目标是在计算算力、存储带宽、存储容量三者间实现更优配比,通过提升单位硅芯片面积的计算性能、降低模型迁移成本、提升硬件利用率以及实现高能效低功耗,全方位降低用户的总体拥有成本[7] 推理需求的规模与成本目标 - 以豆包大模型为例,其日均Token处理量已达50万亿且增速惊人,即便以此为基础不再增长,大规模在线推理的资本与运营开支也非常可观[8] - 若Token规模短期继续上行,明年上半年可能触及100万亿,在单位能效无显著改善的情况下,电力与散热等基础设施压力可能出现“千倍级”跃迁[8] - 为支撑AI规模化、产业化,需在较短周期内把“百万Token”的推理综合成本降低到“一分钱”级别,这需要通过架构革命和工艺创新实现[8]
英伟达重磅结盟 取得AI新创Groq推理芯片技术授权 台链沾光
经济日报· 2025-12-26 07:12
核心交易内容 - 英伟达与AI新创公司Groq达成非独家推论技术授权协议 授权英伟达使用Groq的推理芯片技术 并将整合至其未来产品的芯片设计内[1] - 交易财务细节未公开 但CNBC披露英伟达将为此支付约200亿美元 是英伟达最大手笔的结盟案[1] - 根据协议 Groq共同创始人罗斯 总裁马德拉及其他团队成员都将加入英伟达 帮助推进并扩大Groq的授权技术 但Groq仍将继续以独立公司运营[2] 交易战略意图与行业影响 - 业界看好此次结盟有助英伟达持续强化推论技术布局 稳固市场领导地位[1] - 英伟达CEO黄仁勋表示 公司规划将Groq的低延迟处理器整合到英伟达AI工厂架构 扩大平台到更广泛的AI推论与即时工作负载[1] - 黄仁勋强调 英伟达并未收购Groq整间公司 而是引进其人才并取得知识产权[1] - 外媒分析 此交易架构类似Meta投资Scale AI的方式 得以避开反垄断当局的监管审查 反映大型科技公司在全球反垄断监管审查趋严的环境下 调整交易结构以降低监管风险 在AI竞争加剧之际 可能成为AI厂商投资的新模式[1] 合作方Groq背景与技术 - Groq成立于2016年 曾被评选为美国十大国家安全科技公司之一 专攻推论相关业务 打造推理专用芯片与AI推理平台系统[2] - 该公司与美国能源部 Meta等都有所合作[2] - Groq共同创始人罗斯是Google TPU的催生者之一 开发专为推论设计的语言处理器 号称具备低功耗 高效应对等效能[2] 产业链影响 - 此次结盟被看好将带旺台积电 鸿海 广达 纬创等中国台湾合作伙伴[1]
专访云天励飞董事长陈宁:AI推理时代已至,推理芯片崛起将是中国科技复兴巨大机遇
每日经济新闻· 2025-12-24 16:35
行业趋势:AI产业从训练转向推理的范式革命 - 2025年被业界视为AI应用大爆发的元年,智能体正从概念走向现实,应用爆发的背后是百倍增长的推理算力需求与高昂成本之间的矛盾 [2] - 人工智能产业发展分为三个阶段:2012-2020年为“智能感知”时代;2020-2025年为“AIGC”时代;2025年进入“Agentic AI”时代,核心特征是应用爆发,所需算力从以训练为主转向以推理为主 [3] - 从训练到推理是根本性转折,训练追求极致性能和迭代速度,而推理要大规模商业化必须追求极高的性价比 [3] - 这一转变打破了英伟达凭借CUDA生态和GPGPU在训练时代建立的垄断格局,为全球参与者提供了新机遇 [4] 市场机遇:中国在推理芯片赛道的“超车”机会 - 推理芯片赛道是中国实现“超车”的关键,中国第一次与全球站在相近的起跑线 [2] - 在训练赛道上,由于先进制程受限和CUDA生态壁垒,中国追赶英伟达差距较大,但在推理赛道上全球都刚刚起步,游戏规则不同 [5] - 推理更接近应用场景,需要为用户提供更高性价比的产品,这正是中国产业所擅长的,推理芯片的崛起将是中国科技复兴的巨大机遇 [5] - 市场规律证明了推理赛道的不可替代性,谷歌在TPU战略中明确“训推分离”,博通为Meta、OpenAI定制推理芯片,都证明了独立推理赛道的崛起与巨大潜力 [5] 技术挑战与解决方案:降低推理综合成本 - 面对推理时代的需求,一味模仿英伟达的GPGPU架构并非出路,推理任务的计算范式发生根本变化,“Prefill”和“Decode”两个阶段对算力和带宽的需求截然不同 [6] - 公司提出了新的“GPNPU”架构,旨在融合三大核心能力:结合GPGPU的SIMT编程范式以兼容CUDA生态;结合指令集微架构设计优化矩阵计算硬件;基于国产工艺和先进封装技术打破内存瓶颈 [6] - GPNPU目标是在计算算力、存储带宽、存储容量三者间实现更优配比,通过高能效、低功耗等技术降低运营能源成本,全方位降低用户的总体拥有成本 [6] - 为支撑AI规模化产业化,需要在较短周期内把“百万token”的推理综合成本降低到“一分钱”级别,这需要通过架构革命和工艺创新实现 [7] 市场需求与规模:推理算力需求呈爆炸性增长 - 以豆包大模型为例,其日均Token处理量已达50万亿且增速惊人,即便以此为基础不再增长,大规模在线推理的资本与运营开支也非常可观 [7] - 有媒体报道称字节跳动2026年AI基建相关资本开支预算约1600亿元,反映出头部厂商对推理基础设施的投入强度显著抬升 [7] - 若token规模短期继续上行,明年上半年可能触及100万亿,在单位能效无显著改善的情况下,电力与散热等基础设施压力可能出现“千倍级”的数量级跃迁 [7]