AI推理市场趋势与份额预测 - 至2030年,预计AI推理在整个AI计算市场将占到80%的份额 [1][2] - 聚焦于极致推理的AI芯片,未来会有更强的爆发性 [1][2] - 业内普遍认为,2026年全球AI推理的需求将超过AI训练场景 [1] 推理算力需求增长驱动因素 - 未来推理请求量与并发数将大幅增加,推理算力需求呈指数级攀升 [2][3] - 以智能体为代表的人工智能新应用爆发,AI智能体整体算力消耗可达同参数规模大语言模型的10倍以上 [3] - 对智能算力的需求呈数量级跃迁 [3] 行业龙头动向与战略收购 - 全球AI算力龙头正处于由训练转向推理的阶段 [4] - 英伟达以200亿美元(约合1400亿元)收购AI推理芯片初创企业Groq的技术授权,是其迄今规模最大的一笔收购 [2][4] - Groq专注极致推理,其LPU架构曾宣称推理性能是英伟达H100 GPU的10倍,而成本仅为其十分之一 [4] 国内外极致推理芯片厂商布局 - 美国有Etched.ai、Groq等主打极致推理芯片路线的企业,其核心逻辑是大模型架构已经收敛,因此专注于打造最快的AI推理芯片 [4] - 国内企业曦望Sunrise推出了聚焦于大模型推理的GPGPU芯片启望 S3,在主流大模型推理场景中,单位Token推理成本较上一代降低约90% [4] - 曦望联合商汤科技、第四范式等,发起“百万Token一分钱”推理成本计划,目标是把百万Token的推理成本降低至1分钱 [4] 训练与推理芯片市场格局对比 - AI训练芯片赛道逐渐收敛,已经变成头部玩家的游戏,能做预训练大模型的公司数量有限 [6] - 推理赛道尚未收敛,AI智能体、大语言模型、具身智能模型、世界模型等都需要芯片做推理任务 [6] - 相比英伟达在训练端一家独大,推理端技术路线呈现百花齐放态势,为国产AI芯片厂商带来机遇 [6] 国产AI芯片市场前景与估值 - 英伟达市值达到4万亿美元,而中国或许将出现多家市值数千亿甚至万亿人民币的GPU公司 [6] - 中国AI产业呈现区域化发展特征,国内不同GPU企业在各自优势地域市场占据主导 [6] - 互联网巨头除自研芯片外,也在采购国产芯片,并已形成深度合作伙伴关系 [6] - 即便以4万亿人民币计算,中国GPU市场依然蕴藏着巨大的增长空间 [6] AI应用落地与市场渗透加速 - AI应用的月活用户规模已经破亿,其增长速度和行业渗透率远超当年的互联网产品 [7] - 百度、腾讯宣布旗下AI应用将在今年春节期间发放数亿元红包,阿里通义千问也计划加入 [7] - 花旗研报表示,春节活动能有效帮助互联网大厂吸引关注,预计新春推广活动后,中国AI应用的普及进程有望进一步加速 [7] - 春节后,中国的AI渗透率、使用率会进一步提升,代表整个AI产业价值的提升 [9] AI产业价值分布与未来展望 - 在现阶段的AI产业架构中,最底层的芯片占据了整个AI产业价值70%甚至90% [10] - 展望未来,AI芯片或许仍会占据整体AGI(通用人工智能)价值的大头 [11] - 一旦AGI时代到来,机器人数量超过人类,需要进行7×24小时的推理,推理需求将没有天花板 [10] - 随着AGI时代来临,需要构建一个普惠的推理算力网络,服务于机器人、终端设备、消费者和企业 [10]
英伟达砸1400亿,这一芯片风口来了