行业投资评级 - 看好计算机行业 [3] 报告核心观点 - 从GTC2026看AI芯片新趋势,为Agentic LLM服务,看好技术实力全面的芯片厂商,推理系统复杂化对计算、存储、通信提出更高要求 [5] - 物理AI正从技术框架走向应用落地,英伟达从算力供应商延伸为现实世界智能的平台型公司,产业逻辑正由“展示能力”转向“交付能力” [5] - 机器人大脑将成为人形机器人智能化和差异化的核心引擎,2026年有望推动人形机器人从技术展示向智能化应用交付全面跃迁 [5] 从GTC看AI芯片新趋势:为Agentic LLM服务 - GTC2026主旨为功能机架独立部署,推理硬件堆栈全面加强,英伟达以Rubin/Rubin Ultra GPU为训练核心与高吞吐推理底座,叠加低延迟推理专用LPX机架、支持大规模Agent运行的CPU机架、用于KV Cache热存的BlueField-4 STX机架 [7] - 推理算力系统设计形成类人三层网络:第一层快反应层由纯推理芯片(如LPU)提供极致低延迟反馈;第二层慢思考层使用超大吞吐GPU算力集群负责后台并行复杂逻辑推演;第三层记忆层存储Agent终身记忆和KV Cache [10][11] - 英伟达新增LPX机架,搭载Groq3 LPU,是最重要的技术趋势,旨在解决GPU多核架构不确定性导致的高延迟,匹配Agentic LLM推理范式变革 [12] - Agentic LLM需要单用户超过150 TPS的极致性能,传统GPU依赖大批次调度保障吞吐会牺牲延迟,无法满足需求,而Groq LPU凭借确定性编程架构,单token生成TPS可破千 [5][13] - LPU实现极低延迟的关键在于确定性编程,将调度权力从硬件完全移交给编译器,编译器在运行前精确规划每个时钟周期的数据路径,搭配无需刷新的SRAM静态存储,彻底消除性能抖动 [16][18] - LPU存在短板:SRAM存储密度极低(单颗仅500MB),存千亿参数模型BOM成本昂贵;确定性编译脆弱,模型结构细微变化可能导致无法生成最优路径;大规模集群网络同步维护困难 [19] - 英伟达采用Groq LPU和GPU异构协同,在模型层面设置A-F-D分离,在P-D分离基础上将Decode阶段再分为Attention和FFN,Attention计算交给Rubin GPU,FFN计算交给LPU [22] - A-F-D分离场景下通信量级极小,以主流7B模型为例,hidden size为4096,FP8精度下单token激活值仅4KB,双向传输仅8KB/层,32层模型单token总通信量仅256KB,编译器流水线编排可隐藏传输开销 [24] - FFN占据模型约2/3参数量,将FFN交给LPU是利用其极高权重搬运速度消除等待延迟,A-F-D设计允许系统物理上分离计算密集型和访存密集型任务,通过时间重叠减少计算单元空转 [25][28] - 华为同步跟进趋势,推出搭载昇腾950PR芯片的Atlas350加速卡,聚焦推理场景优化,采用SIMD+SIMT混合架构,支持多精度计算,细粒度访存设计提升小算子效率 [5][29] 物理AI:英伟达GTC、宇树招股书,从全栈工具到产业落地 - 英伟达GTC将物理AI作为核心单元展示,公司定位正从算力基础设施提供商延伸至现实世界智能的底层平台搭建者,形成覆盖“数据生成—环境仿真—模型训练—推理部署—运营优化”的完整工具链 [32][34] - Omniverse与Cosmos结合构成物理AI时代关键中间层基础设施,Omniverse负责将真实环境映射为可交互数字空间,Cosmos提供世界模型能力,使系统能理解环境变化,企业可通过仿真与合成数据提前完成训练测试 [34] - DSX(Omniverse数字孪生蓝图)的推出标志英伟达将AI工厂从硬件堆砌转向生产系统优化,核心指标变为“token per watt”,在电力约束下最大化单位能耗产出,通过数字孪生仿真和统一调度提升系统整体利用率 [38] - 在自动驾驶方向,英伟达展示重点从“感知能力”转向“推理能力”,Alpamayo平台面向具备思考与解释能力的新一代自动驾驶系统,旨在提升决策逻辑的可解释性、可验证性和可工程化程度 [40][42] - 英伟达正把硬件平台、软件栈与生态合作绑定为一体化方案,DRIVE Hyperion承担标准化车端平台角色,并通过与Uber等运营平台合作,将自动驾驶落点从技术开发推进至真实运营网络 [45] - 在机器人领域,英伟达将底层能力拆解为可组合标准模块:Isaac Lab负责机器人训练与评估;Newton负责可微分物理仿真;Cosmos负责世界建模和数据生成;GR00T负责通用机器人推理与动作策略生成,共同构成从环境理解到部署验证的连续链条 [46][47] - 英伟达机器人战略指向庞大的工业机器人存量市场,全球机器人巨头已开始整合Omniverse和Isaac相关能力,推动工厂向更高柔性、更高自动化水平升级 [48] - 宇树科技招股书披露,通用人形机器人具身大模型是公司核心技术,VLA(视觉-语言-动作)、WMA(世界模型-动作)及快慢系统构成从感知到动作生成的完整技术链路 [5][33] - 2026年被视为人形机器人具身智能发展关键一年,机器人大脑将成为机器人实现真正智能化和差异化竞争的核心,推动机器人从实验室研究向商业化、场景化应用快速迈进 [54] - 报告列出物理AI相关核心标的:物理AI底层(索辰科技);机器人大小脑(智微智能、天准科技);数字孪生(中控技术、能科科技、汉得信息、赛意信息、亚信科技) [54] 公司更新 - 合合信息:2025年实现收入18.1亿元,同比增长25.8%;归母净利润4.5亿元,同比增长13.4% [55] - AI和出海是两大核心驱动:C端扫描全能王推出AI功能,2025年月活达1.9亿,同比增长11.1%;累计付费用户987.8万,同比增长32.8%;智能文字识别C端收入14.9亿元,同比增长30.3% [58] - B端受益于Agent渗透趋势,发布AI Infra等产品,智能文字识别B端收入0.9亿元,同比增长16.2%;商业大数据B端收入1.7亿元,同比增长13.8% [58] - 境外收入增速达34.11%,高于境内增速的21.88% [59] - 聚水潭:国内领先电商SaaS ERP供应商,按2024年收入计,在中国电商SaaS ERP领域市场份额第一,占比24.4% [61] - 2024年服务88.4千名SaaS客户,净客户收入留存率115%,处理330亿订单 [61] - 2024年收入同比增长30.5%,经调整归母净利润转亏为盈达0.5亿元,毛利率保持60%以上 [65] - 业绩驱动力包括:电商平台多极化驱动ERP增长(2024年渗透率仅1.6%);规模化效应(现有客户收入占比提升);获客效率改善(获客成本从2022年1.85万元降至2025H1的0.82万元) [68][71] - AI赋能:接入千问大模型,智能客服场景可提效30%以上,商品管理搜图准确率达90%以上 [73] - 金蝶国际:2025年实现收入70.1亿元,同比增长12.0%;实现净利润0.9亿元(2024年同期亏损1.4亿元);经调净利润约2.3亿元 [76] - 云业务强劲,云服务收入达57.8亿元,占总收入83%;订阅服务ARR达40.9亿元,同比增长19% [76] - AI转型加速,AI合同金额3.56亿元,发布近20款独立AI Agent,面向小微市场金蝶AI实现记账效率提升80%以上,开票效率提升40% [77] - 经营质量提升,2025年毛利率达67.1%,同比提升2个百分点;41%新增代码由AI生成,研发交付周期缩短21% [76] 推荐投资主线 - 报告推荐九大投资主线:1) 数字经济领军;2) AIGC应用;3) AIGC算力;4) 数据要素;5) 信创弹性;6) 港股核心;7) 智联汽车;8) 新型工业化;9) 医疗信息化 [5] - 每条主线下列出详细标的公司,例如数字经济领军包括海康威视、金山办公等;AIGC算力包括浪潮信息、海光信息等 [78][79]
计算机行业周报:GTC后,算力与物理AI思考-20260321