AVO智能体技术
搜索文档
计算机行业周报:英伟达推出AVO智能体技术,Gemma 4开启端侧智能新纪元
华鑫证券· 2026-04-09 08:24
行业投资评级 - 报告对计算机行业维持 **推荐** 评级 [1] 核心观点总结 - 报告核心观点是 **维持对AI应用板块的看好**,认为行业正从同质化接入转向依托强基座的差异化落地,头部应用的盈利空间将被打开,业绩兑现与毛利改善的确定性将显著提升 [6][54] 按目录分章节总结 算力动态 - 2026年3月26日,英伟达发布智能体式变异算子 **AVO** 技术,以自主编码智能体实现全流程自主优化闭环 [1][21] - 在 **NVIDIA Blackwell B200 GPU** 上对注意力内核进行优化,性能显著超越 cuDNN 与 FlashAttention-4,在 **BF16精度** 下实现 **1668 TFLOPS** 的吞吐量,较 cuDNN 最高提升 **3.5%**,较 FlashAttention-4 最高提升 **10.5%** [25][27] - 该技术具备出色泛化能力,仅需 **30分钟** 自主适配即可迁移至分组查询注意力场景,性能较 cuDNN 最高提升 **7.0%**,较 FlashAttention-4 最高提升 **9.3%** [27] - 根据 **OpenRouter** 数据,2026年3月30日至4月5日,周度 **token** 消耗量为 **27T**,环比上周增长 **18.94%** [13] - 同期,**中国AI大模型周调用量** 已连续五周超过美国,达到 **12.96万亿 Token**,环比涨幅 **31.48%**,是同期美国调用量(**3.03万亿 Token**)的 **4.28倍** [15] - **小米 MiMo-V2-Pro** 在 OpenRouter 平台周 Token 消耗量达 **4.19万亿**,**阿里 Qwen3.6-Plus** 发布仅1天,日调用量突破 **1.4万亿 Token**,刷新全球单日单模型调用纪录 [15] - 近期国内云计算市场迎来大规模调价浪潮,阿里云、腾讯云、百度智能云等头部厂商相继上调AI算力、云存储及大模型服务价格,部分产品涨幅最高超 **400%** [19] AI应用动态 - 2026年4月3日,谷歌 **DeepMind** 发布全新的开源模型系列 **Gemma 4**,该系列涵盖从 **2B** 到 **31B** 的四个尺寸,全部开源 [2][32] - **Gemma 4 31B Dense** 在 **Arena AI 文本榜单** 上取得了开源第三的成绩,**Elo评分** 达到 **1452**,以较小参数量进入大模型竞争区间 [33] - 相比前代 **Gemma 3**,**Gemma 4** 在多项能力上实现显著提升:在 **AIME 2026** 数学测试中成绩从 **21.2%** 提升至 **89.2%**;在 **LiveCodeBench** 编程测试中从 **29.1%** 提升至 **80.0%**;在智能体相关的 **t2-bench** 测试中从 **6.6%** 提升至 **86.4%** [34][35] - **Gemma 4** 系列模型支持多模态输入,其中 **E2B** 和 **E4B** 版本兼容图像、视频和音频,并内置多轮多工具智能体工作流的函数调用能力 [41] - 本期(2026.3.28-2026.4.3)AI相关网站流量数据中,**Discord** 周访问量环比增长 **+3.52%**,增速第一;**Character.AI** 平均停留时长最长,为 **00:17:12** [30][31] AI融资动向 - 2026年3月,太空数据中心企业 **Starcloud** 完成 **1.7亿美元** A轮融资,估值达 **11亿美元**,成为 YC 成长最快的独角兽,累计融资达 **2亿美元** [2][42] - 资金将用于卫星研发、制造基地建设、团队扩张及发射采购,加速轨道算力基础设施落地 [2][42] 行情复盘 - 上周(2026.3.30-2026.4.3),**AI应用指数** 日涨幅最大值为 **2.24%**,日跌幅最大值为 **-2.87%**;**AI算力指数** 日涨幅最大值为 **3.35%**,日跌幅最大值为 **-4.31%** [47] - **AI算力指数** 内部,**光迅科技** 以 **6.97%** 录得上周最大涨幅,**英维克** 以 **-10.2%** 录得上周最大跌幅 [47] - **AI应用指数** 内部,**华盛昌** 以 **15.8%** 录得上周最大涨幅,**亿纬锂能** 以 **-17.13%** 录得上周最大跌幅 [47] 投资建议与案例分析 - 报告以 **智谱** 2025年全年业绩为例,论证模型能力向商业价值的转化:公司全年实现总收入 **7.24亿人民币**,同比增长 **131.9%**;综合毛利率达 **41%**;**MaaS API平台** 实现 **ARR 17亿元**(约 **2.5亿美金**),同比提升 **60倍** [3][54] - 业务拆分显示高增长:企业级智能体业务收入从 **0.47亿元** 增至 **1.66亿元**,增长 **248.8%**;开放平台及API平台业务从 **0.48亿元** 增至 **1.90亿元**,增幅 **292.6%** [3] - 截至2026年3月,智谱平台注册企业及用户已突破 **400万**,其 **GLM Coding Plan** 付费开发者超 **24.2万**,新推出的 **Claw Plan** 上线20天订阅用户突破 **40万** [3] - 公司的模型性能优势显著,2026年一季度 **API提价83%** 后调用量仍保持增长 [6][54] - 中长期,建议关注 **罗博特科 (300757.SZ)**、**唯科科技 (301196.SZ)**、**合合信息 (688615.SH)**、**能科科技 (603859.SH)** [6][55] - 报告提供了上述四家公司的盈利预测与投资评级,均为 **买入** 评级 [8][57]
计算机行业周报:英伟达推出AVO智能体技术,Gemma4开启端侧智能新纪元-20260408
华鑫证券· 2026-04-08 22:15
报告行业投资评级 - 行业投资评级为“推荐(维持)” [1] 报告的核心观点 - 报告维持对AI应用板块的看好,认为头部模型公司已验证模型能力向商业价值的有效转化,随着行业从同质化接入转向依托强大基座的差异化落地,头部应用的盈利空间将被打开,业绩兑现与毛利改善的确定性将显著提升 [55] - 报告通过分析智谱的强劲财报、英伟达的AVO技术突破、谷歌Gemma 4的发布、中国大模型调用量领先以及AI算力基础设施的创新等动态,论证了AI产业持续快速发展的趋势 [3][13][15][22][33][42][55] 根据相关目录分别进行总结 算力动态 - **算力租赁与Token市场**:2026年3月30日至4月5日,周度Token调用量为27T,环比增长18.94% [13];中国AI大模型周调用量已连续五周超过美国,在3月30日-4月5日这一周达到12.96万亿Token,环比涨幅31.48%,是同期美国3.03万亿Token的4.28倍 [15];OpenRouter平台周Token消耗量榜单前六名均为中国模型,其中小米MiMo-V2-Pro周消耗量达4.19万亿Token,阿里Qwen3.6-Plus发布仅1天日调用量突破1.4万亿Token [15] - **市场份额**:在Token消耗市场份额中,qwen以39.6%的份额稳居首位,google以9.5%位列第二,OpenAI、Anthropic、Minimax分别占据8.8%、8.2%、7.3% [14] - **云服务定价**:国内云计算市场迎来大规模调价,阿里云、腾讯云、百度智能云等头部厂商相继上调AI算力等服务价格,部分产品涨幅最高超400% [20];火山引擎与京东云选择逆势保持价格稳定,京东云对部分PaaS产品推出专项优惠,平均降幅超16% [20] - **技术突破**:英伟达于2026年3月26日发布智能体式变异算子(AVO)技术,以自主编码智能体替代传统进化搜索方式 [22];在Blackwell B200 GPU上对注意力内核进行优化,实现1668 TFLOPS的吞吐量,较英伟达cuDNN库最高提升3.5%,较FlashAttention-4最高提升10.5% [28];该技术可快速迁移至GQA场景,性能较cuDNN最高提升7.0%,较FlashAttention-4最高提升9.3% [28] AI应用动态 - **流量跟踪**:2026年3月28日至4月3日,AI相关网站周访问量前三为ChatGPT(1254.0M)、Bing(812.9M)、Gemini(604.7M) [31];访问量环比增速第一为Discord,增长3.52% [31];平均停留时长前三为Character.AI(00:17:12)、Discord(00:10:54)、Kimi(00:08:16) [31] - **模型发布**:谷歌DeepMind于2026年4月3日发布开源模型系列Gemma 4,涵盖从2B到31B共四个尺寸,全部开源 [33];Gemma 4 31B Dense在Arena AI文本榜单上Elo评分达1452,位列开源第三 [34];相比前代Gemma 3,性能大幅提升,如在AIME 2026数学测试中成绩从21.2%提升至89.2%,在LiveCodeBench编程测试中从29.1%提升至80% [35] - **模型特性**:Gemma 4系列模型具备多模态能力,能处理图像、视频输入,其中E2B和E4B版本还兼容音频 [41];采用逐层嵌入、共享KV缓存、交替注意力机制等架构设计提升参数效率 [40];E2B和E4B版本针对端侧设备优化,可在手机等设备上离线运行,31B和26B版本面向工作站和服务器 [38] AI融资动向 - **主要融资事件**:太空数据中心企业Starcloud于2026年3月完成1.7亿美元A轮融资,估值达11亿美元,累计融资2亿美元 [2][42];资金将用于卫星研发、制造基地建设等 [2] - **公司进展**:Starcloud专注近地轨道太空数据中心,已成功将NVIDIA H100送入轨道并完成首次太空AI训练与轨道推理 [42];计划年内发射Starcloud-2,发电能力为初代100倍 [42] 投资建议 - **案例分析**:以智谱公司为例,其2025年全年实现总收入7.24亿人民币,同比增长131.9%,综合毛利率达41% [3][55];MaaS API平台实现ARR 17亿元(约2.5亿美金),同比提升60倍,毛利率同比提升近5倍至18.9% [3][55];企业级智能体业务收入增长248.8%至1.66亿元,开放平台及API业务增长292.6%至1.90亿元 [3];2026年一季度API提价83%后调用量仍保持增长 [55] - **关注公司**:报告中长期建议关注罗博特科(300757.SZ)、唯科科技(301196.SZ)、合合信息(688615.SH)、能科科技(603859.SH) [6][56];报告提供了上述公司的盈利预测与投资评级(均为“买入”) [8][58]