国泰海通|海外科技:Gemini 3、TPU、端侧AI应用更新报告——模型多模态升级加速端侧AI落地,TPU冲击算力格局
国泰海通证券研究·2025-12-03 21:47

模型能力与生态优势 - Gemini 3验证了预训练Scaling Law仍旧成立,其能力大幅跃迁得益于预训练突破,证明谷歌在算力投入上不再保守[1] - 谷歌拥有搜索、YouTube、Chrome等生态产生的独家且不可迁移的用户行为数据,构成了理解用户意图和上下文的强大壁垒[1] - 公司具备全栈技术加全面应用场景的独特生态优势[1] 多模态能力与端侧应用 - Gemini重点强化多模态能力,屏幕理解表现亮眼,ScreenSpot-Pro测试得分达72.7%,远超GPT-5.1的3.5%与Claude Sonnet 4.5的36.2%[2] - 模型逐渐具备视觉智能与界面逻辑理解能力,为端侧AI Agent实现GUI操控提供可能[2] - 豆包手机助手已率先落地,其跨APP比价功能本质是GUI模拟人类操作[2] - 谷歌坐拥安卓系统、模型、Pixel硬件入口及应用全家桶的全栈集成能力,在端侧AI落地具备天然优势[2] TPU算力生态与竞争格局 - 谷歌2025年加速优化TPU生态,原生支持PyTorch并在vLLM的TPU支持上进行大规模工程投入,大幅提升外部可用性[3] - TPU在内部使用时TCO较GB200服务器低44%,对外租赁时TCO较GB200低30%、较GB300低41%[3] - TPU集群通过ICI 3D Torus网络支持最大9216颗芯片,OCS技术实现数千种拓扑组合,适配多样并行需求[3] - TPU对谷歌的核心意义在于构建全栈AI生态,通过芯片与模型架构协同设计实现算力成本与效率最优,并赋能云业务[3] - 长期看TPU完全颠覆英伟达GPU概率较小,更可能作为其补充,因英伟达拥有规模优势、供应链议价权及开箱即用属性对中小客户吸引力更强[3] - 英伟达Rubin系列升级显著缩小TCO差距,且其一年一迭代的能力(如Feynman接力Rubin)有望持续保持技术领先性[3]