Workflow
预训练Scaling Law
icon
搜索文档
国泰海通|海外科技:Gemini 3、TPU、端侧AI应用更新报告——模型多模态升级加速端侧AI落地,TPU冲击算力格局
模型能力与生态优势 - Gemini 3验证了预训练Scaling Law仍旧成立,其能力大幅跃迁得益于预训练突破,证明谷歌在算力投入上不再保守[1] - 谷歌拥有搜索、YouTube、Chrome等生态产生的独家且不可迁移的用户行为数据,构成了理解用户意图和上下文的强大壁垒[1] - 公司具备全栈技术加全面应用场景的独特生态优势[1] 多模态能力与端侧应用 - Gemini重点强化多模态能力,屏幕理解表现亮眼,ScreenSpot-Pro测试得分达72.7%,远超GPT-5.1的3.5%与Claude Sonnet 4.5的36.2%[2] - 模型逐渐具备视觉智能与界面逻辑理解能力,为端侧AI Agent实现GUI操控提供可能[2] - 豆包手机助手已率先落地,其跨APP比价功能本质是GUI模拟人类操作[2] - 谷歌坐拥安卓系统、模型、Pixel硬件入口及应用全家桶的全栈集成能力,在端侧AI落地具备天然优势[2] TPU算力生态与竞争格局 - 谷歌2025年加速优化TPU生态,原生支持PyTorch并在vLLM的TPU支持上进行大规模工程投入,大幅提升外部可用性[3] - TPU在内部使用时TCO较GB200服务器低44%,对外租赁时TCO较GB200低30%、较GB300低41%[3] - TPU集群通过ICI 3D Torus网络支持最大9216颗芯片,OCS技术实现数千种拓扑组合,适配多样并行需求[3] - TPU对谷歌的核心意义在于构建全栈AI生态,通过芯片与模型架构协同设计实现算力成本与效率最优,并赋能云业务[3] - 长期看TPU完全颠覆英伟达GPU概率较小,更可能作为其补充,因英伟达拥有规模优势、供应链议价权及开箱即用属性对中小客户吸引力更强[3] - 英伟达Rubin系列升级显著缩小TCO差距,且其一年一迭代的能力(如Feynman接力Rubin)有望持续保持技术领先性[3]
AI展望:NewScaling,NewParadigm,NewTAM
华泰证券· 2025-06-10 09:43
报告核心观点 - 全球AI发展呈现模型端新架构探索、算力端需求上行与硬件设计进入新范式、应用端商业模式变革的趋势,持续看好AI产业投资主线,全球AI应用将进入业绩收获期 [1] 模型:预训练Scaling Law有望开启新起点 - 大模型技术路线从预训练到后训练发展,2018 - 2024年9月为预训练阶段,2024年9月后进入后训练阶段 [13][15] - 腾讯混元Turbo - S通过创新架构实现性能与效率平衡,Google Gemini Diffusion在文本生成上有突破,大厂在预训练参数量和数据量扩大上有尝试,大规模算力集群支持预训练探索,模型架构改进或使预训练Scaling Law开启新起点 [23][24][25] 算力:训练推理两条主线共同推动算力需求持续上行 训练端 - 后训练阶段Scaling Law成大厂共识,新Scaling路径不断涌现,新架构探索有望重启预训练阶段算力需求叙事 [33][34] - 以“星际之门”为代表的大规模算力集群进展顺利,中东版“星际之门”落地,主权AI逐步落地,台积电新产能规划预示算力需求乐观 [38][41][42] 推理端 - Agent需求增长或使推理算力提升几十至上百倍,大量工具调用和信息交互使tokens消耗量大幅提升,产品用户数量增长带动算力需求提升 [43][46][52] 算力硬件新范式 - 大模型对系统综合能力要求提高,NVLink Fusion强化英伟达硬件生态优势,国产算力加速迭代,华为云推出新服务器,高密度机架方案为性能追赶提供路径 [57][58][60] 应用:Agent进展提速,看好AI应用进入业绩收获期 Agent发展情况 - Agent可能是AI应用终极形态,目前雏形初具,但完成复杂长期任务能力有限,“任务长度”是关键衡量指标且提升速度快 [68][73][74] - MCP统一了Agent工具调用生态,促进其快速构建和发展 [79] 海外AI应用 - AI Coding是重要垂类赛道,细分垂类商业化效果好,25Q1业绩大部分超预期,头部2B软件AI产品存量客户渗透率接近10%,全年收入有望加速增长 [82][84][85] 国内AI应用 - 加速从简单环节到复杂环节产品升级,25Q1利润指标率先改善,AI商业化24年初步验证,25年有望加速复制推广,MCP有望加速产业节奏 [88][90][94] 落地节奏展望:商业模式变革有望成为共识,看好细分领域率先放量 商业模式变革 - Agent应用从交付工具转变为交付结果,按效果付费新范式有望成行业共识 [99] 细分场景放量 - 数据复杂度低、幻觉容忍度高的场景率先实现规模化商业落地,2C场景商业化进展领先,2B应用分场景和行业来看,数据复杂度和预算影响落地节奏 [103][104][110] AI + 营销/销售 - 数据丰富、可量化ROI和流程标准化驱动AI快速商业化,企业需求从单一工具向全链路智能中枢升级,市场格局分散,AI有望重塑格局 [113][114][119] 重点公司推荐 - 推荐金山办公、福昕软件、泛微网络等多家公司,均给予“买入”评级 [7]