行业与公司 * 涉及的行业为人工智能(AI)行业,特别是大语言模型(LLM)、AI Agent、多模态生成和AI编程工具领域[1] * 涉及的公司主要为谷歌(Google),其AI产品线Gemini是核心讨论对象[1] * 同时对比分析了行业内的主要竞争者,包括OpenAI(GPT系列、Codex)、Anthropic(Claude系列)以及智谱AI(GLM系列)等[3][13][14][16][23] 核心观点与论据:谷歌的战略与产品 * 战略转变:谷歌AI战略从追求单一模型能力迭代,转向构建具备执行权的AI Agent系统,推动AI从“回答问题”演进为“持续执行任务”[1][3] * 全栈生态优势:谷歌的核心竞争力在于其全栈产品生态(安卓、Chrome、YouTube、Search等),可将Gemini作为默认模型深度集成,形成超级入口和用户体验闭环[3][5][13] * 商业闭环构建:通过四层结构实现AI能力变现:1) 模型能力(Gemini系列);2) 入口(现有高流量平台);3) 执行层(Agent工具);4) 商业闭环(广告、订阅、支付协议等)[5] * 模型产品布局: * Gemini 3.5 Flash:定位高性价比、低延迟,速度达同级前沿模型的4倍,支撑Search等高流量入口的默认体验[1][6][7] * Gemini Omni:核心是多模态“任意输入输出”,强调对物理世界规律的深度理解,以生成符合物理直觉的内容[1][8][21] * Gemini Spark:定义为7x24小时云端持续执行的个人AI助理,体现谷歌在Agent方向的全力投入[2][9][10] * Agent Graph:作为Agent开发平台,为AI提供受控执行环境,确保任务高效准确完成[10] * 搜索业务升级:搜索升级为“AI Model”形态,从单向检索转为双向对话交互,默认使用Gemini 3.5 Flash模型,成为巨大流量入口[11][12] * 硬件与协议布局:在AI硬件领域侧重于构建生态系统(如安卓);推出Universal Cart通用购物车和开源的Agent Payment支付协议,旨在构建底层商业生态标准[22][23] 核心观点与论据:行业趋势与竞争 * 竞争焦点转移:行业焦点从“提示词工程”、“上下文工程”转向“驾驭工程”(Harness Engineering),即如何设定目标并施加约束引导AI高效执行任务[13][14] * 综合性竞争:大模型竞争已从比拼参数,演变为涵盖能力、速度、成本和工具调用等的综合性竞争[14] * 技术路径趋同:谷歌、OpenAI、Anthropic等头部公司在AI Agent和“驾驭工程”的发展方向上高度一致[3][13][16] * 算力与成本关键:算力短缺是共同挑战,提高推理效率、降低成本是关键;定制化芯片可将推理成本降至千分之一,构成未来竞争优势[14][15] * AI对软件行业的冲击:AI显著提升开发效率,可能重塑软件交付方式,长期可能使“软件工程师”职业乃至“软件”本身的概念发生变化[17] 其他重要内容 * 市场反响:市场对Gemini Omni的评价褒贬不一,其冲击力被认为不及Sora 2.0,后者在视频生成领域仍被视为标杆[8] * C端模型评判:用户感知模型好坏最有效的方式是亲身体验;排行榜单可能被优化,仅作参考;LLM Arena等匿名评测平台相对有代表性[24] * 国内厂商动态:与全球顶尖水平相比,国内在参数规模上仍有差距,预计参数竞赛仍将持续一段时间[23] * AI编程工具趋同:Cursor、Claude Code、OpenAI Codex及谷歌Project Astra 2.0等AI编程工具在核心功能上快速借鉴跟进,差异正在缩小[16] * 广告业务延续:搜索升级为AI交互形态不会削弱其传统广告业务,商业逻辑核心得以延续,并可能整合新的广告位(如AI生成结果内嵌广告)[20] * 下一代助理形态:云端持续执行、用户授权、调用工具的模式已成为当前个人AI助理的主流形态,并被所有主流公司采纳[18][19]
Google-IO-2026-深度解码-AI-趋势前瞻