一文读懂Google I/O 2025 开发者大会：开启 “模型即平台” 的 AI 生态新时代

谷歌AI战略升级 - 公司全面拥抱AI智能体技术，将Gemini模型深度整合至搜索、Gemini助手等核心业务，推出全新AI模式搜索[1][2][27] - 强调Gemini 2.5 Pro为当前最强通用AI模型，在LLM Arena测评中所有类别排名第一，App月活用户超4亿[19][20][23][24] - 智能体模式（Agent Mode）支持多任务管理（如同时处理10个任务），实验版将向Gemini订阅用户开放[29][30] Gemini模型技术突破 - Gemini 2.5 Pro与Flash双模型协同：Pro侧重高性能，Flash速度更快、成本降低22%，支持"思考预算"机制[3][39] - 多模态能力升级：支持原生音频输出（2种声音）、实时翻译（Google Meet已上线英西互译）、草图转3D动画编码[34][38][41] - 实时语音助手Gemini Live支持45种语言，具备环境音分离、多任务处理（如找房订票）及跨App操作能力[32][35] 开发者工具与平台创新 - AI Studio新增URL Context功能（支持20个链接提取）、原生语音模型及增强函数调用，加速语音助手/游戏开发[6][7][8] - 实验项目Stitch实现文本提示生成App UI设计并一键导出至Figma/IDE，Canvas功能可将文档转为互动网页[4][5][33] - 编码智能体Jules开放公测，支持异步函数调用；Gemini Diffusion文本生成速度提升5倍，处于实验阶段[40][41] 搜索与用户体验革新 - AI模式搜索支持数百字复杂查询，结构化答案整合地图/评论/视频，美国用户已可体验"深度搜索"功能[47][48][49] - AI概览（AI Overviews）月活15亿用户，推动部分查询量增长10%，未来将逐步融入核心搜索[47][50] - Android XR生态推出智能眼镜（物体识别/语音控制）与Moohan头显（沉浸式地图），联合Gentle Monster等厂商[58][59][60] 内容创作与多模态技术 - Imagine 4图像模型细节提升10倍，支持中英复杂字体；Veo 3视频模型实现角色一致性/口型同步/镜头控制[52][53] - Flow平台联合电影人开发，支持AI生成剧本/镜头/配乐；Lyria音频模型可创作专业音乐并与视频协同[54][56][57] - Google Beam视频通信平台采用6摄像头阵列+AI渲染，实现毫米级头部追踪与60fps 3D画面[37] 商业化与订阅服务 - 推出Google AI Ultra订阅套餐（249.99美元/月），包含Gemini高级模型、30TB存储及YouTube Premium等权益[62][63][64] - 惠普将商业化Google Beam设备，Gemini 2.5 Flash模型6月面世，Deep Think模型限测试人员开放[37][39]