Workflow
谷歌重磅发布最强通用AI模型!同声传译、全新AI模式搜索,直接通过自然语言发问,支持长达数百字提问
每日经济新闻·2025-05-21 06:37

谷歌AI战略升级 - 公司宣布全面拥抱AI智能体技术,将智能体整合至核心业务搜索及AI助手Gemini,推出全新AI模式搜索 [1] - 在I/O开发者大会上展示AI、多模态模型、跨设备整合与开发者工具的最新成果,标志AI从"信息工具"进化为"通用智能体" [1] 模型与技术进展 - 推出Gemini 2 5 Pro模型,被CEO称为"迄今为止最强大的通用AI模型",在LLM Arena测评中所有类别排名第一 [2][3] - Gemini模型在AI代码编辑器Cursor上增长最快,每月处理token数量从9 7万亿激增至480万亿(增长近50倍) [3][4] - Gemini App月活跃用户达4亿,公司推出十多款模型和20项AI功能,发布速度创历史新高 [3][4] 智能体模式与应用 - 智能体模式(Agent Mode)将上线Chrome、搜索及Gemini App,可同时管理多达10个任务并自主学习 [5] - 演示智能体完成找公寓任务:搜索Zillow、调整筛选条件、使用MCP协议预约看房 [6] - 智能体模式实验版将向Gemini订阅用户开放,支持私密使用个人信息 [7] 搜索功能革新 - AI概览(AI Overviews)月活用户达15亿,推动某些查询量增长10% [10] - 推出AI Mode标签页,支持数百字复杂提问、自动分解意图、生成结构化答案,已在美国上线 [10] - 深度搜索(DeepSearch)模型整合逻辑结果与多模态内容,提供"博学助理"式答案 [13][14] 多模态与创作工具 - Flow平台整合Veo 3视频生成模型,支持文字/图片生成8秒片段并拼接完整视频 [23][25] - Imagen 4图像模型可生成真实文本,Veo 2新增相机控制与对象移除功能 [25] - 原生音频合成工具Lyria与文本转图像/视频技术同步亮相 [2] 硬件与跨设备整合 - 安卓XR平台联合三星、高通开发,支持AI眼镜设备,已有数百家软件商适配 [26][27] - 首款安卓XR设备Project Moohan将于年内上市,与中国Xreal合作推出AR眼镜 [27] - Gemini AI将拓展至智能手表、汽车控制台、电视及眼镜 [26] 创新功能展示 - 谷歌光束(Google Beam)实现3D光场视频会议,帧率达60fps,年内由惠普首发 [15] - Google Meet支持英语/西班牙语同声传译,保留原声音色与情感,将新增多语种 [19] - 虚拟试衣工具支持用户上传照片预览服装效果,AI购物决策全流程覆盖 [21]