Imagine 4

搜索文档
一文读懂Google I/O 2025 开发者大会:开启 “模型即平台” 的 AI 生态新时代
华尔街见闻· 2025-05-21 18:38
谷歌AI战略升级 - 公司全面拥抱AI智能体技术,将Gemini模型深度整合至搜索、Gemini助手等核心业务,推出全新AI模式搜索[1][2][27] - 强调Gemini 2.5 Pro为当前最强通用AI模型,在LLM Arena测评中所有类别排名第一,App月活用户超4亿[19][20][23][24] - 智能体模式(Agent Mode)支持多任务管理(如同时处理10个任务),实验版将向Gemini订阅用户开放[29][30] Gemini模型技术突破 - Gemini 2.5 Pro与Flash双模型协同:Pro侧重高性能,Flash速度更快、成本降低22%,支持"思考预算"机制[3][39] - 多模态能力升级:支持原生音频输出(2种声音)、实时翻译(Google Meet已上线英西互译)、草图转3D动画编码[34][38][41] - 实时语音助手Gemini Live支持45种语言,具备环境音分离、多任务处理(如找房订票)及跨App操作能力[32][35] 开发者工具与平台创新 - AI Studio新增URL Context功能(支持20个链接提取)、原生语音模型及增强函数调用,加速语音助手/游戏开发[6][7][8] - 实验项目Stitch实现文本提示生成App UI设计并一键导出至Figma/IDE,Canvas功能可将文档转为互动网页[4][5][33] - 编码智能体Jules开放公测,支持异步函数调用;Gemini Diffusion文本生成速度提升5倍,处于实验阶段[40][41] 搜索与用户体验革新 - AI模式搜索支持数百字复杂查询,结构化答案整合地图/评论/视频,美国用户已可体验"深度搜索"功能[47][48][49] - AI概览(AI Overviews)月活15亿用户,推动部分查询量增长10%,未来将逐步融入核心搜索[47][50] - Android XR生态推出智能眼镜(物体识别/语音控制)与Moohan头显(沉浸式地图),联合Gentle Monster等厂商[58][59][60] 内容创作与多模态技术 - Imagine 4图像模型细节提升10倍,支持中英复杂字体;Veo 3视频模型实现角色一致性/口型同步/镜头控制[52][53] - Flow平台联合电影人开发,支持AI生成剧本/镜头/配乐;Lyria音频模型可创作专业音乐并与视频协同[54][56][57] - Google Beam视频通信平台采用6摄像头阵列+AI渲染,实现毫米级头部追踪与60fps 3D画面[37] 商业化与订阅服务 - 推出Google AI Ultra订阅套餐(249.99美元/月),包含Gemini高级模型、30TB存储及YouTube Premium等权益[62][63][64] - 惠普将商业化Google Beam设备,Gemini 2.5 Flash模型6月面世,Deep Think模型限测试人员开放[37][39]
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 11:29
Google I/O 2025核心发布 - Gemini 2 5 Pro被定位为公司最强大的通用AI模型 在LLM Arena所有类别排行榜名列前茅[22][24] - Gemini系列模型每月处理token数量从9 7万亿激增至480万亿 增长近50倍 每月活跃用户超4亿[24] - 公司推出Gemini 2 5 Flash轻量版模型 效率提升22% 支持"思考预算"机制控制输出质量与响应速度[6][39][40] 跨平台AI引擎整合 - Android平台深度整合Gemini Nano 提供summarize等轻量功能 同时推出Androidify应用生成机器人形象[17][19] - 新UI系统Material 3 Expressive增强界面趣味性 Android 16引入live updates等性能优化工具[20] - 智能眼镜Moohan支持沉浸式地图和交互式Gemini AI 合作伙伴包括Gentle Monster和Warby Parker[63][64][65] AI开发工具升级 - AI Studio新增原生语音模型支持24种语言 增强函数调用与搜索推理功能[9][11] - Stitch实验项目实现文本提示自动生成App UI设计 可导出至Figma或IDE继续开发[7][8] - Cloud Run支持一键部署应用到线上 集成至VS Code等IDE[16] 多模态与创作突破 - Imagine 4图像模型细节捕捉能力提升 支持中英文复杂字体识别 生成速度快10倍[56] - Veo 3视频模型实现角色一致性控制 可自动合成环境音与对白 口型同步[56][57] - Lyria音频模型结合Music AI Sandbox可生成专业音乐 Flow平台支持AI视频全流程制作[61] 搜索与智能体革新 - 搜索新增AI模式标签页 支持数百字复杂查询 采用Deep Research模型提供结构化答案[46][47][51] - 智能体模式可同时管理10个任务 实验版将向Gemini订阅用户开放[27][29][30] - AI概览功能月活达15亿 推动部分查询量增长10%[46] 订阅与商业化 - Google AI Ultra套餐月费249 99美元 包含Gemini模型最高使用权限及30TB存储空间[69][70][71] - Google Beam视频通信平台采用六摄像头阵列实现毫米级精度3D渲染 将与惠普合作商业化[37]