帮大家总结了一下凌晨的Google I/O 2026开发者大会。
数字生命卡兹克·2026-05-20 06:38

文章核心观点 Google在I/O大会上发布了一系列AI模型、产品、Agent系统和基础设施的重大更新,标志着其AI战略从模型竞争转向全面构建以Agent为核心、深度整合其庞大生态系统的下一代AI平台和用户体验[1][49][121] 一. AI模型 - Gemini 3.5 Flash:作为轻量快速版模型,在多项关键能力上超越上一代旗舰模型Gemini 3.1 Pro[5] - 在Terminal-bench 2.1编码测试中得分为76.2%,高于3.1 Pro的70.3%[6] - 在衡量经济价值任务的GDPval-AA基准测试中Elo评分为1656,显著高于3.1 Pro的1314分[6] - 在Humanity's Last Exam(40.2%)和ARC-AGI-2(72.1%)等侧重世界知识和抽象推理的测试中表现略逊于3.1 Pro(分别为44.4%和77.1%)[7] - 输出速度比其他前沿模型快4倍[8] - 定价为输入每百万token $1.50,输出每百万token $9.00,比3.1 Pro便宜40%[9] - 上下文窗口为100万token,知识截止日期至2025年1月[11] - 已成为Gemini App和AI Mode in Search的默认模型并全球上线[14] - Gemini Omni Flash:全新的多模态模型,被描述为“能根据任何输入创造出任何东西”[13] - 支持保持视频中特定片段不变并修改其他部分[16] - 被定位为Omni家族的首个模型,Omni Pro版本即将发布[18] 二. Gemini产品 - Gemini App全新设计:采用名为“Neural Expressive”的新设计语言,界面改为蓝色渐变背景[19][21] - 工具栏合并,模型选择器新增“思维水平”选项(标准/扩展)[23] - 设置中引入使用情况进度条和每周限额[24] - 新设计已在Android、iOS、Web平台全球上线[24] - Ask Maps:Google Maps十年来最大升级,增加自然语言对话功能[25] - 用户可直接用自然语言与地图交互,处理复杂、情境化查询[27] - Ask YouTube:用户可通过自然语言提问获取视频概览、相关片段并可直接跳转,支持上下文记忆[28][29] - 目前在美国向Premium订阅者开放,将于今年夏天在全美推广[31] - Docs Live:允许用户通过语音指令让Gemini协助创建和编辑文档,无需打字,支持实时修改和整理[32][33][35][36] - 计划于今年夏天向Pro和Ultra订阅者开放,后续将接入Gmail Live和Google Keep[38] - Gemini Live升级:语音功能新增多种口音,包括利物浦腔英语、印度哈里亚纳方言、巴西里约葡萄牙语等[40][41] - Daily Brief:Gemini App新功能,可自动整理邮箱、日历、任务,生成个性化每日摘要并提供行动建议[42][43] - 已面向美国Plus、Pro、Ultra用户开放[45] - NotebookLM升级:新增电影级视频概览生成功能,信息图风格增至10种,学习工具升级[46] - 与Gemini App打通,笔记本可双向同步[46] - 支持上传EPUB电子书,幻灯片可导出为PPTX格式,聊天记录自动保存[46] - 已集成至Google Classroom[48] 三. Agent系统 - Antigravity 2.0:Google的Agent开发平台重大更新[50] - 推出全新独立桌面应用[52] - 上线Antigravity CLI并将在2026年6月18日后取代Gemini CLI[53][55] - 发布Antigravity SDK,允许开发者部署自有Agent[56] - 增加原生语音支持,整合Gemini音频模型[57] - 演示中配合Gemini 3.5 Flash,使用93个子Agent并行,在12小时内处理26亿token,以不到$1000的成本从零构建了一个可运行的操作系统[58][60] - 在Antigravity中优化后,Gemini 3.5 Flash速度比其他模型快12倍[60] - Antigravity 2.0已全球开放[62] - Gemini Spark:个人AI Agent,对标OpenAI的Claw,运行于Google Cloud专属虚拟机,可7x24小时处理长链路任务[63][64][66] - 深度集成Google Workspace,可自动处理邮件、表格更新、文档起草等任务[66][67][68][70] - 本周起对测试人员开放,下周起向美国Google AI Ultra订阅者开放Beta测试[73] - 订阅体系调整:伴随Spark发布,Google AI订阅价格体系重组[73] - 新增$100/月档位(Ultra),提供5倍于Pro的用量、20TB存储、YouTube Premium及Antigravity优先使用权[74] - 原$250/月Ultra计划降价至$200/月[74] - Spark在$100和$200两档均可使用[74] - Android Halo:Android系统中为Agent设计的专用界面,在状态栏显示Agent任务状态,代表UI逻辑从以App为中心转向以Agent为中心[76][77][79] 四. 视觉生成 - Google Pics:Workspace中新图像创作编辑工具,支持目标分割、元素单独编辑、文字编辑与翻译[80][82] - 所有输出自动添加SynthID水印[84] - 将于今年夏天先面向美国Ultra订阅者推出[84] - Stitch:UI设计工具,过去一年用户生成了超过1亿张UI画面[85] - 新增实时语音协作、代码导出、发布至Netlify、与Antigravity打通等功能[87][89] - Google Flow:AI创意工作室更新[90] - 集成Gemini Omni,支持保留原始视频表演仅修改环境特效[92] - 新增Agent功能,可单图生成16段不同机位视频[93] - 支持大规模场景一致性修改(如昼夜转换)[93] - 推出Flow Music功能,可根据音频提示生成编曲[95][98] - 推出Flow Tools,允许用户创建自定义创意工具[96] - SynthID:AI生成内容水印技术,已为超过1000亿张图片和视频及累计6万年时长的音频添加水印[100][102] - 现可通过Chrome右键或圈选搜索识别图片是否AI生成[102] - OpenAI、Kakao、ElevenLabs宣布加入SynthID联盟,Nvidia、Sony Pictures、Reuters、TikTok也将加入[105][108][110] 五. Google搜索 - AI Mode月活用户突破10亿,查询量每个季度翻倍[111] - 底层模型升级为Gemini 3.5[111] - 搜索框25年来最大升级:支持输入图片、文件、视频,并具备问题补全与梳理功能[112][113] - AI Overviews与AI Mode合并,实现搜索结果到对话式追问的自然过渡[115] - 引入Search Agents:用户可在搜索中创建多个7x24小时运行的后台Agent[116] - Agentic Coding进入搜索:可根据查询实时生成定制化交互界面(如可视化工具),由Antigravity驱动,Gemini 3.5 Flash实时编写并运行代码[118][121] - 该功能将于今年夏天向所有用户免费开放[121] 六. Agent电商 - Universal Commerce Protocol (UCP):为Agent电商设计的开源协议,定位为“Agent电商时代的HTTP”[122][123] - Amazon、Meta、Microsoft、Salesforce、Stripe已官宣加入其技术委员会[123] - 从美国扩展至加拿大、澳大利亚,英国紧随其后[125] - Agent Payments Protocol (AP2):为Agent付款设计的授权协议,可设置品牌、商品、金额上限三道护栏,交易具备防篡改数字授权书[126][127][129] - 将率先在Gemini Spark上线[129] - Universal Cart:跨商家、跨服务的智能购物车,可集成于Search、Gemini、YouTube、Gmail[130][132] - 具备自动比价、查折扣、检查商品兼容性(如电脑配件)等功能[134] - 将于今年夏天在美国率先于Search和Gemini App上线[134] 七. 其他 - Android XR智能眼镜:分显示眼镜和音频眼镜两条路线[135][137][139] - 音频眼镜由Gentle Monster和Warby Parker设计,三星制造,支持iOS与Android,具备导航、购物、拍照、图像编辑等交互演示[141][143] - TPU更新:第八代TPU首次采用双芯片路线[145] - TPU 8t(训练芯片):原始算力接近上一代的3倍,可通过Jackson Pathways基础设施跨全球超100万颗TPU进行扩展训练[146] - TPU 8i(推理芯片):重点优化延迟和生成速度[148] - AI科研:发布Gemini for Science工具集,包含假设生成器、计算发现引擎、科学技能包三个原型[150][151][154] - Weather Next:AI天气预报模型,在梅丽莎飓风案例中提前3天预警,比传统模型更准确[154] - AI制药:Isomorphic Labs利用AI加速新药研发,多个项目已进入临床前阶段[156] - Code Mender:能自动查找并修复代码安全漏洞,已向小批专家开放API测试[158][160]

帮大家总结了一下凌晨的Google I/O 2026开发者大会。 - Reportify