Gemini 2.5系列模型更新 - Gemini 2.5 Pro在LMArena排行榜中ELO得分1448分,所有类别排名第一,碾压其他模型,支持原生文本到音频生成 [1][10][11] - Gemini 2.5 Pro(Deep Think)在数学、编码、多模态榜单刷新SOTA,在2025 USAMO数学奥赛中取得40.4%高分,比2.5 Pro提升10%以上,LiveCodeBench竞赛级编程得分80.4%,多模态推理MMMU得分84.0% [34][37] - Gemini 2.5 Flash在LMArena得分1424分,仅次于2.5 Pro,生成速度更快、成本更低,评估中使用的token减少20%-30% [24][25][27] 多模态模型Imagen 4和Veo 3 - Imagen 4生图细节逼真,生成速度比Imagen 3快10倍,分辨率最高达2k,完美处理拼写和版式任务 [4][58][60][61][63] - Veo 3首次支持原生音频输出,可生成对白、背景音等,实现音视频融合,在文本/图像生成提示、物理模拟和口型同步等方面表现出色 [4][66][67][68][71] 新产品与服务 - 推出订阅服务Google AI Ultra,费用250美元/月(比ChatGPT Pro贵50美元),可无限访问最新模型,同时推出Pro版20美元/月,支持Gemini 2.5 Pro、Veo 2和NotebookLM [5][7] - 推出全新文本扩散模型Gemini Diffusion,每秒输出1000多个token,性能比Gemini 2.0 Flash-Lite快5倍,擅长编程和数学任务 [39][40][41][43] - 推出创意平台Flow,集成Veo、Imagen、Gemini模型,可无缝创建电影片段、场景和故事 [72][73][74] AI Mode搜索功能 - AI Mode将搜索与AI深度集成,采用专用于Search的Gemini 2.5模型,自动规划搜索结果展现形式(文本、视频、地图等),支持复杂问题解答 [76][77][81][83] - Google Lens支持框选页面信息自动弹出答案,智能购物功能可虚拟试衣并自动下单付款 [85][87][90][91][92] 硬件产品 - 推出Project Moohan头显和XR眼镜,由Gemini加持,对标苹果和Meta产品,预计年内发布 [7][102][104] 行业影响与愿景 - Gemini已成为最好的多模态基础模型,未来将扩展为"世界模型",Project Astra愿景是让AI助手真正帮助人类日常生活 [48][50][51][52][53] - 公司在AI加速科学发现方面取得成就,包括AlphaFold、AIME等,并与Ira公司合作帮助盲人提升独立性 [54][55]
谷歌I/O 2025:Gemini 2.5系列更新,Veo 3支持生成有声视频,还有250刀的AI会员