谷歌I/O 2025：Gemini 2.5系列更新，Veo 3支持生成有声视频，还有250刀的AI会员

Gemini 2.5系列模型更新 - Gemini 2.5 Pro在LMArena排行榜中ELO得分1448分，所有类别排名第一，碾压其他模型，支持原生文本到音频生成 [1][10][11] - Gemini 2.5 Pro（Deep Think）在数学、编码、多模态榜单刷新SOTA，在2025 USAMO数学奥赛中取得40.4%高分，比2.5 Pro提升10%以上，LiveCodeBench竞赛级编程得分80.4%，多模态推理MMMU得分84.0% [34][37] - Gemini 2.5 Flash在LMArena得分1424分，仅次于2.5 Pro，生成速度更快、成本更低，评估中使用的token减少20%-30% [24][25][27] 多模态模型Imagen 4和Veo 3 - Imagen 4生图细节逼真，生成速度比Imagen 3快10倍，分辨率最高达2k，完美处理拼写和版式任务 [4][58][60][61][63] - Veo 3首次支持原生音频输出，可生成对白、背景音等，实现音视频融合，在文本/图像生成提示、物理模拟和口型同步等方面表现出色 [4][66][67][68][71] 新产品与服务 - 推出订阅服务Google AI Ultra，费用250美元/月（比ChatGPT Pro贵50美元），可无限访问最新模型，同时推出Pro版20美元/月，支持Gemini 2.5 Pro、Veo 2和NotebookLM [5][7] - 推出全新文本扩散模型Gemini Diffusion，每秒输出1000多个token，性能比Gemini 2.0 Flash-Lite快5倍，擅长编程和数学任务 [39][40][41][43] - 推出创意平台Flow，集成Veo、Imagen、Gemini模型，可无缝创建电影片段、场景和故事 [72][73][74] AI Mode搜索功能 - AI Mode将搜索与AI深度集成，采用专用于Search的Gemini 2.5模型，自动规划搜索结果展现形式（文本、视频、地图等），支持复杂问题解答 [76][77][81][83] - Google Lens支持框选页面信息自动弹出答案，智能购物功能可虚拟试衣并自动下单付款 [85][87][90][91][92] 硬件产品 - 推出Project Moohan头显和XR眼镜，由Gemini加持，对标苹果和Meta产品，预计年内发布 [7][102][104] 行业影响与愿景 - Gemini已成为最好的多模态基础模型，未来将扩展为"世界模型"，Project Astra愿景是让AI助手真正帮助人类日常生活 [48][50][51][52][53] - 公司在AI加速科学发现方面取得成就，包括AlphaFold、AIME等，并与Ira公司合作帮助盲人提升独立性 [54][55]