谷歌AI核爆：升级全系模型，Gemini 2.5双榜登顶！所有产品用AI重做，OpenAI如何接招？

模型升级 - 谷歌为Gemini 2.5 Pro引入Deep Think推理模型，该模型采用前沿研究成果，具备在回应查询前权衡多种假设的能力[6][7][9] - 2.5 Pro Deep Think在2025 USAMO数学基准测试中表现优异，在LiveCodeBench编程基准测试中领先，在MMMU多模态推理测试中获得84.0%分数[10] - 谷歌发布性能更强的Gemini 2.5 Flash模型，推理效率提升，令牌消耗减少20-30%，在多模态处理、代码生成及长文本理解等基准测试中均超越前代[12] 模型功能 - Gemini 2.5系列引入原生音频输出和Live API改进，支持24种语言的文本转语音功能，可控制语气、口音和说话风格[16][17] - 引入"思考预算"概念，允许用户平衡token消耗与输出精度/速度的关系[15] - 增强安全防护能力，显著提高对间接提示注入攻击的防护率，成为最安全的模型系列[18] 开发者工具 - 推出编码助手Jules公测版，使用Gemini 2.5 Pro，能编写测试、构建新功能、修复bug等，支持异步运行和GitHub集成[30][31][37] - 新增"思维摘要"功能，可将模型原始推理过程结构化输出，帮助开发者理解模型决策逻辑[22] - 为Gemini API和Vertex AI引入Project Mariner电脑操作能力，支持多任务处理和自动完成重复性任务[15][18] 搜索业务 - AI概览功能已覆盖15亿用户和200个国家和地区，在美国和印度等市场推动查询类型增长超过10%[23] - 推出全新AI模式搜索，支持更长、更复杂的查询，早期测试人员查询长度是传统搜索的2-3倍[24][25] - Gemini 2.5模型将在美国Google搜索中推出，提供更快更准确的AI响应[25] 多模态与硬件 - 推出视频模型Veo 3和图像生成模型Imagen 4，均具备原生音频生成功能[27] - 宣布与Xreal合作开发Project Aura智能眼镜，内置Gemini并针对XR优化[38][39][41][42] - Project Astra升级为通用AI助手雏形，增强记忆能力和计算机控制功能[34][35][36]