模型升级 - 谷歌为Gemini 2.5 Pro引入Deep Think推理模型,该模型采用前沿研究成果,具备在回应查询前权衡多种假设的能力[6][7][9] - 2.5 Pro Deep Think在2025 USAMO数学基准测试中表现优异,在LiveCodeBench编程基准测试中领先,在MMMU多模态推理测试中获得84.0%分数[10] - 谷歌发布性能更强的Gemini 2.5 Flash模型,推理效率提升,令牌消耗减少20-30%,在多模态处理、代码生成及长文本理解等基准测试中均超越前代[12] 模型功能 - Gemini 2.5系列引入原生音频输出和Live API改进,支持24种语言的文本转语音功能,可控制语气、口音和说话风格[16][17] - 引入"思考预算"概念,允许用户平衡token消耗与输出精度/速度的关系[15] - 增强安全防护能力,显著提高对间接提示注入攻击的防护率,成为最安全的模型系列[18] 开发者工具 - 推出编码助手Jules公测版,使用Gemini 2.5 Pro,能编写测试、构建新功能、修复bug等,支持异步运行和GitHub集成[30][31][37] - 新增"思维摘要"功能,可将模型原始推理过程结构化输出,帮助开发者理解模型决策逻辑[22] - 为Gemini API和Vertex AI引入Project Mariner电脑操作能力,支持多任务处理和自动完成重复性任务[15][18] 搜索业务 - AI概览功能已覆盖15亿用户和200个国家和地区,在美国和印度等市场推动查询类型增长超过10%[23] - 推出全新AI模式搜索,支持更长、更复杂的查询,早期测试人员查询长度是传统搜索的2-3倍[24][25] - Gemini 2.5模型将在美国Google搜索中推出,提供更快更准确的AI响应[25] 多模态与硬件 - 推出视频模型Veo 3和图像生成模型Imagen 4,均具备原生音频生成功能[27] - 宣布与Xreal合作开发Project Aura智能眼镜,内置Gemini并针对XR优化[38][39][41][42] - Project Astra升级为通用AI助手雏形,增强记忆能力和计算机控制功能[34][35][36]
谷歌AI核爆:升级全系模型,Gemini 2.5双榜登顶!所有产品用AI重做,OpenAI如何接招?