Gemini Agent
搜索文档
Google's Gemini 3 is live after months of hype. Here's what it can do.
Business Insider· 2025-11-19 00:00
产品发布与定位 - 谷歌发布新一代AI模型Gemini 3,并宣称其在推理能力上实现“巨大飞跃”,比Gemini 2更具创造性,且能更好地结合文本、图像和视频 [1] - 此次发布对谷歌至关重要,是公司在GPT-5发布后重新确立AI领导者地位并巩固三年来转型成果的机会 [2] - 谷歌此次首先推出的是Gemini 3 “Pro”版本,并宣称这是其迄今为止“事实性最强”的模型 [6] 核心性能与能力提升 - Gemini 3在推理和多模态能力上均有提升,能够更好地解释和可视化想法,其不仅能分别处理文本或图像,还能理解其中的细微差别以将信息转换为最合适的媒介 [3] - 该模型在“人类终极考试”中,在不使用工具的情况下得分为37.5%,该考试包含2500个跨学科问题,使其在解决数学和科学问题时具有“非常高的可靠性” [7] - 模型展现出新的“潜在能力”,例如使用“动态视图”生成包含可点击小组件和标签的完全交互式网站等生成式界面 [10] - 模型的编码能力显著增强,谷歌借此推出名为Antigravity的新平台,将“氛围编码”提升到新水平,自主代理可完成大部分工作 [11] 产品集成与市场策略 - 谷歌利用其分发优势,在发布当日即将Gemini 3整合至搜索引擎中,但初期仅限美国地区付费订阅Gemini Pro或Ultra等级的用户使用,未来将向所有用户开放 [4] - 集成至搜索后,新模型能将用户查询分解成更多部分以执行更好的搜索,并能在AI模式搜索页面上直接构建更多可视化和交互式图形 [5] 代理功能与未来愿景 - 谷歌推出名为“Gemini代理”的实验性功能,旨在能够执行多步骤任务,并与谷歌日历、Gmail等各种谷歌应用交互 [8] - 代理功能是打造通用AI助手大愿景的一部分,其可根据用户邮件中的信息研究假期并寻找合适的租车服务,实现高度自动化 [9] - 大语言模型已从根本上改变了编码、软件构建以及将想法变为现实的方式 [12]