Antigravity
搜索文档
新模型“屠榜”,第一财经对话谷歌团队:AI“新旗手”如何诞生
第一财经· 2025-11-19 14:20
2025.11. 19 新模型"屠榜" 今天凌晨皮查伊发了条帖子,内容只有一张图,但这张图足够有说服力,Gemini 3 Pro几乎"屠榜", 在所有主要竞技场排行榜上排名第一。 本文字数:3903,阅读时长大约6分钟 作者 | 第一财经 刘晓洁 11月19日,预热已久、全网热议的Gemini 3终于正式亮相。谷歌这次打出的不是小修小补的普通升 级,而是一张"王牌"——在几乎所有主流基准测试中实现全面领先,大模型的竞争格局可能就此改 写。甚至有业内人士预言:"未来六个月内,很难有公司能够超越这一成绩。" 发布不久,OpenAI CEO 奥尔特曼与特斯拉CEO 马斯克便先后公开表示祝贺。奥尔特曼称其"看起来 是个很棒的模型",评论区则调侃"这句来自竞争对手的夸奖真是暖心"。马斯克也一如既往地送 上"Nice work"的评价。 一向风格严谨的谷歌,这次也显得格外高调。官方博客标题直接打出"开启智慧新纪元",内容中多次 强调"最佳""最先进"。谷歌员工也纷纷在社交媒体上为自家产品助阵,谷歌CEO桑达尔·皮查伊 (Sundar Pichai)今天已经连发了8条帖子介绍Gemini 3。 在正式发布前,第一财经参与了 ...
新模型「屠榜」,对话谷歌团队:AI「新旗手」如何诞生
新浪科技· 2025-11-19 13:49
从追赶到领先,谷歌让整个AI圈"炸了"。 11月19日,预热已久、全网热议的Gemini 3终于正式亮相。谷歌这次打出的不是小修小补的普通升级,而是一张"王牌"——在几乎所 有主流基准测试中实现全面领先,大模型的竞争格局可能就此改写。甚至有业内人士预言:"未来六个月内,很难有公司能够超越这 一成绩。" 发布不久,OpenAI CEO 奥尔特曼与特斯拉CEO 马斯克便先后公开表示祝贺。奥尔特曼称其"看起来是个很棒的模型",评论区则调 侃"这句来自竞争对手的夸奖真是暖心"。马斯克也一如既往地送上"Nice work"的评价。 一向风格严谨的谷歌,这次也显得格外高调。官方博客标题直接打出"开启智慧新纪元",内容中多次强调"最佳""最先进"。谷歌员工也 纷纷在社交媒体上为自家产品助阵,谷歌CEO桑达尔·皮查伊(Sundar Pichai)今天已经连发了8条帖子介绍Gemini 3。 : center;"> 今天凌晨皮查伊发了条帖子,内容只有一张图,但这张图足够有说服力,Gemini 3 Pro几乎"屠榜",在所有主要竞技场排行榜上排名 第一。 : center;"> | Benchmark | Description ...
新模型“屠榜” 对话谷歌团队:AI“新旗手”如何诞生
第一财经· 2025-11-19 12:41
11月19日,预热已久、全网热议的Gemini 3终于正式亮相。谷歌这次打出的不是小修小补的普通升级,而是一张"王牌"——在几乎所有主流基准测试中实现 全面领先,大模型的竞争格局可能就此改写。甚至有业内人士预言:"未来六个月内,很难有公司能够超越这一成绩。" 发布不久,OpenAI CEO 奥尔特曼与特斯拉CEO 马斯克便先后公开表示祝贺。奥尔特曼称其"看起来是个很棒的模型",评论区则调侃"这句来自竞争对手的 夸奖真是暖心"。马斯克也一如既往地送上"Nice work"的评价。 一向风格严谨的谷歌,这次也显得格外高调。官方博客标题直接打出"开启智慧新纪元",内容中多次强调"最佳""最先进"。谷歌员工也纷纷在社交媒体上为 自家产品助阵,谷歌CEO桑达尔·皮查伊(Sundar Pichai)今天已经连发了8条帖子介绍Gemini 3。 : center;"> 今天凌晨皮查伊发了条帖子,内容只有一张图,但这张图足够有说服力,Gemini 3 Pro几乎"屠榜",在所有主要竞技场排行榜上排名第一。 : center;"> 在正式发布前,第一财经参与了谷歌面向媒体的小范围沟通会,尽管对模型进展已有预期,但行业的热烈反响 ...
新模型“屠榜”,对话谷歌团队:AI“新旗手”如何诞生
第一财经· 2025-11-19 12:33
从追赶到领先,谷歌让整个AI圈"炸了"。 11月19日,预热已久、全网热议的Gemini 3终于正式亮相。谷歌这次打出的不是小修小补的普通升级,而是一张"王牌"——在几乎所有主流基准测试中实现 全面领先,大模型的竞争格局可能就此改写。甚至有业内人士预言:"未来六个月内,很难有公司能够超越这一成绩。" 发布不久,OpenAI CEO 奥尔特曼与特斯拉CEO 马斯克便先后公开表示祝贺。奥尔特曼称其"看起来是个很棒的模型",评论区则调侃"这句来自竞争对手的 夸奖真是暖心"。马斯克也一如既往地送上"Nice work"的评价。 一向风格严谨的谷歌,这次也显得格外高调。官方博客标题直接打出"开启智慧新纪元",内容中多次强调"最佳""最先进"。谷歌员工也纷纷在社交媒体上为 自家产品助阵,谷歌CEO桑达尔·皮查伊(Sundar Pichai)今天已经连发了8条帖子介绍Gemini 3。 : center;"> 在正式发布前,第一财经参与了谷歌面向媒体的小范围沟通会,尽管对模型进展已有预期,但行业的热烈反响仍超出想象。大家惊叹于谷歌的进步速度,三 个月前做不到的设计现在可以一键生成了,AI编程也是"Next Level"了, ...
Gemini 3的意义:AI已超越“幻觉阶段”,逼近人类,“人机协作”将从“人对AI纠错”走向“人指导AI工作”
华尔街见闻· 2025-11-19 10:28
谷歌最新发布的Gemini 3模型正标志着人工智能领域的一个关键转折点。 Ethan Mollick 华尔街见闻此前提及,美东时间18日周二,谷歌正式发布备受期待的该司迄今最强大人工智能(AI)模型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应 用程序App及多个开发者平台同步上线,在多个盈利产品中投入使用。 谷歌高管在新闻发布会上强调, 在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先地位。 谷歌AI研究实验室DeepMind的CEO Demis Hassabis表示,Gemini 3是"世界上最好的多模态理解模型",也是公司迄今最强大的智能体和代码生成模型。 根据沃顿商学院教授Ethan Mollick的深度测评,Gemini 3的发布及其配套工具"Antigravity"展示了惊人的"代理"能力。与三年前的GPT-3模型相比,AI不再仅仅 是生成文本,而是能够编写代码、构建可交互的应用、执行多步骤任务。 Mollick指出,这种从"描述"到"行动"的飞跃,意味着AI正从一个对话伙伴,演变为一个可以接入计算机并完成实际工作的通用工具。 Mollick的结论是, 我们正从 ...
Gemini 3的意义:AI已超越“幻觉阶段”,逼近人类,“人机协作”将从“人对AI纠错”走向“人指导AI工作”
硬AI· 2025-11-19 09:37
硬·AI 作者 | 叶 桢 编辑 | 硬 AI 谷歌最新发布的Gemini 3模型正标志着人工智能领域的一个关键转折点。 华尔街见闻此前提及 ,美东时间18日周二,谷歌正式发布备受期待的该司迄今最强大人工智能(AI)模 型Gemini 3,并于发布首日立即在谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,在多个盈 利产品中投入使用。 谷歌高管在新闻发布会上强调, 在衡量人工智能模型性能的几个热门行业排行榜上,Gemini 3处于领先 地位。 谷歌AI研究实验室DeepMind的CEO Demis Hassabis表示,Gemini 3是"世界上最好的多模态理解 模型",也是公司迄今最强大的智能体和代码生成模型。 Ethan Mollick认为,Gemini 3的出现意味着具备自主行动能力的"代理模型"正在崛起,它虽然并非完美无瑕,但其所犯 的错误已不再是无中生有的"幻觉",而更接近人类在判断或意图理解上的偏差。随着AI能力的提升,人机协作正从"人类 修复AI的错误"进化为"人类指导AI的工作"。 根据沃顿商学院教授Ethan Mollick的深度测评,Gemini 3的发布及其配套工具"Anti ...
Gemini 3的意义:AI已超越“幻觉阶段”,逼近人类,“人机协作”将从“人对AI纠错”走向“人指导AI工作”
美股IPO· 2025-11-19 09:05
行业技术演进 - 人工智能正从“聊天机器人时代”迈向“数字同事时代”,AI角色从对话伙伴演变为可完成实际工作的通用工具[2][28] - 与三年前的GPT-3模型相比,AI能力实现从“描述”到“行动”的飞跃,不再仅生成文本,而是能编写代码、构建可交互应用、执行多步骤任务[2][7] - 人机协作模式从“人类修复AI的错误”进化为“人类指导AI的工作”,人类角色转变为提供高阶战略指引[2][28] 公司产品发布与能力 - 谷歌正式发布迄今最强大AI模型Gemini 3,并在发布首日立即于谷歌搜索、Gemini应用程序App及多个开发者平台同步上线,投入多个盈利产品中使用[1] - 谷歌高管强调Gemini 3在多个热门行业排行榜上处于领先地位,被描述为“世界上最好的多模态理解模型”及公司迄今最强大的智能体和代码生成模型[1] - 伴随Gemini 3发布的配套工具Antigravity,能将任务派给智能体,智能体在需要批准或帮助时会通知用户,实现用自然语言指挥AI完成代码工作[11][13] 产品性能实测 - Gemini 3展示出惊人的“代理”能力,能根据简单指令(如“做点东西,让大伙儿看看AI这三年进步了多少”)自主创建一个完整的可交互迷你游戏[7][10] - 在处理复杂研究任务时,Gemini 3能自主恢复损坏的STATA格式数据、摸清复杂数据环境,并完成一篇14页的原创学术论文,包括自创指标(如用NLP衡量“众筹创意独特性”)[17][18][21] - 模型错误类型发生转变,不再是无中生有的“幻觉”,而更接近人类在判断或意图理解上的偏差,错误更具可管理性[1][15][25] 产品定位与影响 - Gemini 3被定位为一个极出色的“思考+执行”伙伴,全球数十亿人可随手调用[26] - “会写代码”的能力使AI成为通用工具,能完成在电脑上的任何工作,包括建仪表盘、扒网站、做PPT、读文件等,本质被彻底改写[11] - 产品展现了真正的“判断力”,在部分任务上能达到“合格研究生”的水平,并能根据开放的改进建议显著提升输出质量[16][25]
都别争了,放着我来:Gemini 3生成一切
36氪· 2025-11-19 08:08
产品发布与性能表现 - Gemini 3 Pro 已正式上线,其预览版可在 Google AI Studio 体验,面向大众的网站和 App 版本将很快推出 [1][2] - 在多项基准测试中,Gemini 3 Pro 性能全面超越前代产品 Gemini 2.5 Pro 及主要竞争对手 Claude Sonnet 4.5 和 GPT-5.1 [3] - 在代表抽象推理能力的 ARC-AGI-2 测试中取得 31.1% 的成绩,显著领先于第二名 Claude Sonnet 4.5 的 13.6% [3][4] - 在数学能力测试中表现突出,AIME 2025(无工具)得分达 95.0%,MathArena Apex 得分 23.4%,远超对手的不足 2% [3][4] - 在“人类最后一场闭卷考试”Humanity's Last Exam 中取得当前最高分 37.5%,优于 GPT-5.1 的 26.5% [3][7] - 开启 Deep Think 模式后,模型性能进一步提升,在 Humanity's Last Exam 中得分提升至 41%,在 GPQA Diamond 科学知识测试中得分达 93.8%,在 ARC-AGI-2 中得分高达 45.1% [7][8] 多模态与交互能力 - 模型具备强大的多模态理解和生成能力,可一句话生成高质量、可交互的 3D 模型和 SVG 图像,例如在 35 秒内生成带开关的可操作灯泡 SVG [9][12] - 在屏幕理解测试 ScreenSpot-Pro 中得分 72.7%,远超其他模型,表明其能像人类一样理解并操作 UI 界面 [3][4] - 未来将推出“生成式 UI”功能,模型可直接生成动态、可交互的界面来回答问题,例如生成一个包含可交互元素的罗马旅行计划 [15] - 在长程智能体任务测试 Vending-Bench 2 中,以平均净值 $5,478.16 的表现大幅领先于其他模型,展示了其在复杂跨场景任务中的执行能力 [3][4] 编程与开发能力 - 在竞技编程 LiveCodeBench Pro 测试中,Elo 评级达 2,439 分,高于 GPT-5.1 的 2,243 分 [3] - 具备强大的代码生成与系统构建能力,可根据一段描述生成功能完整的“macOS 操作系统”,并能在此系统内进行上网、运行终端等操作 [22] - 能快速生成功能完备的网站,例如在 1.5 分钟内生成包含四个页面、具有有效交互元素的个人网站,并能根据反馈(如要求更具设计感)在 45 秒内完成迭代 [26][29] - 谷歌发布了名为 Antigravity 的集成开发环境,该平台能让 AI 作为智能体自主跟进开发进度、编写代码、验证效果并学习开发者的编码风格 [38][39] 行业影响与产品定位 - 模型通过与谷歌全家桶的深度集成,在开启 Agent 模式并授权后,能调动用户设备中的数据,实现复杂的个人助理功能,如根据邮件信息预订租车 [5][7] - 技术的进步显著降低了从构思到实现的技术门槛,将竞争的核心转向了想象力 [39] - 公司产品发展路径清晰:Gemini 1 奠定多模态基础,Gemini 2 强化推理与智能体能力,Gemini 3 则通过生成式 UI 实现输出格式的多样化,完成了能力的持续迭代 [39]
谷歌推出Gemini3 上线首日即接入搜索体系
第一财经· 2025-11-19 08:02
产品发布与部署 - 谷歌发布新一代大型语言模型Gemini3,并立即部署至谷歌搜索的AI模式、Gemini应用、API接口、VertexAI等核心产品 [2] - 首席执行官将其描述为"我们最智能的模型" [2] 商业化策略转变 - 人工智能进入商业化竞争阶段,资本市场关注点从"模型升级"转向模型是否能真实推动收入增长和为核心业务带来可观回报 [2] - 竞争者的快速迭代加剧了压力,Gemini 3的策略反映了公司试图加快从技术投入转向实际变现的步伐 [2] - 公司今年的估值支撑更多来自其云业务的AI服务收入,而非模型发布本身 [5] 产品落地策略变化 - 发布日同步接入谷歌搜索,AI生成式搜索结果将直接覆盖数十亿次搜索请求 [4] - 面向消费者的生成式搜索更突出,回答更结构化、更具可视化,呈现方式近似可交互网页 [4] - 性能优势被强调,新模型在多项行业基准测试中表现领先,且能以更快的节奏推向用户,更紧密地支持开发者生态 [4] 新产品功能:AI代理 - 正式推出"Gemini Agents",这是首次将能执行多步骤任务的AI助手以系统化方式向消费者开放 [7] - 演示能力包括自动整理用户邮箱、规划完整旅行行程、执行具备多个步骤链条的复杂任务等 [7] - 面向企业客户,宣布名为"Antigravity"的开发平台,允许AI代理在浏览器、IDE和终端环境中执行部分编码任务 [7] 用户界面与体验 - Gemini应用的界面与生成结果呈现方式整体焕新,更注重结构化布局与可视化内容 [7] - 新的呈现方式有利于回答更复杂的问题,也能提升用户停留时间与交互深度 [7]
谷歌推出Gemini3,上线首日即接入搜索体系
第一财经· 2025-11-19 07:58
2025.11. 19 本文字数:1221,阅读时长大约2分钟 作者 | 第一财经 胡弋杰 当地时间周二,Alphabet旗下谷歌(Google)发布新一代大型语言模型Gemini3,并从发布当天起 将其部署至谷歌搜索的AI模式、Gemini应用、API接口、VertexAI等核心产品。首席执行官桑达尔· 皮查伊(Sundar Pichai)在公司博客中将其描述为"我们最智能的模型"。 分析认为,在人工智能进入商业化竞争阶段后,资本市场对"模型升级"本身的反应逐渐转弱,关注点 更集中于:模型是否能真实推动收入增长、是否能为核心业务带来可观回报。OpenAI、Anthropic 等竞争者的快速迭代被认为加剧了这一压力,Gemini 3的策略某种程度上反映了谷歌试图加快从技 术投入转向实际变现的步伐。 从"比模型"转向"比应用" 此次Gemini 3的落地策略呈现三个显著变化: 第一,发布日同步接入谷歌搜索。不同于此前版本需要数周甚至更久才能进入搜索体系,Gemini3在 发布当天即投入使用。这意味着AI生成式搜索结果将直接覆盖数十亿次搜索请求。 第二,面向消费者的生成式搜索更突出。Gemini3在AI搜索模式中 ...