全栈式方法
搜索文档
谷歌 Gemini 3:这代“最强大脑”,到底强在哪?
36氪· 2025-11-19 08:13
核心观点 - Gemini 3的发布标志着AI能力从“回答问题”向“完成工作”的根本性转变,其核心优势体现在卓越的任务执行能力、极高的分发效率以及由全栈式方法构筑的深厚生态护城河 [1][3][37] 任务执行能力 - 模型以1501分登顶LMArena排行榜,成为首个突破1500分的模型,在多项基准测试中创下新高 [4] - 在包含博士级难题的“人类的最后考试”基准测试中得分37.5%,相比上一代Gemini 2.5 Pro的21.6%接近翻倍 [6] - 在GPQA Diamond(博士级推理能力)上达到91.9%,在数学推理的MathArena Apex上取得23.4%的最高分 [6] - 核心进步在于多步骤推理能力,能够自动分解并执行复杂任务,例如自动整理收件箱或根据一句话需求生成完整的2D游戏代码 [7][8] - 团队关注的新指标从“回答了多少问题”转变为“完成了多少任务”,体现了AI工作方式的根本性改变 [9][10] 分发效率 - 谷歌首次在发布当天就将新模型集成到现有产品中,实现了数十亿用户的即时覆盖 [1][14] - 具体覆盖规模包括:搜索的AI Overviews覆盖20亿月活用户,Gemini App月活超过6.5亿,1300万开发者使用生成模型,70%的云客户使用AI服务 [14] - 分发路径是“嵌入式”而非“独立产品”,用户无需下载新应用、注册账号或改变习惯即可使用AI能力,例如在搜索、Gmail、Android系统或Docs中无缝调用 [15][16][17][18][19] 生态护城河 - 公司采用差异化的全栈式方法,控制了从自研TPU芯片、数据中心、模型到终端产品的整条链路,形成了不可复制的优势 [23][27][30] - 第一层优势是算力自主:自研TPU使公司能掌控成本和性能,而OpenAI前9个月算力支出超86亿美元,Anthropic向Azure购买300亿美元算力 [29] - 第二层优势是数据闭环:搜索每日数十亿次查询、Gmail数百亿封邮件、YouTube数十亿次观看,提供了持续的训练数据和优化反馈 [29] - 第三层优势是产品矩阵:搜索、Gmail、Android等产品既是用户入口,也是真实的能力验证场,构成了其他公司难以企及的生态壁垒 [30][36]