产品发布与市场地位 - Google Gemini 3 Pro模型在等待238天后正式上线[16] - 该模型在LMARENA AI排行榜中排名第一,得分1501分,领先于Grok 4 1 Thinking的1484分和Gemini 2 5 Pro的1451分[19][20] - 产品已在Google AI Studio和网页版上线,可供使用[21][23] 性能基准测试表现 - 在Humanity's Last Exam学术推理测试中,Gemini 3 Pro得分37 5%,使用工具后提升至45 8%,显著高于Gemini 2 5 Pro的21 6%和GPT 5 1的26 5%[25][29][30] - MathArena Apex超高难度数学测试中,Gemini 3 Pro得分23 4%,而GPT 5 1仅1%,Claude Sonnet 4 5为1 6%[25][34][35][36] - ScreenSpot Pro屏幕理解测试得分72 7%,远超GPT 5 1的3 5%和Claude Sonnet 4 5的36 2%[25][38] - LiveCodeBench Pro编程测试Elo评分达2439,高于GPT 5 1的2243和Gemini 2 5 Pro的1775[25] - Vending Bench 2长周期任务测试平均净值5478 16美元,显著高于Claude Sonnet 4 5的3838 74美元和GPT 5 1的1473 43美元[25] 前端开发能力展示 - 模型能够根据文字描述快速生成复杂前端代码,如体素艺术场景仅需十几秒完成[44][46] - 成功开发交互式黑胶唱片音乐播放器,具备播放控制和唱臂动画等细节功能[55][56] - 实现像素画板应用,支持绘制 撤销 导出GIF和作画过程回放等完整功能[57][58] - 通过图像识别直接复刻网页前端布局,二十多秒即可生成可用的前端代码[62][64] - 完成类Windows操作系统的Web OS开发,包含文本编辑器 终端 游戏等多项功能,代码生成耗时约2分钟[69][71][72] 行业影响与竞争格局 - 模型在多模态理解测试MMMU Pro中得分81%,高于GPT 5 1的76%和Claude Sonnet 4 5的68%[25] - 在长上下文性能测试MRCR v2中,128k平均得分77%,1M点状得分26 3%,支持超长文本处理[25] - 软件工程能力略逊于GPT 5 1和Claude Sonnet 4 5,但在其他领域表现断档领先[25] - 该产品发布引发行业关注,包括OpenAI首席执行官Sam Altman在内的业内人士表示祝贺[77]
实测Gemini 3 Pro:此即未来