Workflow
前端危,Gemini 3内测结果获网友一致好评,“有史以来最强前端开发模型”
36氪·2025-10-14 07:51

产品性能与能力 - 下一代旗舰模型Gemini 3在编程领域表现卓越,尤其擅长前端开发和SVG矢量图生成,被网友称为“有史以来最出色的前端和网页开发模型”[1] - 模型多模态能力显著增强,能够根据简短提示词直接生成可运行的黑洞可视化效果、带动画的SVG以及原创钢琴曲[1] - 在号称最难的“人类最后考试HLE基准”上,Gemini 3.0取得32.4%的最高分,性能超过GPT-5(high)和Grok 4[10] - 模型物理原理理解能力提升,能正确应对“数手指”陷阱,在测试中准确回答出6根手指,而直接调用模型知识会错误回答5根[21] - 对于游戏背景图等要求更高的图像生成任务,Gemini 3.0能输出精致结果,例如绘制《我的世界》时几乎每一帧都透露着精致[15] 技术规格与架构 - Gemini 3预计推出两个版本:Gemini 3.0 Pro和Gemini 3.0 Flash[3] - Gemini 3.0 Pro采用MoE架构,拥有数万亿参数,但每次查询仅需激活150~200亿参数[4] - 模型上下文窗口从100万扩展至数百万,并内置深度思考模式和多模态功能,支持视频、图片、音频处理[4] - 在超高难度的通用智力测试ARC-AGI-2上,开启思考模式的Gemini 3.0准确率接近35%,而其他模型均在20%以下[6] 市场反应与测试反馈 - 模型未发布便已通过内测在社交媒体引发广泛关注,网友对其能力给予高度评价,并有人断言其已预定年度最佳模型[1] - 内测显示模型在零样本提示下能生成蕴含卡尔达舍夫等级3文明内容的演示网站,展现出强大推理能力[9] - 与之前版本相比,产品升级效果肉眼可见,例如在手柄渲染图生成上,Pro版本的输出与真实产品图相当接近,而几个月前测试Gemini 2.5 Ultra的结果则差距较大[12][13] - 在智能体函数调用方面,据网友爆料Gemini 3.0将带来新的改变,但具体细节因保密暂未透露[22] 产品发布计划 - 谷歌内部研究人员曾在国庆期间预热产品发布,坊间一度传闻上线时间为10月9日,但已被证伪[23] - 根据Reddit网友扒出的疑似谷歌内部文件,产品发布时间显示为10月22日[24] - 网友对正式上线版本表示期待,并希望公司不要对产品功能进行“阉割”[26]