Gemini 3.0 Flash
搜索文档
OpenAI图像模型实测口碑两极分化,被调侃“画风辣眼”
第一财经· 2025-12-17 16:37
就在谷歌暗示将发布Gemini 3.0 Flash模型时,OpenAI抢先发布了其新一代图像模型GPT Image 1.5,对标谷歌的Nano Banana。从跑分来看已经超过谷歌夺得第一,不过实际用户测试反馈呈现两极 分化,不少人认为其AI味较重。 本文字数:2087,阅读时长大约4分钟 作者 | 第一财经 刘晓洁 封图 | AI生成 2025.12. 17 为了制造话题,OpenAI直接拿CEO奥尔特曼(Sam Altman)当案例演示生图效果。而奥尔特曼本人 也晒出了自己用GPT Image 1.5生成的"消防员写真年历",被调侃"画风辣眼"。 OpenAl @OpenAI most likely to launch a new image model OpenAI表示,这一代模型具备更强的指令遵循,更精准的图像编辑,也能较好地保留细节,生成速度 是上一代模型的4倍。新的图像模型今天在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5提供。 这次OpenAI还实施了降价措施,GPT Image 1.5中的图像输入和输出比上一代便宜了20%,因此用户 可以在相同的预算下生成和迭代 ...
跑分第一,实战拉胯,GPT Image 1.5被骂惨,奥特曼这波悬了
36氪· 2025-12-17 16:27
OpenAI深夜祭出大招,全新GPT Image 1.5重磅出世,拿下榜单双料第一,实力碾压谷歌Nano Banana Pro。但全网实测,骂声一片。 谷歌刚传出要发Gemini 3.0 Flash,结果OpenAI反手就是一个「王炸」。 就在刚刚,OpenAI抛出了它的「圣诞彩蛋」——新一代旗舰图像模型ChatGPT Images正式登场。 这一次,OpenAI将生图能力直接拉满: 精准操控: 指令理解力大幅提升,真正做到「指哪改哪」。 细节狂魔: 画面细节保留完整,质感细腻。 极速生成: 速度较前代提升了整整4倍。 而且从今天起,所有ChatGPT免费用户即可上手,开发者也可直接调用GPT Image 1.5 API。 在LMArena竞技场上,它似乎不可战胜: 文生图:以1264 Elo分登顶榜首,力压谷歌Nano Banana Pro(NBP)。 图像编辑:chatgpt-image-latest以3分优势险胜NBP夺冠,而GPT Image 1.5紧随其后位列第4。 在Artificial Analysis上,更是拿下了「双料第一」。 | Rank 14 | Rank Spread O (Upper ...
反击谷歌!OpenAI图像模型冲上榜首,实测口碑却两极分化
第一财经· 2025-12-17 16:09
不少人认为新模型AI味较重。 就在谷歌暗示将发布Gemini 3.0 Flash模型时,OpenAI抢先发布了其新一代图像模型GPT Image 1.5,对标谷歌的Nano Banana。从跑分来看已经超过谷歌夺得 第一,不过实际用户测试反馈呈现两极分化,不少人认为其AI味较重。 为了制造话题,OpenAI直接拿CEO奥尔特曼(Sam Altman)当案例演示生图效果。而奥尔特曼本人也晒出了自己用GPT Image 1.5生成的"消防员写真年 历",被调侃"画风辣眼"。 不过,与谷歌Nano Banana Pro的实际对比才是行业关注的焦点所在。有观点认为这是OpenAI被谷歌打乱节奏后的仓促应战,也有评测指出该模型确实具备 与谷歌一较高下的实力。 第一财经记者用GPT Image 1.5和Nano Banana Pro分别进行了生图测试,从这个测试来看,两个模型各有优缺点。GPT Image 1.5在画面质感和提示词遵循上 表现更好,但对中文支持明显不足,生成文字错误频出;Nano Banana Pro在文字准确性上占优,却在构图指令遵循上屡屡失误。 OpenAI表示,这一代模型具备更强的指令遵循,更精准的 ...
前端危,Gemini 3内测结果获网友一致好评,“有史以来最强前端开发模型”
36氪· 2025-10-14 07:51
产品性能与能力 - 下一代旗舰模型Gemini 3在编程领域表现卓越,尤其擅长前端开发和SVG矢量图生成,被网友称为“有史以来最出色的前端和网页开发模型”[1] - 模型多模态能力显著增强,能够根据简短提示词直接生成可运行的黑洞可视化效果、带动画的SVG以及原创钢琴曲[1] - 在号称最难的“人类最后考试HLE基准”上,Gemini 3.0取得32.4%的最高分,性能超过GPT-5(high)和Grok 4[10] - 模型物理原理理解能力提升,能正确应对“数手指”陷阱,在测试中准确回答出6根手指,而直接调用模型知识会错误回答5根[21] - 对于游戏背景图等要求更高的图像生成任务,Gemini 3.0能输出精致结果,例如绘制《我的世界》时几乎每一帧都透露着精致[15] 技术规格与架构 - Gemini 3预计推出两个版本:Gemini 3.0 Pro和Gemini 3.0 Flash[3] - Gemini 3.0 Pro采用MoE架构,拥有数万亿参数,但每次查询仅需激活150~200亿参数[4] - 模型上下文窗口从100万扩展至数百万,并内置深度思考模式和多模态功能,支持视频、图片、音频处理[4] - 在超高难度的通用智力测试ARC-AGI-2上,开启思考模式的Gemini 3.0准确率接近35%,而其他模型均在20%以下[6] 市场反应与测试反馈 - 模型未发布便已通过内测在社交媒体引发广泛关注,网友对其能力给予高度评价,并有人断言其已预定年度最佳模型[1] - 内测显示模型在零样本提示下能生成蕴含卡尔达舍夫等级3文明内容的演示网站,展现出强大推理能力[9] - 与之前版本相比,产品升级效果肉眼可见,例如在手柄渲染图生成上,Pro版本的输出与真实产品图相当接近,而几个月前测试Gemini 2.5 Ultra的结果则差距较大[12][13] - 在智能体函数调用方面,据网友爆料Gemini 3.0将带来新的改变,但具体细节因保密暂未透露[22] 产品发布计划 - 谷歌内部研究人员曾在国庆期间预热产品发布,坊间一度传闻上线时间为10月9日,但已被证伪[23] - 根据Reddit网友扒出的疑似谷歌内部文件,产品发布时间显示为10月22日[24] - 网友对正式上线版本表示期待,并希望公司不要对产品功能进行“阉割”[26]
谷歌Gemini 3.0「全家桶」年度压轴,前端不再需要人类,下周王者降临
36氪· 2025-10-13 10:15
产品发布与开发进度 - 谷歌下一代旗舰AI模型Gemini 3 0预计将于2025年10月22日正式发布[1][2] - 产品开发遵循明确的里程碑时间表 包括内部测试阶段如Teamfood已于2025年8月25日完成 Fishfood于2025年9月26日完成 后续将进行AIM Dogfood和Google Dogfood测试 最终发布和推广计划在2025年11月12日进行[2] - Gemini 3 0 Pro版本已在最新的Gemini CLI提交中被引用 表明技术集成已进入后期阶段[8] 产品规格与技术架构 - Gemini 3 0采用了混合专家模型架构 参数量超万亿 每次查询激活的参数量为150亿至200亿[9] - 模型的上下文长度从100万token跃升至数百万token 具备处理整本书籍或完整代码库的能力[9] - 产品家族预计将包含Gemini 3 0 Pro Gemini 3 0 Flash和Gemini 3 0 Ultra等多个版本[5][6] 功能演示与性能表现 - 模型在多项前端开发任务中表现出色 能够根据单一指令直接生成完整网页 复杂游戏和原创音乐[1][3][4] - 在具体测试中 Gemini 3 0能一次性成功生成如"太空侵略者"游戏 "城堡防御"游戏以及古代艺术博物馆网页等复杂内容[13][14] - 在视觉生成能力上表现突出 例如能生成遵循物理定律的3D六边形小球动画 并将"骑自行车的鹈鹕"这类测试提示转化为3D像素艺术 效果显著优于早期模型[3][17][26] 市场表现与开发背景 - Gemini系列产品在2025年9月实现了46 24%的环比增长率 增速高于ChatGPT Claude和Grok等其他同类产品[35] - Gemini 3 0 Pro的训练始于2025年4月 预训练阶段于2025年7月左右结束 之后进行了约2至3个月的后训练工作[38] - 其前代产品Gemini 2 5 Pro和Flash版本已于2025年6月17日进入正式状态[41]