模型发布与演示 - 公司发布了名为GPT Image 2的生成式AI图像模型,该模型由团队的研究科学家陈博远主力训练 [1] - 公司联合创始人山姆·奥特曼与研究科学家陈博远共同主持了发布会,并在会上演示了模型的文字渲染能力 [3] - 模型发布前以“duct-tape”(布基胶带)为代号在LMArena平台上进行了双盲测试,测试结果“断崖领先”代号为“小香蕉”的第二名模型 [3][8] 模型核心能力与测试表现 - 模型具备强大的中文渲染能力,此次发布修复了相关功能 [1] - 模型展示了卓越的多语言文字渲染能力,包括生成特别微小的中文细节 [12] - 模型在双盲测试中表现优异,大幅领先竞争对手 [8] 技术演示与创意应用 - 整个发布会官网博客的内容完全由模型生成的图片构成,没有使用文本 [1][10] - 模型能够一次性生成包含“画中画”和“画中画中画”的复杂图像,模拟出对真实漫画书拍摄的效果 [12] - 为展示文字渲染的极致细节,团队制作了一张包含众多米粒的4K图像,其中一粒米上刻有文字 [14] - 模型能够执行视觉推理任务,例如根据提示词“在黑板上用视觉(而不是代数)证明从1开始的奇数之和是一个平方”,生成相应的图形化解法 [21] - 模型展示了结合真实物体与艺术布局的设计能力,以体现其对真实世界的还原度和设计感 [19] - 模型具备搜索与整合能力,例如根据指令搜索官网商店内容并生成海报,并能在“Thinking mode”下自动生成包含可扫描二维码的图片 [22] 团队协作与发布准备 - 发布会的成功举办和精美网站的呈现得益于研究团队、市场部门及艺术团队的通力协作 [25] - 在发布前最后阶段,团队专注于修复细节并与相关部门共同筹备发布会及网站 [25]
我在OpenAI修中文
机器之心·2026-05-01 18:00