人工智能图像生成 - 财报，业绩电话会，研报，新闻

人工智能图像生成

搜索文档

量子位· 2026-05-06 15:25

允中发自凹非寺量子位 | 公众号 QbitAI 一支不到15人的团队，把图像模型做到了全球第三。 5月6日凌晨，Luma AI正式宣布开放 Uni-1.1 API 。几乎在同一时间，由第三方机构Arena.ai发布的图像生成榜单，完成了最新一轮的"大洗牌"—— Luma凭UNI-1.1与UNI-1.1-Max直接冲进全球前三，仅次于 OpenAI（gpt-image-2）和 Google（nano-banana-2）。 | Lab Rank O C | Lab C | Model Score O ↓ | | Model Rank | | --- | --- | --- | --- | --- | | 1 | OpenAI G gpt-image-2 (medium) · Proprietary | 1398 ±8 | Preliminary | | | 2 | Google G gemini-3.1-flash-image-preview (nano-banana-2) [web-search] · Proprietary | 1268 ±5 | | 2 | | 3 | Luma AI uni ...

人工智能图像生成

Artificial Intelligence

Artificial Intelligence

机器之心· 2026-05-01 18:00

模型发布与演示 - 公司发布了名为GPT Image 2的生成式AI图像模型，该模型由团队的研究科学家陈博远主力训练 [1] - 公司联合创始人山姆·奥特曼与研究科学家陈博远共同主持了发布会，并在会上演示了模型的文字渲染能力 [3] - 模型发布前以“duct-tape”（布基胶带）为代号在LMArena平台上进行了双盲测试，测试结果“断崖领先”代号为“小香蕉”的第二名模型 [3][8] 模型核心能力与测试表现 - 模型具备强大的中文渲染能力，此次发布修复了相关功能 [1] - 模型展示了卓越的多语言文字渲染能力，包括生成特别微小的中文细节 [12] - 模型在双盲测试中表现优异，大幅领先竞争对手 [8] 技术演示与创意应用 - 整个发布会官网博客的内容完全由模型生成的图片构成，没有使用文本 [1][10] - 模型能够一次性生成包含“画中画”和“画中画中画”的复杂图像，模拟出对真实漫画书拍摄的效果 [12] - 为展示文字渲染的极致细节，团队制作了一张包含众多米粒的4K图像，其中一粒米上刻有文字 [14] - 模型能够执行视觉推理任务，例如根据提示词“在黑板上用视觉（而不是代数）证明从1开始的奇数之和是一个平方”，生成相应的图形化解法 [21] - 模型展示了结合真实物体与艺术布局的设计能力，以体现其对真实世界的还原度和设计感 [19] - 模型具备搜索与整合能力，例如根据指令搜索官网商店内容并生成海报，并能在“Thinking mode”下自动生成包含可扫描二维码的图片 [22] 团队协作与发布准备 - 发布会的成功举办和精美网站的呈现得益于研究团队、市场部门及艺术团队的通力协作 [25] - 在发布前最后阶段，团队专注于修复细节并与相关部门共同筹备发布会及网站 [25]

人工智能图像生成

Artificial Intelligence

GPT Image 2

人工智能图像生成

Artificial Intelligence

GPT Image 2