ChatGPT Images - 财报，业绩电话会，研报，新闻

ChatGPT Images

搜索文档

Factbox-From OpenAI to Nvidia, firms channel billions into AI infrastructure as demand booms

Yahoo Finance· 2026-02-24 20:24

超大规模AI芯片与云计算交易 - 超微公司同意在五年内向Meta Platforms出售价值高达600亿美元的人工智能芯片该协议允许Meta购买高达超微公司10%的股份 [1][9] - 超微公司将向Meta供应总计六吉瓦的芯片首批一吉瓦的MI450旗舰硬件将于今年下半年交付 [10] - 英伟达计划向OpenAI投资高达1000亿美元并为其提供数据中心芯片此举将使英伟达获得OpenAI的财务股权 [5] - 据报道甲骨文与OpenAI签署了有史以来最大的云交易之一 OpenAI预计将在约五年内从甲骨文购买价值3000亿美元的计算能力 [6] - CoreWeave在3月与OpenAI签署了一份为期五年价值119亿美元的合同此举发生在该英伟达支持的初创公司IPO之前 [7] OpenAI的战略合作与融资 - 亚马逊正考虑向OpenAI投资约100亿美元但谈判仍处于“非常不确定”的阶段 [1] - 华特迪士尼将向OpenAI投资10亿美元并允许OpenAI在其Sora AI视频生成器中使用来自星球大战皮克斯和漫威系列的角色根据一项为期三年的许可协议 Sora和ChatGPT Images将于明年初开始生成包含米老鼠灰姑娘和木法沙等授权迪士尼角色的视频 [2] - OpenAI已与博通合作生产其首款内部人工智能处理器这是这家全球最具价值初创公司为应对服务需求激增而寻求计算能力的最新合作 [3] - 超微公司同意在一项多年协议中向OpenAI供应人工智能芯片该协议也将给予ChatGPT创造者购买高达该芯片制造商约10%股份的选择权 [4] 大型AI基础设施项目 - Stargate是软银 OpenAI和甲骨文为建造数据中心而成立的合资企业该项目于1月由美国总统唐纳德·特朗普宣布他表示这些公司将投资高达5000亿美元用于人工智能基础设施 [8]

Artificial Intelligence

Cloud Computing

Semiconductors

Cloud Computing

Artificial Intelligence Chips

ChatGPT

Artificial Intelligence

Cloud Computing

Semiconductors

Cloud Computing

Artificial Intelligence Chips

ChatGPT

被起诉的AI独角兽，这样回应好莱坞

搜狐财经· 2025-12-23 20:30

核心观点 - AI公司与版权方的关系正从法庭对抗转向规则框架内的交易与合作行业迎来戏剧性拐点 [2] - MiniMax在招股书中首次详细回应版权诉讼核心立场是未侵权且败诉影响有限 [2] - 迪士尼与OpenAI的战略合作是标志性事件显示版权方主动参与AI生态收益分配 [17][19] 诉讼指控与争议焦点 - 2025年9月16日迪士尼、环球影业和华纳兄弟在加州起诉MiniMax 指控其视频生成工具“海螺AI”在训练、生成与推广三环节侵权 [4] - 训练阶段指控：未经许可从互联网抓取并使用大量受版权保护的电影、动画内容用于AI模型训练 [4] - 生成阶段指控：用户输入简单提示词即可生成高度相似、细节完整的图片或视频模型已“记住”受保护作品 [6] - 推广阶段指控：在官网及社交媒体直接展示侵权生成内容使用迪士尼等IP角色宣传并标注自家水印构成“系统性鼓励侵权” [6] - 全球类似诉讼争议焦点高度相似：训练阶段是否构成合理使用输出阶段是否形成对原作品的“替代效果” [9] MiniMax的抗辩与风险评估 - 提出“工具中立论”：海螺AI仅根据用户输入生成内容无复制传播特定作品的主观故意不构成直接侵权 [7] - 强调“无直接获利”：海螺AI是为合法用途设计的通用创意工具未从被指控的侵权内容中获得直接经济利益不构成共同或间接侵权 [7] - 抗辩核心落在“合理使用”与“工具中立”：训练阶段使用内容仅用于学习统计规律和一般特征具有高度转化性不会复制具体表达性内容 [8] - 试图压低潜在赔偿金额：原告主张涉及约500件已注册作品每件最高15万美元合计最高7500万美元索赔 [10] - MiniMax认为具备法定赔偿资格的“作品”数量远低于原告主张且非故意侵权赔偿上限通常为每部作品不超过3万美元 [10] - 公司结论：即便最终败诉并全额赔偿7500万美元该金额在公司可用财务资源中所占比例有限且预计随业务增长及诉讼周期拉长进一步下降 [12] - 试图淡化好莱坞IP对业务的重要性称其并非用户参与、收入或增长的核心驱动因素 [12] 诉讼背后的深层风险与行业影响 - 败诉可能带来长期“许可费陷阱”：需按生成量或营收规模持续向版权方支付许可费用侵蚀AI视频业务本已有限的毛利空间 [13] - 产品可能面临“功能性阉割”：若法院发布广泛禁令公司或需下架部分核心功能或实施严格过滤机制影响产品差异化和用户体验 [13] - 竞争格局可能加速分化：行业正出现版权方与AI公司由对抗转向合作的趋势若无法及时建立类似授权或联盟关系将在竞争中处于不利位置 [14] - 版权诉讼是过渡性工具行业正试图通过授权、分润、质量约束和技术整改把冲突转化为可计价、可协商、可持续的关系 [19] 行业合作新范式：迪士尼与OpenAI案例 - 2025年12月11日迪士尼与OpenAI宣布达成战略合作建立资本联结与收益分配体系 [17] - 迪士尼将对OpenAI进行10亿美元股权投资并获得未来增持股份的认股权证成为其重要战略股东与主要企业客户 [17] - OpenAI获准在创作中使用迪士尼旗下庞大IP资源库涵盖四大品牌超200个经典角色 [17] - 双方将共同开发面向Disney+流媒体平台用户的新产品与互动体验用户生成的优质授权内容有机会在Disney+官方平台播放 [17] - 合作意味着版权方将AI趋势商业化为角色在AI视频中的呈现设定质量标准并收集粉丝使用数据 [18] - 娱乐巨头与AI领军企业结盟是一道分水岭版权方开始主动参与AI生态的收益分配 [19] 行业历史诉讼案例概览 - 2023年2月：Getty Images起诉Stability AI 指控未经许可抓取图片用于训练AI 2023年11月英国法院基本裁定AI公司获胜 [16] - 2023年9月：乔治·马丁等17位作家起诉OpenAI 指控使用受版权保护作品训练ChatGPT [16] - 2023年12月：《纽约时报》起诉OpenAI 指控抓取新闻内容训练模型法院裁定部分内容构成“实质相似” [16] - 2024年6月：多名作者及出版商起诉Anthropic 指控非法抓取书籍内容 2025年9月双方达成约15亿美元和解协议 [16] - 2024年6月：索尼、环球、华纳及美国唱片业协会起诉Suno&Udio 指控非法复制和存储数万首受版权保护的录音及歌词 [16] - 2025年6月：迪士尼、环球影业等好莱坞大厂起诉Midjourney 指控未获授权使用影视IP训练、输出侵权图像 [16] - 2025年9月：迪士尼、环球影业等起诉MiniMax（海螺AI）指控视频模型未经授权“喂”影视数据且生成内容精准复刻经典形象 [16] - 2025年12月：迪士尼向谷歌发函指控其利用AI模型及相关服务大规模侵犯迪士尼版权要求叫停涉嫌侵权的AI系统 [16]

Walt Disney (DIS) Invests $1 Billion in OpenAI Deal

Yahoo Finance· 2025-12-21 22:44

公司与OpenAI的战略合作 - 华特迪士尼公司向OpenAI投资10亿美元，并达成一项为期三年的合作伙伴关系 [1][2] - 根据许可协议，从2026年初开始，OpenAI的Sora AI视频生成器和ChatGPT Images将能够生成包含迪士尼旗下角色的视频，例如木法沙、灰姑娘和米老鼠 [3] - 该协议不包括任何演员的形象或声音使用权 [3] 合作内容与战略意图 - 此次合作旨在利用生成式AI技术，审慎地扩展公司的叙事能力，同时尊重和保护创作者及其作品 [3] - 首席执行官鲍勃·艾格此前在11月的投资者电话会议上曾暗示此战略，指出AI将帮助公司为Disney+用户提供工具，以创作和享受用户生成内容，主要是短视频形式 [4] - 根据协议，一部分用户生成的视频将可以在Disney+上播放，使该平台能够从短视频内容日益增长的需求中受益 [4] 对行业的影响与意义 - 此次合作标志着好莱坞拥抱生成式AI的关键时刻，并有可能改变好莱坞的内容创作方式 [2] - 该合作绕开了关于AI损害就业或知识产权的担忧 [2] - 协议允许OpenAI在其Sora AI视频生成器中使用来自《星球大战》、皮克斯和漫威的角色 [1] 公司业务背景 - 华特迪士尼公司是一家美国跨国大众媒体和娱乐集团，通过三个核心业务部门运营：迪士尼娱乐、ESPN和迪士尼体验 [5]

Generative AI

Entertainment Conglomerates

Entertainment Conglomerates

Disney+

Sora

ChatGPT Images

计算机行业研究：阿里巴巴发布视频生成模型万相 2.6，0penAl推出ChatGPTlmages

国金证券· 2025-12-21 19:28

行业投资评级 * 报告未明确给出计算机行业的整体投资评级 [4][6][9][11] 核心观点 * 报告认为，11月计算机板块表现较弱主要源于风险偏好承压，估值波动解释了板块波动的**60-80%**[4][11] * 外部压力包括海外局部冲突、美国AI泡沫争议导致相关企业股价回调、美元降息预期波动等[4][11] * 内部压力包括基本面收入端不强、部分机构投资者年底获利了结[4][11] * 预计连续三个月的回调为后续春季躁动酝酿了空间，在非熊市阶段，板块回调**2-4个月**后通常会有新一轮弹性[4][11] * 从投资机会看，需求的景气方向在出海，技术的景气方向在AI产业链，政策的景气方向在国产替代[4][11] 本周观点总结 * **计算机行业观点**：板块近期回调主要受风险偏好压制，但为未来反弹创造了空间，投资应聚焦出海、AI产业链和国产替代三大方向[4][9][11] * **细分板块观点**：报告对2025年各细分赛道景气度进行了详细划分[4][10][11][12] * **高景气维持**：AI算力、激光雷达[4][10][11] * **加速向上**：AI应用（软件）[4][10][11] * **稳健向上**：软件外包、金融IT、量子计算、数据要素、EDA、出海、信创[4][11][12] * **拐点向上**：教育IT、网安、企业服务[4][11][12] * **底部企稳**：智慧交通、政务IT、安防、建筑地产IT[4][11][12] * **略有承压**：工业软件[4][11][12] * **持续承压**：医疗IT[4][11][12] 重点事件与动态 * **阿里巴巴**于12月17日发布视频生成模型“万相2.6”系列，是国内首个支持声画一致性角色定制的视频模型[4][11] * **小米**于12月18日发布参数量为**309B**的开源大模型MiMo-V2-Flash，其推理成本仅为Claude 4.5 Sonnet的**2.5%**，在SWE-Bench评测中以**73.4%**的评分领先[4][11] * **OpenAI**于12月17日更新ChatGPT图像生成功能，推出旗舰图像模型GPT Image 1.5及其API服务[4][11] * **SpaceX**启动IPO流程，目标募资额预计超过**300亿美元**，寻求整体估值接近**1.5万亿美元**[4][11] * **Google**于12月18日发布Gemini3 Flash模型，将其设为默认模型，平均token使用量较Gemini 2.5 Pro减少约**30%**，定价为输入每百万token **0.50美元**，输出每百万token **3美元**[4][11] * **激光雷达**：10月国内ADAS激光雷达（仅标配）装机量约**35.3万颗**，同比增长**118.2%**；1-10月累计装机量约**226.2万颗**，同比增长**95.5%**，符合全年翻倍增长预期[12] * **重点事件前瞻**：2025年12月22日，智元机器人将举办全国机器人租赁生态峰会[25][26] 市场行情回顾 * 2025年12月15日至12月19日，计算机行业指数（申万）下降**0.68%**，跑输沪深300指数**0.4**个百分点[13] * 在31个申万一级行业中，计算机行业本周排名中等靠后[13][16] * 本周计算机板块涨幅前五的公司为万集科技(**29.2%**)、新利软件(**23.3%**)、索菱股份(**21.9%**)、嘉和美康(**21.1%**)、经纬恒润(**20.6%**)[14][17][18] * 跌幅前五的公司为实达集团(**-8.3%**)、达华智能(**-8.3%**)、商汤-W(**-11.7%**)、品高股份(**-11.8%**)、三六零(**-16.4%**)[14][17][18] * 报告期内（12月15日至19日），三市股票日均成交额为**1.76万亿元**，同比上升**31.9%**，环比下降**9.9%**；截至12月18日，两融余额为**2.49万亿元**，同比上升**35.6%**，环比下降**0.65%**[19] 投资建议 * 建议关注国内生成式大模型龙头**科大讯飞**[4] * AI硬件有望成为应用落地新载体，建议关注**海康威视**、**虹软科技**、**禾赛**等[4] * AI相关功能打磨能带动付费率、Arpu值提升，建议关注**迈富时**等[4]

智谱招股书透露风险：“我们可能无法保护用户数据”丨合规周报

21世纪经济报道· 2025-12-21 12:03

AI动态 - 智谱通过港交所聆讯并披露招股书其2022年、2023年、2024年净亏损分别为1.43亿元、7.88亿元、29.58亿元 2025年上半年净亏损达23.58亿元累计亏损超62亿元 [1] - 智谱招股书提及其GLM-4S模型在2025年9月RAG领域的LLM幻觉排行榜中幻觉率为全球第二低及中国最低 [1] - 智谱招股书指出中国人工智能行业监管环境日益严格未来可能出台的法律法规可能对公司业务产生重大不利影响 [2] - 智谱目前未被认定为关键信息基础设施运营者但无法保证未来其MaaS平台不会被归类为关键信息基础设施 [2] - 智谱招股书坦陈由于网络安全及数据保护法规诠释存在不确定性公司可能无法完全保护用户数据 [2] - 智谱业务运营中可能从第三方及公开来源获取训练数据但无法保证这些数据的合法性若数据获取不合规可能对公司服务及声誉造成重大不利影响 [3][4] - 智谱指出现有数据处理技术存在局限无法保证能有效过滤或匿名化从第三方及公开来源获得的数据以完全符合法规 [4] - 智谱招股书提到人工智能技术可能被使用者滥用从而对公司声誉及业务造成重大不利影响 [4] - 迪士尼宣布与OpenAI达成深度合作包括向OpenAI进行10亿美元股权投资并获得认股权证这是Sora平台首次迎来大型内容授权合作伙伴 [5][6] - OpenAI的Sora和ChatGPT Images将获得迪士尼旗下超200个角色授权包括米老鼠、漫威、皮克斯和星球大战角色但不包含真人肖像或声音 [6] - 迪士尼将利用OpenAI的API为Disney+流媒体平台构建新产品工具为员工部署ChatGPT用于内部工作流程粉丝精选创作视频将在Disney+播放 [6] - 千问宣布接入高德地图针对涉及地理位置的问题能够调用高德地图等数据生成可视化决策卡片用户点击卡片可在高德App中唤起导航或打车服务 [7] 平台治理 - 国家发展改革委、市场监管总局、国家网信办三部门印发《互联网平台价格行为规则》规定平台内经营者在不同平台销售商品或提供服务可依法自主定价 [7] - 《规则》要求平台经营者不得通过提高收费、限制流量、搜索降权、屏蔽店铺等措施强制或变相强制平台内经营者降价、进行促销或不得高于其他渠道价格 [7][8] - 《规则》明确禁止平台经营者强制或变相强制平台内经营者开通自动跟价、自动降价或类似系统 [7][8] - 《规则》禁止平台经营者及平台内经营者利用平台规则、数据和算法等手段相互串通操纵市场价格 [8] - TikTok CEO周受资宣布字节跳动、TikTok已与三家投资者签署协议将成立名为“TikTok美国数据安全合资有限责任公司”的新美国合资公司负责美国的数据保护、算法安全、内容审核和软件保障 [8] - 最高人民法院对《民事案件案由规定》进行第三次修正修改后的规定共有1055个案由 [9] - 修正案围绕服务发展新质生产力增加了数据、网络虚拟财产相关案由并细化了知识产权相关案由 [9]

腾讯研究院· 2025-12-20 10:33

芯片领域动态 - 谷歌推出TorchTPU芯片 [3] - 苹果研发AI服务器芯片 [3] 大模型与算法进展 - 谷歌发布Gemini 3 Flash模型 [3] - 字节跳动发布Seed1.8模型 [3] - 小米发布MiMo-V2-Flash模型 [3] - 英伟达发布Nemotron 3模型 [3] - OpenAI研究Circuit-Sparsity模型稀疏化技术 [3] - Thinking Machines发布Tinker模型 [3] - OpenAI可能正在开发GPT-5.2模型 [3] - OpenAI建立科学能力基准 [4] AI应用与产品发布 - OpenAI计划推出ChatGPT应用商店 [3] - 阶跃星辰发布Step-GUI应用 [3] - xAI为Grok推出Grok Voice功能 [3] - 行业在开发Agent API [3] - 苹果规划AI眼镜产品 [3] - OpenAI推出ChatGPT Images功能 [3] - Meta发布SAM Audio应用 [3] - 腾讯发布混元世界模型1.5 [3] - Vidu发布Vidu Agent应用 [3] - 谷歌推出Super Gems应用 [3] - 腾讯元宝推出写作模式 [3] - 通义万相推出角色扮演功能 [3] - 字节跳动发布Seedance 1.5 pro应用 [3] - 长安汽车与北汽集团推进L3级自动驾驶 [3] - Manus发布Manus 1.6应用 [3] - 谷歌推出NotebookLM应用 [3] - 通义发布Fun语音模型 [4] - Zoom推出Zoom AI功能 [4] - 行业出现医学版ChatGPT应用 [4] - Gemini推出Deep Research Agent [4] - Runway发布GWM-1应用 [4] - 谷歌将翻译功能融合进Gemini [4] - 拓竹科技与混元合作推出「印你」应用 [4] - 宇树科技推出机器人应用商店 [4] 前沿科技与行业观点 - Harmonic研究Erdos1026问题 [4] - 风险投资机构a16z提出AI泡沫判断标准 [4] - OpenAI研究记忆系统 [4] - 谷歌研究递归自我改进技术 [4] - 多款AI模型面临“AI手指”生成难题 [4] - 媒体披露OpenAI的Sora模型开发内幕 [4] - 行业关注AI生成的成人内容市场 [4] - DeepMind对AGI（通用人工智能）到来做出预测 [4] - 数据分析公司Similarweb揭示AI用户趋势 [4] - OpenAI与迪士尼探讨合作 [4]

Artificial Intelligence

AGI

Artificial Intelligence

TorchTPU

AI服务器芯片

Gemini 3 Flash

Artificial Intelligence

AGI

Artificial Intelligence

腾讯研究院· 2025-12-18 00:01

行业核心动态：AI模型与产品密集迭代升级 - OpenAI推出全新图像生成模型ChatGPT Images，图像生成速度提升4倍，API价格比前代降低20% [1] - Meta开源音频分割模型SAM Audio，支持文本、视觉和时间跨度提示，在超过1亿条视频上训练，运行速度快于实时处理 [2] - 小米开源大模型MiMo-V2-Flash，总参数3090亿，活跃参数150亿，在SWE-bench Verified得分73.4%超越所有开源模型 [3] - 腾讯混元世界模型1.5开源，支持创建实时交互3D世界，以24FPS速度生成720P高清视频 [4] - 谷歌在Gemini中深度整合Opal工作流，推出Super Gems功能和新工作流构建器 [7] - OpenAI发布专家级科学能力评估基准FrontierScience，包含700余道题目，GPT-5.2在奥赛赛道得分77% [8] 模型性能与技术创新 - ChatGPT Images支持添加、删减、组合、融合等多种编辑，文本渲染能力增强，内置数十种预设滤镜和提示词 [1] - SAM Audio核心引擎PE-AV基于Perception Encoder扩展，实现多模态融合，在多种音频分离任务上达到SOTA水平 [2] - MiMo-V2-Flash采用5比1混合滑动窗口注意力机制，使KV缓存减少近6倍，轻量级多Token预测使推理速度提升2-2.6倍 [3] - 腾讯混元世界模型1.5核心创新包括重构记忆机制实现分钟级几何一致性、Context Forcing蒸馏方案和基于3D的自回归扩散模型强化学习 [4] - Vidu Agent具备分镜级可控力，能保持产品人物场景在15-30秒视频中的一致性，并支持精细化编辑 [5][6] - FrontierScience基准的研究赛道采用基于量规的10分制评估，关注推理步骤正确性，揭示模型存在推理逻辑错误等问题 [8] 商业化与成本策略 - ChatGPT Images功能向所有ChatGPT用户推出，API以GPT Image 1.5形式提供 [1] - MiMo-V2-Flash后训练采用多教师在线策略蒸馏，仅需传统方法1/50算力达到教师性能峰值，API限时免费开放，成本为每百万token输入0.1美元输出0.3美元 [3] - Vidu Agent首推多模态Agent API，为企业提供端到端交付结果，支持上传爆款视频和产品图批量产出同类高质量视频 [5][6] - 谷歌Gemini的新工作流可直接生成可分享链接并公开发布，不再依赖Google Drive权限设置 [7] 行业战略与研发投入 - 原DeepSeek成员罗福莉加入小米并发表演讲，强调AI进化的下个起点是能与物理世界交互的模型，认为真正护城河是科学研究文化与将未知问题转化为可用产品的能力 [9] - 罗福莉提出开源是实现AGI普惠化、确保人类智慧共同进化的唯一路径 [9] - 小米未来五年研发投入预计超2000亿元，2026年预计投入约400亿元 [9]

生成式AI

AGI

Artificial Intelligence

MiMo-V2-Flash

ChatGPT Images

腾讯混元世界模型1.5（HY WorldPlay）

生成式AI

AGI

Artificial Intelligence

MiMo-V2-Flash

ChatGPT Images

腾讯混元世界模型1.5（HY WorldPlay）

Factbox-From OpenAI to Google, firms channel billions into AI infrastructure as demand booms

Yahoo Finance· 2025-12-17 21:28

文章核心观点 - 人工智能行业对算力的需求持续激增促使科技巨头与领先的AI初创公司OpenAI达成一系列高额投资与合作协议以获取或提供关键的算力资源、芯片和资金支持 [1][2][3][4][5][6][7][8][9] OpenAI相关交易与合作 - **亚马逊与OpenAI**：亚马逊正考虑向OpenAI投资约100亿美元潜在交易可能使OpenAI估值超过5000亿美元谈判目前仍“非常不确定” [1] - **迪士尼与OpenAI**：华特迪士尼将向OpenAI投资10亿美元并达成一项为期三年的授权协议允许OpenAI的Sora AI视频生成器使用迪士尼旗下星球大战、皮克斯和漫威等IP的角色该协议将于明年初生效但不涉及演员肖像或声音 [2] - **博通与OpenAI**：OpenAI已与博通合作生产其首款自研人工智能处理器以满足其服务激增带来的算力需求 [3] - **AMD与OpenAI**：AMD同意向OpenAI供应人工智能芯片达成一项多年期协议同时给予OpenAI购买该芯片制造商至多约10%股份的选择权 [4] - **英伟达与OpenAI**：英伟达计划向OpenAI投资高达1000亿美元并向其供应数据中心芯片此举将使英伟达获得OpenAI的财务股权 OpenAI已是英伟达的重要客户 [5] - **甲骨文与OpenAI**：据报道甲骨文与OpenAI签署了有史以来最大的云服务协议之一 OpenAI预计将在约五年内从甲骨文购买价值3000亿美元的计算能力 [6] - **CoreWeave与OpenAI**：CoreWeave在3月与OpenAI签署了一份为期五年、价值119亿美元的合同时间点在该英伟达支持的初创公司IPO之前 [7] 数据中心项目 - **Stargate数据中心项目**：Stargate是软银、OpenAI和甲骨文的合资企业旨在建设数据中心该项目于1月由美国总统唐纳德·特朗普宣布相关公司将投资高达5000亿美元用于人工智能基础设施 [8] 其他相关交易 - **Meta与CoreWeave**：CoreWeave与Meta签署了一项价值140亿美元的协议向Meta供应计算能力 [9]

Artificial Intelligence

Cloud Computing

Semiconductor

ChatGPT

Sora AI video generator

Artificial Intelligence

Cloud Computing

Semiconductor

ChatGPT

Sora AI video generator

跑分第一，实战拉胯，GPT Image 1.5被骂惨，奥特曼这波悬了

36氪· 2025-12-17 16:27

OpenAI发布GPT Image 1.5图像模型 - 公司于近期发布了新一代旗舰图像模型ChatGPT Images，即GPT Image 1.5 [1][2] - 该模型在多项基准测试中表现突出，在LMArena文生图榜单以1264 Elo分排名第一，力压谷歌Nano Banana Pro的1235分 [6][8] - 在Artificial Analysis榜单上，该模型在文生图和图像编辑两个领域均获得第一，实现“双料第一” [6][11] 模型核心性能与功能升级 - 模型指令理解力大幅提升，能够实现精准的“指哪改哪”编辑 [3] - 图像生成速度较前代提升了整整4倍 [3] - 模型在多轮编辑中能保持图像元素的一致性，例如光线、构图和人物样貌 [21][56] - 新模型在细节保留和画面质感上有所提升，被描述为“细节狂魔” [3] - 模型具备强大的创意生成能力，可进行概念转换、风格滤镜应用及复杂场景构建 [24][57][59][63][65][67][70][72][74][79][82][84][87] 技术能力的具体展示 - 模型能准确处理包含36个指定元素的6x6网格图，展示了精准的构图能力 [88][90][92] - 在文字渲染方面有进步，能处理更密集、字号更小的文本，并能生成包含清晰文本的信息图和编程界面 [92][95][97][100] - 在人脸生成和复杂场景（如“人山人海的大场面”）上，新版模型比旧版更逼真、自然 [104][106][108][110] - 模型能完成复杂的图像编辑链，例如基于一张图进行多次连贯修改 [26][28][30][32][33][36][38][46][48][50][52][54] 产品发布与市场策略 - 从发布日起，所有ChatGPT免费用户即可使用该图像生成功能，开发者也可直接调用GPT Image 1.5 API [3] - API价格较GPT Image 1便宜了20%，有助于客户以相同预算生成更多图像 [123] - 此次更新被视为对谷歌近期发布Gemini 3和Nano Banana Pro的竞争回应 [1][127][128] - 公司应用CEO Fidji Simo表示，此次升级是ChatGPT从纯文本产品向直观、多模态智能助手转变的关键一环 [131][133] 模型存在的局限与社区反馈 - 尽管基准测试分数领先，但社区实测反馈存在落差，有用户认为其实际生成能力，特别是在处理手写体等复杂指令时，不及谷歌Nano Banana Pro [12][15][17] - 模型在生成某些特定艺术风格（如日漫风、黑暗奇幻动漫风）时，能力相比旧版有所退步 [115][117] - 模型无法可靠地编辑多人合影中所有人物的面部特征，容易导致人脸走形 [118][120] - 在多语言文字渲染，特别是中文、阿拉伯语和希伯来语方面，存在明显问题 [120][122] - 社区中有批评声音认为该版本是“高分低能”、“令人尴尬且毫无意义的发布”，并指出其内容审查比竞品Nano Banana Pro更严格 [12][17][135][136][137][138][139] 行业竞争格局 - AI图像模型竞争已进入白热化阶段，主要厂商目标明确为赢得企业市场 [130] - OpenAI面临来自谷歌（Gemini系列）、Black Forest Labs（开源模型Flux.2）以及Qwen-Image等多方竞争 [128][130] - 谷歌即将发布的Gemini 3.0 Flash可能具备更快速度和更低价格，对OpenAI构成持续压力 [1][149]

刚刚，OpenAI推出全新ChatGPT Images，奥特曼亮出腹肌搞宣传

36氪· 2025-12-17 09:04

文章核心观点 - OpenAI推出全新ChatGPT Images功能，由旗舰图像生成模型GPT Image 1.5驱动，标志着AI图像生成竞争从“模型能力”转向“产品体验”[25][62] - 公司通过高管营销、独立产品入口、预设滤镜和降价策略，旨在降低用户使用门槛，将图像生成变为日常交互[6][56][62] 产品发布与核心特性 - 新版ChatGPT Images由全新的旗舰图像生成模型驱动，图像生成速度提升了4倍[25] - 核心特性是精准编辑，能可靠遵循用户意图，细致入微地改变指定部分，同时保持光影、构图和人物外观等元素的一致性[25] - 模型擅长各种类型的编辑，包括添加、删减、组合、融合和置换[26] - 具备创意转换功能，可以改变和添加元素来实现想法，同时保留重要细节，用户可通过预设风格尝试而无需手动编写提示词[37] - 模型在文本渲染方面有进步，能够处理更密集、更小的文本[49] - 在其他质量维度上进行了改进，例如能更好地渲染小尺寸的人脸以及提升输出结果的自然程度[54] 产品定价与市场策略 - 全新的Images模型以GPT Image 1.5形式通过API提供，其图像输入和输出价格比GPT Image 1降低了20%[58] - 在ChatGPT中推出了全新的“Images”独立功能入口，用户可通过移动应用侧边栏和chatgpt.com访问，旨在让图像生成体验更令人愉悦和毫不费力[56] - 该功能包含了数十种预设滤镜和提示词以快速激发灵感，并会定期更新以反映新兴趋势[56] - 全新的Images体验于发布日向大多数用户开放，商业版和企业版的访问权限将在稍后推出[58] 营销与市场定位 - OpenAI首席执行官山姆・奥特曼、首席研究官Mark Chen和总裁Greg Brockman均贡献个人照片进行创意修改，为产品发布造势[6][10] - 公司未放出任何量化的基准测试结果，表明竞争重点转向综合的“产品体验”[62] - 通过高管亲自下场营销、独立入口、预设风格及降价，公司试图将图像生成从需要精心调试的专业技能转变为简单的日常交互[62]

图像生成

Artificial Intelligence

ChatGPT Images

图像生成

Artificial Intelligence

ChatGPT Images

Previous Next