Workflow
ChatGPT Images
icon
搜索文档
被起诉的AI独角兽,这样回应好莱坞
搜狐财经· 2025-12-23 20:30
核心观点 - AI公司与版权方的关系正从法庭对抗转向规则框架内的交易与合作 行业迎来戏剧性拐点 [2] - MiniMax在招股书中首次详细回应版权诉讼 核心立场是未侵权且败诉影响有限 [2] - 迪士尼与OpenAI的战略合作是标志性事件 显示版权方主动参与AI生态收益分配 [17][19] 诉讼指控与争议焦点 - 2025年9月16日 迪士尼、环球影业和华纳兄弟在加州起诉MiniMax 指控其视频生成工具“海螺AI”在训练、生成与推广三环节侵权 [4] - 训练阶段指控:未经许可从互联网抓取并使用大量受版权保护的电影、动画内容用于AI模型训练 [4] - 生成阶段指控:用户输入简单提示词即可生成高度相似、细节完整的图片或视频 模型已“记住”受保护作品 [6] - 推广阶段指控:在官网及社交媒体直接展示侵权生成内容 使用迪士尼等IP角色宣传 并标注自家水印 构成“系统性鼓励侵权” [6] - 全球类似诉讼争议焦点高度相似:训练阶段是否构成合理使用 输出阶段是否形成对原作品的“替代效果” [9] MiniMax的抗辩与风险评估 - 提出“工具中立论”:海螺AI仅根据用户输入生成内容 无复制传播特定作品的主观故意 不构成直接侵权 [7] - 强调“无直接获利”:海螺AI是为合法用途设计的通用创意工具 未从被指控的侵权内容中获得直接经济利益 不构成共同或间接侵权 [7] - 抗辩核心落在“合理使用”与“工具中立”:训练阶段使用内容仅用于学习统计规律和一般特征 具有高度转化性 不会复制具体表达性内容 [8] - 试图压低潜在赔偿金额:原告主张涉及约500件已注册作品 每件最高15万美元 合计最高7500万美元索赔 [10] - MiniMax认为具备法定赔偿资格的“作品”数量远低于原告主张 且非故意侵权赔偿上限通常为每部作品不超过3万美元 [10] - 公司结论:即便最终败诉并全额赔偿7500万美元 该金额在公司可用财务资源中所占比例有限 且预计随业务增长及诉讼周期拉长进一步下降 [12] - 试图淡化好莱坞IP对业务的重要性 称其并非用户参与、收入或增长的核心驱动因素 [12] 诉讼背后的深层风险与行业影响 - 败诉可能带来长期“许可费陷阱”:需按生成量或营收规模持续向版权方支付许可费用 侵蚀AI视频业务本已有限的毛利空间 [13] - 产品可能面临“功能性阉割”:若法院发布广泛禁令 公司或需下架部分核心功能或实施严格过滤机制 影响产品差异化和用户体验 [13] - 竞争格局可能加速分化:行业正出现版权方与AI公司由对抗转向合作的趋势 若无法及时建立类似授权或联盟关系 将在竞争中处于不利位置 [14] - 版权诉讼是过渡性工具 行业正试图通过授权、分润、质量约束和技术整改 把冲突转化为可计价、可协商、可持续的关系 [19] 行业合作新范式:迪士尼与OpenAI案例 - 2025年12月11日 迪士尼与OpenAI宣布达成战略合作 建立资本联结与收益分配体系 [17] - 迪士尼将对OpenAI进行10亿美元股权投资 并获得未来增持股份的认股权证 成为其重要战略股东与主要企业客户 [17] - OpenAI获准在创作中使用迪士尼旗下庞大IP资源库 涵盖四大品牌超200个经典角色 [17] - 双方将共同开发面向Disney+流媒体平台用户的新产品与互动体验 用户生成的优质授权内容有机会在Disney+官方平台播放 [17] - 合作意味着版权方将AI趋势商业化 为角色在AI视频中的呈现设定质量标准 并收集粉丝使用数据 [18] - 娱乐巨头与AI领军企业结盟是一道分水岭 版权方开始主动参与AI生态的收益分配 [19] 行业历史诉讼案例概览 - 2023年2月:Getty Images起诉Stability AI 指控未经许可抓取图片用于训练AI 2023年11月英国法院基本裁定AI公司获胜 [16] - 2023年9月:乔治·马丁等17位作家起诉OpenAI 指控使用受版权保护作品训练ChatGPT [16] - 2023年12月:《纽约时报》起诉OpenAI 指控抓取新闻内容训练模型 法院裁定部分内容构成“实质相似” [16] - 2024年6月:多名作者及出版商起诉Anthropic 指控非法抓取书籍内容 2025年9月双方达成约15亿美元和解协议 [16] - 2024年6月:索尼、环球、华纳及美国唱片业协会起诉Suno&Udio 指控非法复制和存储数万首受版权保护的录音及歌词 [16] - 2025年6月:迪士尼、环球影业等好莱坞大厂起诉Midjourney 指控未获授权使用影视IP训练、输出侵权图像 [16] - 2025年9月:迪士尼、环球影业等起诉MiniMax(海螺AI) 指控视频模型未经授权“喂”影视数据且生成内容精准复刻经典形象 [16] - 2025年12月:迪士尼向谷歌发函 指控其利用AI模型及相关服务大规模侵犯迪士尼版权 要求叫停涉嫌侵权的AI系统 [16]
Walt Disney (DIS) Invests $1 Billion in OpenAI Deal
Yahoo Finance· 2025-12-21 22:44
公司与OpenAI的战略合作 - 华特迪士尼公司向OpenAI投资10亿美元,并达成一项为期三年的合作伙伴关系 [1][2] - 根据许可协议,从2026年初开始,OpenAI的Sora AI视频生成器和ChatGPT Images将能够生成包含迪士尼旗下角色的视频,例如木法沙、灰姑娘和米老鼠 [3] - 该协议不包括任何演员的形象或声音使用权 [3] 合作内容与战略意图 - 此次合作旨在利用生成式AI技术,审慎地扩展公司的叙事能力,同时尊重和保护创作者及其作品 [3] - 首席执行官鲍勃·艾格此前在11月的投资者电话会议上曾暗示此战略,指出AI将帮助公司为Disney+用户提供工具,以创作和享受用户生成内容,主要是短视频形式 [4] - 根据协议,一部分用户生成的视频将可以在Disney+上播放,使该平台能够从短视频内容日益增长的需求中受益 [4] 对行业的影响与意义 - 此次合作标志着好莱坞拥抱生成式AI的关键时刻,并有可能改变好莱坞的内容创作方式 [2] - 该合作绕开了关于AI损害就业或知识产权的担忧 [2] - 协议允许OpenAI在其Sora AI视频生成器中使用来自《星球大战》、皮克斯和漫威的角色 [1] 公司业务背景 - 华特迪士尼公司是一家美国跨国大众媒体和娱乐集团,通过三个核心业务部门运营:迪士尼娱乐、ESPN和迪士尼体验 [5]
计算机行业研究:阿里巴巴发布视频生成模型万相 2.6,0penAl推出ChatGPTlmages
国金证券· 2025-12-21 19:28
行业投资评级 * 报告未明确给出计算机行业的整体投资评级 [4][6][9][11] 核心观点 * 报告认为,11月计算机板块表现较弱主要源于风险偏好承压,估值波动解释了板块波动的**60-80%**[4][11] * 外部压力包括海外局部冲突、美国AI泡沫争议导致相关企业股价回调、美元降息预期波动等[4][11] * 内部压力包括基本面收入端不强、部分机构投资者年底获利了结[4][11] * 预计连续三个月的回调为后续春季躁动酝酿了空间,在非熊市阶段,板块回调**2-4个月**后通常会有新一轮弹性[4][11] * 从投资机会看,需求的景气方向在出海,技术的景气方向在AI产业链,政策的景气方向在国产替代[4][11] 本周观点总结 * **计算机行业观点**:板块近期回调主要受风险偏好压制,但为未来反弹创造了空间,投资应聚焦出海、AI产业链和国产替代三大方向[4][9][11] * **细分板块观点**:报告对2025年各细分赛道景气度进行了详细划分[4][10][11][12] * **高景气维持**:AI算力、激光雷达[4][10][11] * **加速向上**:AI应用(软件)[4][10][11] * **稳健向上**:软件外包、金融IT、量子计算、数据要素、EDA、出海、信创[4][11][12] * **拐点向上**:教育IT、网安、企业服务[4][11][12] * **底部企稳**:智慧交通、政务IT、安防、建筑地产IT[4][11][12] * **略有承压**:工业软件[4][11][12] * **持续承压**:医疗IT[4][11][12] 重点事件与动态 * **阿里巴巴**于12月17日发布视频生成模型“万相2.6”系列,是国内首个支持声画一致性角色定制的视频模型[4][11] * **小米**于12月18日发布参数量为**309B**的开源大模型MiMo-V2-Flash,其推理成本仅为Claude 4.5 Sonnet的**2.5%**,在SWE-Bench评测中以**73.4%**的评分领先[4][11] * **OpenAI**于12月17日更新ChatGPT图像生成功能,推出旗舰图像模型GPT Image 1.5及其API服务[4][11] * **SpaceX**启动IPO流程,目标募资额预计超过**300亿美元**,寻求整体估值接近**1.5万亿美元**[4][11] * **Google**于12月18日发布Gemini3 Flash模型,将其设为默认模型,平均token使用量较Gemini 2.5 Pro减少约**30%**,定价为输入每百万token **0.50美元**,输出每百万token **3美元**[4][11] * **激光雷达**:10月国内ADAS激光雷达(仅标配)装机量约**35.3万颗**,同比增长**118.2%**;1-10月累计装机量约**226.2万颗**,同比增长**95.5%**,符合全年翻倍增长预期[12] * **重点事件前瞻**:2025年12月22日,智元机器人将举办全国机器人租赁生态峰会[25][26] 市场行情回顾 * 2025年12月15日至12月19日,计算机行业指数(申万)下降**0.68%**,跑输沪深300指数**0.4**个百分点[13] * 在31个申万一级行业中,计算机行业本周排名中等靠后[13][16] * 本周计算机板块涨幅前五的公司为万集科技(**29.2%**)、新利软件(**23.3%**)、索菱股份(**21.9%**)、嘉和美康(**21.1%**)、经纬恒润(**20.6%**)[14][17][18] * 跌幅前五的公司为实达集团(**-8.3%**)、达华智能(**-8.3%**)、商汤-W(**-11.7%**)、品高股份(**-11.8%**)、三六零(**-16.4%**)[14][17][18] * 报告期内(12月15日至19日),三市股票日均成交额为**1.76万亿元**,同比上升**31.9%**,环比下降**9.9%**;截至12月18日,两融余额为**2.49万亿元**,同比上升**35.6%**,环比下降**0.65%**[19] 投资建议 * 建议关注国内生成式大模型龙头**科大讯飞**[4] * AI硬件有望成为应用落地新载体,建议关注**海康威视**、**虹软科技**、**禾赛**等[4] * AI相关功能打磨能带动付费率、Arpu值提升,建议关注**迈富时**等[4]
智谱招股书透露风险:“我们可能无法保护用户数据”丨合规周报
21世纪经济报道· 2025-12-21 12:03
AI动态 - 智谱通过港交所聆讯并披露招股书 其2022年、2023年、2024年净亏损分别为1.43亿元、7.88亿元、29.58亿元 2025年上半年净亏损达23.58亿元 累计亏损超62亿元 [1] - 智谱招股书提及其GLM-4S模型在2025年9月RAG领域的LLM幻觉排行榜中 幻觉率为全球第二低及中国最低 [1] - 智谱招股书指出 中国人工智能行业监管环境日益严格 未来可能出台的法律法规可能对公司业务产生重大不利影响 [2] - 智谱目前未被认定为关键信息基础设施运营者 但无法保证未来其MaaS平台不会被归类为关键信息基础设施 [2] - 智谱招股书坦陈 由于网络安全及数据保护法规诠释存在不确定性 公司可能无法完全保护用户数据 [2] - 智谱业务运营中可能从第三方及公开来源获取训练数据 但无法保证这些数据的合法性 若数据获取不合规可能对公司服务及声誉造成重大不利影响 [3][4] - 智谱指出 现有数据处理技术存在局限 无法保证能有效过滤或匿名化从第三方及公开来源获得的数据以完全符合法规 [4] - 智谱招股书提到 人工智能技术可能被使用者滥用 从而对公司声誉及业务造成重大不利影响 [4] - 迪士尼宣布与OpenAI达成深度合作 包括向OpenAI进行10亿美元股权投资并获得认股权证 这是Sora平台首次迎来大型内容授权合作伙伴 [5][6] - OpenAI的Sora和ChatGPT Images将获得迪士尼旗下超200个角色授权 包括米老鼠、漫威、皮克斯和星球大战角色 但不包含真人肖像或声音 [6] - 迪士尼将利用OpenAI的API为Disney+流媒体平台构建新产品工具 为员工部署ChatGPT用于内部工作流程 粉丝精选创作视频将在Disney+播放 [6] - 千问宣布接入高德地图 针对涉及地理位置的问题 能够调用高德地图等数据生成可视化决策卡片 用户点击卡片可在高德App中唤起导航或打车服务 [7] 平台治理 - 国家发展改革委、市场监管总局、国家网信办三部门印发《互联网平台价格行为规则》 规定平台内经营者在不同平台销售商品或提供服务可依法自主定价 [7] - 《规则》要求平台经营者不得通过提高收费、限制流量、搜索降权、屏蔽店铺等措施 强制或变相强制平台内经营者降价、进行促销或不得高于其他渠道价格 [7][8] - 《规则》明确禁止平台经营者强制或变相强制平台内经营者开通自动跟价、自动降价或类似系统 [7][8] - 《规则》禁止平台经营者及平台内经营者利用平台规则、数据和算法等手段相互串通 操纵市场价格 [8] - TikTok CEO周受资宣布 字节跳动、TikTok已与三家投资者签署协议 将成立名为“TikTok美国数据安全合资有限责任公司”的新美国合资公司 负责美国的数据保护、算法安全、内容审核和软件保障 [8] - 最高人民法院对《民事案件案由规定》进行第三次修正 修改后的规定共有1055个案由 [9] - 修正案围绕服务发展新质生产力 增加了数据、网络虚拟财产相关案由 并细化了知识产权相关案由 [9]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-20 10:33
芯片领域动态 - 谷歌推出TorchTPU芯片 [3] - 苹果研发AI服务器芯片 [3] 大模型与算法进展 - 谷歌发布Gemini 3 Flash模型 [3] - 字节跳动发布Seed1.8模型 [3] - 小米发布MiMo-V2-Flash模型 [3] - 英伟达发布Nemotron 3模型 [3] - OpenAI研究Circuit-Sparsity模型稀疏化技术 [3] - Thinking Machines发布Tinker模型 [3] - OpenAI可能正在开发GPT-5.2模型 [3] - OpenAI建立科学能力基准 [4] AI应用与产品发布 - OpenAI计划推出ChatGPT应用商店 [3] - 阶跃星辰发布Step-GUI应用 [3] - xAI为Grok推出Grok Voice功能 [3] - 行业在开发Agent API [3] - 苹果规划AI眼镜产品 [3] - OpenAI推出ChatGPT Images功能 [3] - Meta发布SAM Audio应用 [3] - 腾讯发布混元世界模型1.5 [3] - Vidu发布Vidu Agent应用 [3] - 谷歌推出Super Gems应用 [3] - 腾讯元宝推出写作模式 [3] - 通义万相推出角色扮演功能 [3] - 字节跳动发布Seedance 1.5 pro应用 [3] - 长安汽车与北汽集团推进L3级自动驾驶 [3] - Manus发布Manus 1.6应用 [3] - 谷歌推出NotebookLM应用 [3] - 通义发布Fun语音模型 [4] - Zoom推出Zoom AI功能 [4] - 行业出现医学版ChatGPT应用 [4] - Gemini推出Deep Research Agent [4] - Runway发布GWM-1应用 [4] - 谷歌将翻译功能融合进Gemini [4] - 拓竹科技与混元合作推出「印你」应用 [4] - 宇树科技推出机器人应用商店 [4] 前沿科技与行业观点 - Harmonic研究Erdos1026问题 [4] - 风险投资机构a16z提出AI泡沫判断标准 [4] - OpenAI研究记忆系统 [4] - 谷歌研究递归自我改进技术 [4] - 多款AI模型面临“AI手指”生成难题 [4] - 媒体披露OpenAI的Sora模型开发内幕 [4] - 行业关注AI生成的成人内容市场 [4] - DeepMind对AGI(通用人工智能)到来做出预测 [4] - 数据分析公司Similarweb揭示AI用户趋势 [4] - OpenAI与迪士尼探讨合作 [4]
腾讯研究院AI速递 20251218
腾讯研究院· 2025-12-18 00:01
行业核心动态:AI模型与产品密集迭代升级 - OpenAI推出全新图像生成模型ChatGPT Images,图像生成速度提升4倍,API价格比前代降低20% [1] - Meta开源音频分割模型SAM Audio,支持文本、视觉和时间跨度提示,在超过1亿条视频上训练,运行速度快于实时处理 [2] - 小米开源大模型MiMo-V2-Flash,总参数3090亿,活跃参数150亿,在SWE-bench Verified得分73.4%超越所有开源模型 [3] - 腾讯混元世界模型1.5开源,支持创建实时交互3D世界,以24FPS速度生成720P高清视频 [4] - 谷歌在Gemini中深度整合Opal工作流,推出Super Gems功能和新工作流构建器 [7] - OpenAI发布专家级科学能力评估基准FrontierScience,包含700余道题目,GPT-5.2在奥赛赛道得分77% [8] 模型性能与技术创新 - ChatGPT Images支持添加、删减、组合、融合等多种编辑,文本渲染能力增强,内置数十种预设滤镜和提示词 [1] - SAM Audio核心引擎PE-AV基于Perception Encoder扩展,实现多模态融合,在多种音频分离任务上达到SOTA水平 [2] - MiMo-V2-Flash采用5比1混合滑动窗口注意力机制,使KV缓存减少近6倍,轻量级多Token预测使推理速度提升2-2.6倍 [3] - 腾讯混元世界模型1.5核心创新包括重构记忆机制实现分钟级几何一致性、Context Forcing蒸馏方案和基于3D的自回归扩散模型强化学习 [4] - Vidu Agent具备分镜级可控力,能保持产品人物场景在15-30秒视频中的一致性,并支持精细化编辑 [5][6] - FrontierScience基准的研究赛道采用基于量规的10分制评估,关注推理步骤正确性,揭示模型存在推理逻辑错误等问题 [8] 商业化与成本策略 - ChatGPT Images功能向所有ChatGPT用户推出,API以GPT Image 1.5形式提供 [1] - MiMo-V2-Flash后训练采用多教师在线策略蒸馏,仅需传统方法1/50算力达到教师性能峰值,API限时免费开放,成本为每百万token输入0.1美元输出0.3美元 [3] - Vidu Agent首推多模态Agent API,为企业提供端到端交付结果,支持上传爆款视频和产品图批量产出同类高质量视频 [5][6] - 谷歌Gemini的新工作流可直接生成可分享链接并公开发布,不再依赖Google Drive权限设置 [7] 行业战略与研发投入 - 原DeepSeek成员罗福莉加入小米并发表演讲,强调AI进化的下个起点是能与物理世界交互的模型,认为真正护城河是科学研究文化与将未知问题转化为可用产品的能力 [9] - 罗福莉提出开源是实现AGI普惠化、确保人类智慧共同进化的唯一路径 [9] - 小米未来五年研发投入预计超2000亿元,2026年预计投入约400亿元 [9]
Factbox-From OpenAI to Google, firms channel billions into AI infrastructure as demand booms
Yahoo Finance· 2025-12-17 21:28
文章核心观点 - 人工智能行业对算力的需求持续激增 促使科技巨头与领先的AI初创公司OpenAI达成一系列高额投资与合作协议 以获取或提供关键的算力资源、芯片和资金支持 [1][2][3][4][5][6][7][8][9] OpenAI相关交易与合作 - **亚马逊与OpenAI**:亚马逊正考虑向OpenAI投资约100亿美元 潜在交易可能使OpenAI估值超过5000亿美元 谈判目前仍“非常不确定” [1] - **迪士尼与OpenAI**:华特迪士尼将向OpenAI投资10亿美元 并达成一项为期三年的授权协议 允许OpenAI的Sora AI视频生成器使用迪士尼旗下星球大战、皮克斯和漫威等IP的角色 该协议将于明年初生效 但不涉及演员肖像或声音 [2] - **博通与OpenAI**:OpenAI已与博通合作 生产其首款自研人工智能处理器 以满足其服务激增带来的算力需求 [3] - **AMD与OpenAI**:AMD同意向OpenAI供应人工智能芯片 达成一项多年期协议 同时给予OpenAI购买该芯片制造商至多约10%股份的选择权 [4] - **英伟达与OpenAI**:英伟达计划向OpenAI投资高达1000亿美元 并向其供应数据中心芯片 此举将使英伟达获得OpenAI的财务股权 OpenAI已是英伟达的重要客户 [5] - **甲骨文与OpenAI**:据报道 甲骨文与OpenAI签署了有史以来最大的云服务协议之一 OpenAI预计将在约五年内从甲骨文购买价值3000亿美元的计算能力 [6] - **CoreWeave与OpenAI**:CoreWeave在3月与OpenAI签署了一份为期五年、价值119亿美元的合同 时间点在该英伟达支持的初创公司IPO之前 [7] 数据中心项目 - **Stargate数据中心项目**:Stargate是软银、OpenAI和甲骨文的合资企业 旨在建设数据中心 该项目于1月由美国总统唐纳德·特朗普宣布 相关公司将投资高达5000亿美元用于人工智能基础设施 [8] 其他相关交易 - **Meta与CoreWeave**:CoreWeave与Meta签署了一项价值140亿美元的协议 向Meta供应计算能力 [9]
跑分第一,实战拉胯,GPT Image 1.5被骂惨,奥特曼这波悬了
36氪· 2025-12-17 16:27
OpenAI发布GPT Image 1.5图像模型 - 公司于近期发布了新一代旗舰图像模型ChatGPT Images,即GPT Image 1.5 [1][2] - 该模型在多项基准测试中表现突出,在LMArena文生图榜单以1264 Elo分排名第一,力压谷歌Nano Banana Pro的1235分 [6][8] - 在Artificial Analysis榜单上,该模型在文生图和图像编辑两个领域均获得第一,实现“双料第一” [6][11] 模型核心性能与功能升级 - 模型指令理解力大幅提升,能够实现精准的“指哪改哪”编辑 [3] - 图像生成速度较前代提升了整整4倍 [3] - 模型在多轮编辑中能保持图像元素的一致性,例如光线、构图和人物样貌 [21][56] - 新模型在细节保留和画面质感上有所提升,被描述为“细节狂魔” [3] - 模型具备强大的创意生成能力,可进行概念转换、风格滤镜应用及复杂场景构建 [24][57][59][63][65][67][70][72][74][79][82][84][87] 技术能力的具体展示 - 模型能准确处理包含36个指定元素的6x6网格图,展示了精准的构图能力 [88][90][92] - 在文字渲染方面有进步,能处理更密集、字号更小的文本,并能生成包含清晰文本的信息图和编程界面 [92][95][97][100] - 在人脸生成和复杂场景(如“人山人海的大场面”)上,新版模型比旧版更逼真、自然 [104][106][108][110] - 模型能完成复杂的图像编辑链,例如基于一张图进行多次连贯修改 [26][28][30][32][33][36][38][46][48][50][52][54] 产品发布与市场策略 - 从发布日起,所有ChatGPT免费用户即可使用该图像生成功能,开发者也可直接调用GPT Image 1.5 API [3] - API价格较GPT Image 1便宜了20%,有助于客户以相同预算生成更多图像 [123] - 此次更新被视为对谷歌近期发布Gemini 3和Nano Banana Pro的竞争回应 [1][127][128] - 公司应用CEO Fidji Simo表示,此次升级是ChatGPT从纯文本产品向直观、多模态智能助手转变的关键一环 [131][133] 模型存在的局限与社区反馈 - 尽管基准测试分数领先,但社区实测反馈存在落差,有用户认为其实际生成能力,特别是在处理手写体等复杂指令时,不及谷歌Nano Banana Pro [12][15][17] - 模型在生成某些特定艺术风格(如日漫风、黑暗奇幻动漫风)时,能力相比旧版有所退步 [115][117] - 模型无法可靠地编辑多人合影中所有人物的面部特征,容易导致人脸走形 [118][120] - 在多语言文字渲染,特别是中文、阿拉伯语和希伯来语方面,存在明显问题 [120][122] - 社区中有批评声音认为该版本是“高分低能”、“令人尴尬且毫无意义的发布”,并指出其内容审查比竞品Nano Banana Pro更严格 [12][17][135][136][137][138][139] 行业竞争格局 - AI图像模型竞争已进入白热化阶段,主要厂商目标明确为赢得企业市场 [130] - OpenAI面临来自谷歌(Gemini系列)、Black Forest Labs(开源模型Flux.2)以及Qwen-Image等多方竞争 [128][130] - 谷歌即将发布的Gemini 3.0 Flash可能具备更快速度和更低价格,对OpenAI构成持续压力 [1][149]
刚刚,OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传
36氪· 2025-12-17 09:04
文章核心观点 - OpenAI推出全新ChatGPT Images功能,由旗舰图像生成模型GPT Image 1.5驱动,标志着AI图像生成竞争从“模型能力”转向“产品体验”[25][62] - 公司通过高管营销、独立产品入口、预设滤镜和降价策略,旨在降低用户使用门槛,将图像生成变为日常交互[6][56][62] 产品发布与核心特性 - 新版ChatGPT Images由全新的旗舰图像生成模型驱动,图像生成速度提升了4倍[25] - 核心特性是精准编辑,能可靠遵循用户意图,细致入微地改变指定部分,同时保持光影、构图和人物外观等元素的一致性[25] - 模型擅长各种类型的编辑,包括添加、删减、组合、融合和置换[26] - 具备创意转换功能,可以改变和添加元素来实现想法,同时保留重要细节,用户可通过预设风格尝试而无需手动编写提示词[37] - 模型在文本渲染方面有进步,能够处理更密集、更小的文本[49] - 在其他质量维度上进行了改进,例如能更好地渲染小尺寸的人脸以及提升输出结果的自然程度[54] 产品定价与市场策略 - 全新的Images模型以GPT Image 1.5形式通过API提供,其图像输入和输出价格比GPT Image 1降低了20%[58] - 在ChatGPT中推出了全新的“Images”独立功能入口,用户可通过移动应用侧边栏和chatgpt.com访问,旨在让图像生成体验更令人愉悦和毫不费力[56] - 该功能包含了数十种预设滤镜和提示词以快速激发灵感,并会定期更新以反映新兴趋势[56] - 全新的Images体验于发布日向大多数用户开放,商业版和企业版的访问权限将在稍后推出[58] 营销与市场定位 - OpenAI首席执行官山姆・奥特曼、首席研究官Mark Chen和总裁Greg Brockman均贡献个人照片进行创意修改,为产品发布造势[6][10] - 公司未放出任何量化的基准测试结果,表明竞争重点转向综合的“产品体验”[62] - 通过高管亲自下场营销、独立入口、预设风格及降价,公司试图将图像生成从需要精心调试的专业技能转变为简单的日常交互[62]
刚刚,OpenAI推出全新ChatGPT Images,奥特曼亮出腹肌搞宣传
机器之心· 2025-12-17 08:00
产品发布与营销策略 - OpenAI推出全新ChatGPT Images功能,由全新的旗舰图像生成模型驱动,旨在提供更精准的编辑和更快的生成速度[9][10] - 公司高管(包括CEO Sam Altman、首席研究官Mark Chen和总裁Greg Brockman)亲自发布并参与修改自己的照片,以极具话题性的方式为新产品造势,成功吸引了大量关注[3][6][8] - 此次营销策略的信号清晰:公司正极力降低用户使用AI图像生成的心理门槛,试图将其从需要专业提示词调试的技能转变为简单的日常交互[44] 核心产品特性与改进 - 新模型的核心特性是**精准编辑并保留关键细节**,能更可靠地遵循用户意图,仅改变要求的部分,同时保持光影、构图和人物外观等元素的一致性[10] - 图像生成速度相比之前版本**提升了4倍**[10] - 模型具备强大的编辑功能,包括添加、删减、组合、融合和置换[12] - 模型具备创意转换功能,可以改变和添加元素(如文本和布局)来实现想法,同时保留重要细节,用户可通过预设风格尝试而无需手动编写提示词[15] - 与初始版本相比,新模型在**遵循指令**方面更可靠,能处理更复杂的原始构图并保留元素关系[24] - 模型在**文本渲染**方面有进步,能够处理更密集、更小的文本[29] - 模型在其他质量维度有改进,例如能更好地渲染小尺寸的人脸以及提升输出结果的自然程度[31] 用户体验与产品整合 - 在ChatGPT中推出了全新的独立“Images”功能入口,旨在让图像生成体验更令人愉悦、更能激发灵感且毫不费力[34] - 新入口可通过移动应用侧边栏和chatgpt.com访问,包含了**数十种预设滤镜和提示词**以快速激发灵感,并将定期更新以反映新兴趋势[34] 市场定价与可用性 - 全新的Images模型已向所有ChatGPT用户推出,并通过API以**GPT Image 1.5**的形式提供[37] - 与GPT Image 1相比,GPT Image 1.5的**图像输入和输出价格降低了20%**,使用户在相同预算下能生成和迭代更多图像[37] - ChatGPT中全新的Images体验已向大多数用户开放,商业版和企业版的访问权限将在稍后推出[38] 行业竞争与战略意义 - 此次发布标志着AI生图领域的竞争维度正在从单纯的“模型能力”转向综合的“产品体验”,公司此次甚至没有放出任何量化的基准测试结果[43] - 通过推出独立入口、预设滤镜和大幅降价,公司正试图将图像生成转变为一种简单的日常交互[44] - 在一个与谷歌Nano Banana Pro的简单对比测试中,ChatGPT Images的结果被评估为更符合指令要求[39][41][43]