阿里与字节发布新一代AI图像生成模型 - 2025年2月10日,阿里巴巴与字节跳动同日发布新一代图像生成模型,均对标谷歌Nano Banana Pro [1] - 阿里巴巴发布Qwen-Image-2.0,聚焦语义理解与实用编辑,统一了生成与编辑架构,并强化了中文汉字渲染能力,能更好理解超长、复杂的实用化指令 [1] - 字节跳动发布Seedream5.0 Preview,主打检索生图与精细调控,显著提升提示词理解准确率,支持更精细的纹理生成与可控调整,深度适配内容创作全流程 [1] 模型技术细节与性能 - Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率输出,可准确渲染复杂指令,轻松生成专业的PPT及信息图 [3] - Qwen-Image-2.0在Qwen-Image和Qwen-Image-Edit两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中,以更轻量的架构实现了生图和改图性能的大幅提升 [3] - Seedream 5.0 Preview支持2K和4K分辨率输出,用户可在即梦平台免费体验2K输出效果 [3] - 当前图像生成模型普遍采用VAE技术,其重构过程对图像中文字的处理影响显著,特别是小尺寸文字,当文字内容较多时生成难度将显著提升 [4] - 图像生成的真实度与细节还原质量受限于VAE的处理能力上限以及生成模型的建模能力 [4] 电商场景的应用与优化 - 算力运营商透露,AI生图是当前电商客户除数字人外,消耗token(最小文本单元)比较大的需求 [1][7] - 千问大模型高级解决方案架构师表示,电商场景是Qwen-Image模型落地的主流场景之一,Qwen-Image-2.0基于电商场景在商品生产细节、文字可控度及二次编辑等方面进行了优化 [1][7] - 在电商场景中,商品详情页描述图、模特穿搭效果等可以更好地结合新的图像生成模型完成 [7] - 相较于上一代模型需要通过二次编辑完成可控的商品出图,新模型将图片编辑和生成任务融合在一个模型中,从而提升电商卖家的效率 [7] AI漫剧市场的应用与影响 - AI生图技术正逐步渗透到漫剧市场,主流制作途径是AI生成图片,再将图片视频化,并搭配AI配音和字幕来完成出片 [5] - 东吴证券研报指出,AI可以使漫剧制作成本降低90% [5] - 中文在线AI动漫部总经理表示,AI把传统漫剧的11个繁复制作流程精简为剧本创作、图片生成、图转视频、后期加工4个步骤,大大提高生产速度 [5] - AI漫剧极为依赖“抽卡”生成模式,最终效果几乎完全取决于AI自身的理解与推理能力,操作者主要能做的只有打磨提示词 [5] - 艾媒咨询数据显示,51.2%的用户肯定AI技术在降低漫剧制作成本方面的价值,47.7%的用户肯定其在加快IP转化方面的价值 [5] - 同时,47.1%的用户指出AI漫剧在画面风格统一性上存在不足,46.7%的用户指出其在配音情感表现上存在明显不足 [5] - 行业分析认为,AI技术通过降低制作成本、加快IP转化推动漫剧行业升级,但也因画风统一度、配音质感等问题,倒逼行业在追求规模化的同时强化内容创意与品质把控 [6] 行业发展趋势 - 当前AI生图已不局限于视觉创作,正进一步走向企业级、规模化应用的赛道 [1] - 随着AI生图技术进步,行业关注其能否在2026年迎来规模化应用市场 [1] - 中美在AI领域的竞速正在持续 [2]
对标Nano Banana Pro 阿里、字节同一天发布图像生成模型 AI生图将迎来规模化应用市场?