行业动态:中美AI图像生成模型竞速 - 2025年2月10日,阿里巴巴与字节跳动同日发布新一代图像生成模型,均对标谷歌的Nano Banana Pro [1][2] - 阿里巴巴发布Qwen-Image-2.0模型,聚焦语义理解与实用编辑,统一了生成与编辑架构,并强化了中文汉字渲染能力,能更好理解超长复杂指令 [1] - 字节跳动发布Seedream5.0Preview模型,主打检索生图与精细调控,显著提升提示词理解准确率,支持更精细的纹理生成与可控调整,深度适配内容创作全流程 [1] 技术进展与模型性能 - Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率输出,可准确渲染复杂指令,生成专业PPT及信息图 [2] - Qwen-Image-2.0在原有两大模型基础上全新升级,首次将图像生成和编辑统一到一个模型中,以更轻量架构实现生图和改图性能的大幅提升 [2] - Seedream5.0Preview支持2K和4K分辨率输出,用户可在即梦平台免费体验2K输出效果 [2] - 当前AI生图文字细节崩溃的主要原因包括:VAE(变分自动编码器)技术对图像中文字(尤其是小尺寸文字)处理的局限性,以及图像生成模型自身建模能力的限制 [3] 应用场景:电商领域 - AI生图是当前电商客户除数字人外,消耗token(最小文本单元)较大的需求 [1][6] - 电商场景是Qwen-Image模型落地的主流场景之一,Qwen-Image-2.0针对电商场景在商品生产细节、文字可控度及二次编辑等方面进行了优化 [1][6] - 新模型可将商品详情页描述图、模特穿搭效果等任务结合完成,通过将图片编辑和生成融合在一个模型中,提升电商卖家的效率,推动企业级应用落地 [6] 应用场景:漫剧市场 - AI技术正逐步渗透漫剧市场,主流制作途径为AI生成图片,再经图片视频化,搭配AI配音和字幕完成出片 [4] - 据东吴证券研报,AI可使漫剧制作成本降低90% [4] - 中文在线AI动漫部总经理表示,AI将传统漫剧的11个制作流程精简为4个步骤(剧本创作、图片生成、图转视频、后期加工),大大提高生产速度 [4] - 艾媒咨询数据显示,51.2%的用户肯定AI在降低漫剧制作成本方面的价值,47.7%的用户肯定其在加快IP转化方面的价值 [5] - 同时,47.1%的用户指出AI漫剧在画面风格统一性上存在不足,46.7%的用户指出其在配音情感表现上存在不足 [5] - AI漫剧目前极为依赖“抽卡”生成模式,最终效果高度依赖AI自身的理解与推理能力,人工干预主要在于打磨提示词 [5] 市场展望与行业影响 - 2025年图像生成技术正逐步渗透到电商场景与漫剧市场中 [2] - 随着技术进步,行业关注2026年是否能迎来规模化应用市场 [2] - AI技术对漫剧行业的影响兼具机遇与挑战,既通过降本增效推动行业升级,也因画风、配音等质量问题,倒逼行业在追求规模化的同时强化内容创意与品质把控 [5]
阿里、字节同日上新图像生成模型,对标Nano Banana Pro