与Banana Pro过过招,国产Libcom图像合成工作台开启Labubu漫游记
机器之心·2025-11-25 12:09

行业背景与市场定位 - 2025年AIGC热度再冲新高,AI生成内容已全面渗透日常创作,从社交头像、电商海报到影视分镜[1] - 通用图像编辑大模型(如Nano Banana、Qwen Edit)功能强大,覆盖广泛图像编辑场景,但在细分领域表现不足且用于简单任务性价比不高[1] - 图像合成(融图)是图像编辑领域的常用操作,基础用法是将前景物体插入背景图片,但简单剪切粘贴会导致边缘锯齿、光照不和谐、缺失阴影等问题[1] 公司技术与产品核心 - 上海交通大学牛力团队自2018年底投身图像合成研究,至2025年已构建10+数据集、开发30+原创模型、发表25+高质量学术论文[2] - 团队于2023年底推出Libcom工具箱,无需训练微调即可对任意图片实现开箱即用的图像合成功能,并于2025年升级为Libcom图像合成工作台[2] - Libcom工作台专注于图像合成细分领域,提供生成、检测、评估共计12项功能,与通用图像编辑大模型形成差异化竞争[2][5] 产品功能详解 - 工作台12项功能分为6组:基础合成(alpha混合、泊松融合)、图像和谐化(颜色迁移、图像和谐化、艺术图像和谐化)、背景效果生成(阴影生成、倒影生成)[5] - 分析工具包括不和谐区域检测、物体放置合理性热力图,打分工具提供和谐度分数和物体放置合理性分数[5] - 高级合成功能集成了FLUX-Kontext和InsertAnything两个模型[5] 竞品性能对比 - 在将Labubu融入水中的场景中,Libcom实现无缝融合,而Nano Banana Pro表现不稳定,需调节提示词才能得到接近结果[7] - 在光照和谐化任务中,Libcom使前景与背景更加和谐,而Banana Pro结果背景色调变化且前景和谐化过度[20] - 在阴影生成任务中,Banana Pro生成的影子复刻了前景形状但方向不对;在倒影生成任务中,Banana Pro生成的倒影过大过清晰[26][27] - 在艺术风格调整任务中,Libcom结果更疯狂融入画作,而Banana Pro结果相对保守[23]