Workflow
智谱发布首个支持生成汉字的开源文生图模型CogView4,性能达到SOTA
IPO早知道·2025-03-04 23:02

「智谱2025开源年」的第一个模型。 本文为IPO早知道原创 作者|Stone Jin 微信公众号|ipozaozhidao 据IPO早知道消息,智谱于3月4日发布了「智谱2025开源年」的第一个模型:首个支持生成汉字的 开源文生图模型——CogView4,其在 DPG-Bench基准测试中的综合评分排名第一,在开源文生 图模型中达到SOTA。该模型也是首个遵循 Apache 2.0协议的图像生成模型。 具体来讲: CogView4具备较强的复杂语义对齐和指令跟随能力,支持任意长度的中英双语输入, 能够生成在给定范围内的任意分辨率图像,同时具备较强的文字生成能力。 值得一提的是, CogView4在 DPG-Bench基准测试中的综合评分排名第一,在开源文生图模型中 达到SOTA。 DPG-Bench(Dense Prompt Graph Benchmark)是一个用于评估文本到图像生 成模型的基准测试,主要关注模型在复杂语义对齐和指令跟随能力方面的表现。 从技术层面来看,CogView4具有两大技术领先性: 首先, CogView4支持中英双语提示词输入,擅长理解和遵循中文提示词,是首个能够在画面中生 成汉 ...