Workflow
Gemini 2.5 Flash Image Preview
icon
搜索文档
腾讯混元图像 3.0 全球“盲测”登顶第一,多模态生成技术领先全球
搜狐财经· 2025-10-05 23:26
榜单排名表现 - 腾讯混元图像3.0在LMArena最新文生图榜单中,于全球26个大模型中排名第一位[1] - 该模型得分为1167分,以16分优势领先第二名谷歌Gemini 2.5 Flash Image Preview模型(1151分)[2][3] - 同时超越字节跳动Seedream 4系列模型(最高得分1144分)和谷歌Imagen 4.0系列模型(最高得分1142分)[2][3] - LMArena官方确认该模型被评为最佳综合文生图模型与最佳开源文生图模型[2] 评测平台权威性 - LMArena由美国加州大学伯克利分校推出,采用基于人类真实偏好的盲测机制[4] - 平台总投票数达到3,159,029次,评测机制贴近实际体验,是国际最权威的竞技场榜单[2][4] - 用户输入问题后,平台提供两个模型的匿名回答,用户根据偏好选择更优答案[4] 技术特性与能力 - 混元图像3.0是首个开源工业级原生多模态生图模型,具备常识并能够利用知识进行推理[4][8] - 模型语义理解准确度高,支持中英文文字生成和长文本文字渲染[4][9][11] - 具备极致美学质感,能生成真实的高质感图片,支持多格表情包生成[4][13][15] - 目前版本已开放文生图能力,图生图、图像编辑、多轮交互等版本将于后续发布[6] 市场认可与生态建设 - 模型发布后登上Hugging Face开源社区模型热榜第一名,持续一周稳居第一[4] - 混元已形成语言、图像、视频、3D模型的多尺寸、多模态开源矩阵[15] - 图像、视频衍生模型总数达到3000个,混元3D系列模型社区下载量超过260万[15] - 在3D生成领域,混元3D模型在图生3D和文生3D任务中均位列第一[15] 行业地位与竞争优势 - 此次是混元图像3.0首次夺得文生图榜单冠军,超越众多顶级闭源模型[3] - 多模态正在成为混元大模型的核心竞争力之一,图像生成模型与3D生成模型均处于行业顶尖水平[15] - 混元世界模型Voyager在斯坦福大学WorldScore基准测试中综合能力排名首位[15] - 公司提供接近商业模型性能的开源基座,是全球最受欢迎的3D开源模型[15]