腾讯混元上新：话没说完，图就生成了……

腾讯混元图像2.0模型发布 - 公司发布最新混元图像2.0模型实现行业内首个实时生图功能改变传统"抽卡—等待—抽卡"的交互模式 [1] - 模型支持文生图和绘画生图输入文字指令、语音指令或上传本地图均可毫秒级生成高质感图像 [1] - 演示案例显示用户输入"一位女士"首先生成证件照后续连续输入"风景照、沙漠中"等指令画面背景实时切换 [3] 技术性能突破 - 模型参数量较前代提升一个数量级采用超高压缩倍率图像编解码器及全新扩散架构生图速度显著快于行业领先模型 [7] - 在同类产品每张图推理需5-10秒情况下该模型实现毫秒级响应支持用户边打字或说话边出图 [7] - 模型在GenEval基准测试中准确率超过95% 大幅领先其他同类模型其中Color Attribution指标达0.975 [8] 应用场景展示 - 支持"实时绘画板"功能用户可在图片上使用画笔修改并迅速生成结果 [4] - 案例演示生成"爱因斯坦在东方明珠前自拍"时模型快速展现完整生成过程 [5] - 实时反馈功能突破传统AI图像生成需反复投喂的局限显著提升创作效率 [7]