Workflow
腾讯混元上新:话没说完,图就生成了……

腾讯混元图像2.0模型发布 - 公司发布最新混元图像2.0模型 实现行业内首个实时生图功能 改变传统"抽卡—等待—抽卡"的交互模式 [1] - 模型支持文生图和绘画生图 输入文字指令、语音指令或上传本地图均可毫秒级生成高质感图像 [1] - 演示案例显示 用户输入"一位女士"首先生成证件照 后续连续输入"风景照、沙漠中"等指令 画面背景实时切换 [3] 技术性能突破 - 模型参数量较前代提升一个数量级 采用超高压缩倍率图像编解码器及全新扩散架构 生图速度显著快于行业领先模型 [7] - 在同类产品每张图推理需5-10秒情况下 该模型实现毫秒级响应 支持用户边打字或说话边出图 [7] - 模型在GenEval基准测试中准确率超过95% 大幅领先其他同类模型 其中Color Attribution指标达0.975 [8] 应用场景展示 - 支持"实时绘画板"功能 用户可在图片上使用画笔修改并迅速生成结果 [4] - 案例演示生成"爱因斯坦在东方明珠前自拍"时 模型快速展现完整生成过程 [5] - 实时反馈功能突破传统AI图像生成需反复投喂的局限 显著提升创作效率 [7]