Workflow
腾讯混元上新:话没说完,图就生成了……

(文/万肇生 编辑/张广凯) 5月16日,腾讯发布最新混元图像2.0模型,该模型号称改变传统"抽卡—等待—抽卡"的方式,在行业内率先实现实时生图,带来交互体验革新。 目前市面上的各类大模型中,除了非推理语言大模型的生成外,几乎所有模态大模型的生成过程,都或多或少需要经历等待。尤其在文生图领域,抽卡一 样重复生成多个结果,严重影响效率。然而据腾讯介绍,该混元图像2.0就主打一个"快",支持文生图和绘画生图。且无论是输入文字指令、语音指令, 或上传本地图、在线绘制图,"都能毫秒级获得高质感图像"。 根据演示案例显示,用户在输入"一位女士"时,模型首先生成了一张证件照。此时在输入框内继续输入"…风景照、沙漠中",画面的背景于是瞬间变成翠 绿色,紧接着又秒变成沙漠黄。继续再输入"扎着头发、回眸一笑",画面也飞速切换,最终随着输入操作的结束,画面直接生成完毕。 本文系观察者网独家稿件,未经授权,不得转载。 在另一个生成"爱因斯坦在东方明珠前自拍"的案例中,该模型也非常迅速的展现出整个生成的过程。 通常情况下,绘画过程中的即时反馈可以让用户对作品迅速做出调整,但AI图像生成的修改往往是反复投喂产出。因此,如果在生成的过程 ...