Google's new AI model can "create anything"
模型能力与技术进步 - 公司推出新模型,能够根据任何输入创造任何内容,该模型结合了Gemini的智能与生成式媒体模型的最佳能力,实现了对世界理解、多模态和编辑的新水平 [1] - Omni模型在模拟动能和重力等概念方面取得了显著进步,代表了技术能力的阶跃式变化,而先前的系统处理这些概念存在困难 [2] - 模型如VO、Nanobanana和Genie能够生成极度逼真的视频、图像和交互式模拟 [1] 核心功能与应用 - Gemini模型的世界知识和推理能力突出,能够将复杂想法转化为高精度的视频内容,例如,通过一个简单的提示即可生成关于蛋白质折叠的科普解释视频 [2] - 生成过程是迭代式的,Omni模型提供了通过对话语言编辑视频的更自然方式,类似于Nanab Banana重新定义了图像编辑 [3] - 用户可以使用自己的视频内容(如自拍视频)进行创作,轻松调整细节与风格、添加元素,使整个场景根据新想法进行变化,例如将一个简单的圆圈变成黑洞或将傍晚散步的场景生动化 [4] 技术原理与示例 - 以蛋白质折叠为例,模型能展示蛋白质从氨基酸链开始,折叠成如阿尔法螺旋和贝塔片层等模式,最终形成完美三维结构的过程 [3] - 任何事物都能成为创造全新现实的画布,模型具备将任何输入转化为全新创作素材的能力 [4]