Alphabet-Google's new AI model can "create anything"

模型能力与技术进步 - 公司推出新模型，能够根据任何输入创造任何内容，该模型结合了Gemini的智能与生成式媒体模型的最佳能力，实现了对世界理解、多模态和编辑的新水平 [1] - Omni模型在模拟动能和重力等概念方面取得了显著进步，代表了技术能力的阶跃式变化，而先前的系统处理这些概念存在困难 [2] - 模型如VO、Nanobanana和Genie能够生成极度逼真的视频、图像和交互式模拟 [1] 核心功能与应用 - Gemini模型的世界知识和推理能力突出，能够将复杂想法转化为高精度的视频内容，例如，通过一个简单的提示即可生成关于蛋白质折叠的科普解释视频 [2] - 生成过程是迭代式的，Omni模型提供了通过对话语言编辑视频的更自然方式，类似于Nanab Banana重新定义了图像编辑 [3] - 用户可以使用自己的视频内容（如自拍视频）进行创作，轻松调整细节与风格、添加元素，使整个场景根据新想法进行变化，例如将一个简单的圆圈变成黑洞或将傍晚散步的场景生动化 [4] 技术原理与示例 - 以蛋白质折叠为例，模型能展示蛋白质从氨基酸链开始，折叠成如阿尔法螺旋和贝塔片层等模式，最终形成完美三维结构的过程 [3] - 任何事物都能成为创造全新现实的画布，模型具备将任何输入转化为全新创作素材的能力 [4]