Workflow
DreamOmni2
icon
搜索文档
腾讯研究院AI速递 20251024
腾讯研究院· 2025-10-24 00:01
生成式AI 一、谷歌上线AI学习平台Google Skills, 三 千 课程 全 民 可 用 1. 谷歌推出AI学习平台Google Skills,整合Google Cloud、DeepMind、Google for Education等内容,提供超 3000门课程,覆盖大型语言模型技术和伦理方面; 2. 平台采用游戏化激励方式包括连胜追踪、技能徽章和排行榜,过去1年已有2600万人在谷歌分散平台学技能,现集 中到一个入口; 3. Google Skills打通招聘通道,招聘联盟包括150多家雇主,用户完成相关证书可跳过初筛直接进面试,构建学习- 证明-就业闭环。 https://mp.weixin.qq.com/s/mkOexTs9fz978PFxE5ZbwQ 二、Sora 项目负责人发Sora2升级线路图,有四点重点变化 1. Sora2将推出"角色客串"功能,用户可将现实物品或生成的人物投射到虚拟世界,创建独特人物IP并进行互动; 1. 快手发布AI编程产品矩阵,推出KAT-Coder模型、CodeFlicker智能开发工具和万擎MaaS平台三位一体解决方 案; 2. KAT-Coder在SWE-be ...
让海外创作者喊出「King Bomb」的P图大杀器来了
36氪· 2025-10-23 14:57
「Photoshop is dead」,已经成为最近 AI 创作者圈中讨论最热的话题之一。 随着图像编辑与生成模型进入到了又一个集中爆发期,这个专业创意软件长久以来的王座地位受到了前所未有的冲击。 尤其是引领这波多模态生图技术升级潮流的谷歌 Nano Banana 以及字节 Seedream4.0、阿里 Qwen-Image-Edit-2509,它们涌现出了更多新的能力与玩法, 比如 OOTD 穿搭、文字渲染、生成电影分镜。在无需掌握深度修图技能的前提下,这些模型使得创作者开始更多地关注「如何让生图结果更可控、更有 创意、更具产品化价值。」 从技术路线来看,以 Nano Banana 为代表的模型通过多模态指令,将语言理解、视觉识别与生成控制等不同的能力融合在一起,实现更自然的创作体验。 不过,随着使用场景的不断拓展,这类指令驱动的编辑与生成在实际操作中也逐渐暴露出了一些不容忽视的局限。 根据团队的说法,不论是具体物体还是抽象概念的编辑与生成,DreamOmni2 都可以取得显著优于当前 SOTA 开源模型的表现,在一些方面甚至比 Nano Banana 效果都要好。我们来一睹效果: 基于指令的多模态编辑:让 ...
谷歌最强AI,被港科大开源超了?让海外创作者喊出「King Bomb」的P图大杀器来了
机器之心· 2025-10-23 13:09
「Photoshop is dead」,已经成为最近 AI 创作者圈中讨论最热的话题之一。 随着图像编辑与生成模型进入到了又一个集中爆发期,这个专业创意软件长久以来的王座地位受到了前所未有的冲击。 尤其是引领这波多模态生图技术升级潮流的谷歌 Nano Banana 以及字节 Seedream4.0、阿里 Qwen-Image-Edit-2509,它们涌现出了更多新的能力与玩法,比如 OOTD 穿搭、文字渲染、生成电影分镜。在无需掌握深度修图技能的前提下,这些模型使得创作者开始更多地关注「如何让生图结果更可控、更有创意、更具产 品化价值。」 | 机器之心原创 | | --- | 编辑:杜伟 从技术路线来看,以 Nano Banana 为代表的模型通过多模态指令,将语言理解、视觉识别与生成控制等不同的能力融合在一起,实现更自然的创作体验。不过,随 着使用场景的不断拓展,这类指令驱动的编辑与生成在实际操作中也逐渐暴露出了一些不容忽视的局限。 比如编辑任务中通常依赖的语言指令有时会描述不清,需要结合参考图像以及额外的文本说明;生成任务对于具体物体表现良好,但处理起抽象概念(发型、妆 容、纹理、打光、风格等)来往往力不 ...