谷歌DeepMind推出Veo 2 - 谷歌DeepMind推出Veo 2 AI视频生成工具,正式登陆Gemini Advanced [4] - Veo 2可生成8秒720P电影级视频,支持4K分辨率(计划年内开放),在运镜、文本语义还原、物理模拟、动作一致性等方面表现优秀 [6] - 新增电影级创作工具:自动移除干扰元素、Outpainting功能扩展画面、内置"无人机视角""延时摄影"等拍摄参数 [8] - 支持多模态协同:调用Imagen 3文本生图模型或导入本地素材,实现"文字描述-图像生成-视频剪辑"全流程闭环 [8] - 嵌入不可见数字水印,支持第三方验证内容来源 [8] - 测试数据显示Veo 2在用户偏好和提示还原方面超过Sora、可灵1.5、MetaMovieGen和Minimax [10] 川崎公司推出氢动力AI坐骑CORLEO - 川崎重工展示Corleo四足机器人概念车,融合摩托车工程与机器人技术 [13] - 配备150cc氢燃料发动机,四个独立机械腿带柔性橡胶蹄,实时分析机器人及骑手位置确保安全 [13] Astrocade推出Wish-to-Game平台 - Astrocade团队推出AI游戏创作平台,用户仅需文字描述即可生成可玩游戏 [16] - 平台自动处理代码、视效、动画、音乐及机制,支持实时修改内容 [16] - 集成社交功能,用户可发现新游戏并参与比赛、合作项目 [17] DeepSeek推出SPCT技术 - DeepSeek联合清华大学推出SPCT技术,通过推理阶段动态优化AI输出质量 [19] - 突破传统奖励模型局限,支持自我指导机制优化决策过程,提升智能水平和可扩展性 [19] Midjourney V7发布 - Midjourney V7在图像质量、指令解析能力方面显著提升,可生成超逼真人物及商业大片级图像 [21] - 新增个性化模型功能,根据用户审美偏好提供精准生成,草稿模式提升渲染速度和成本效率 [21] TokenHSI技术革新仿真人形机器人 - 香港大学和上海人工智能实验室开发TokenHSI技术,基于Transformer架构统一策略网络 [23] - 解决传统物理角色控制方法无法整合多种复杂人体场景交互技能的局限 [25] - 支持可变长度输入快速适应新场景,通过跨任务知识共享提升交互多样性与灵活性 [25] Sakana AI推出AI Scientist - Sakana AI的AI Scientist-v2生成首篇通过ICLR研讨会同行评审的科研论文 [28] - 系统在自主研究中存在不足:文献综述错误归类学术概念、42个实验因编码错误失败、论文存在结构错误等 [30]
AI视频进入「真4K时代」?近期AI新鲜事还有这些……
红杉汇·2025-04-16 22:19