图像生成

搜索文档
单张照片生成360°3D场景,支持灵活视角漫游|人大&北师大&字节
量子位· 2025-03-28 18:01
FlexWorld团队 投稿 量子位 | 公众号 QbitAI 从单张图像生成灵活视角3D场景的技术来了,在考古保护、自主导航等直接获取3D数据成本高昂或不可行的领域具有重要应用价值。 这一任务本质上是高度不适定的:单一的2D图像无法提供足够的信息来消除完整3D结构的歧义,尤其是在极端视角(如180°旋转)下,先前 被遮挡或缺失的内容可能会引入显著的不确定性。 生成模型,特别是扩散模型,为解决这一问题提供了一种潜在的技术路径。尽管现有方法通常依赖预训练的生成模型作为新视角合成的先验, 但它们仍面临显著挑战。 例如,基于图像的扩散方法容易累积内容误差,基于视频的扩散方法则难以处理可能生成的动态内容构建静态3D场景的影响。最近的研究尝 试通过在视频扩散模型中引入点云先验来提升一致性,虽然取得了一定进展,但在可扩展性方面仍存在局限,尤其是在大视角变化下的表现有 待提升。 针对上述问题,人大高瓴李崇轩、文继荣团队、北师大王一凯团队与字节跳动的研究员提出了一种新方法FlexWorld,用于从单张图像生成灵 活视角的3D场景。 与现有方法不同,FlexWorld通过合成和整合新的3D内容,逐步构建并扩展一个持久的3D表示 ...
速递|OpenAI 计划将Sora接入ChatGPT,Sora的生成能力或扩展到图像
Z Potentials· 2025-03-01 11:53
Sora集成到ChatGPT计划 - OpenAI计划将AI视频生成工具Sora直接集成到ChatGPT中,以扩大产品协同效应 [2][3] - 集成后的Sora版本可能无法提供与独立Web应用相同的视频编辑控制功能 [3] - 该举措旨在通过视频生成能力吸引用户升级ChatGPT高级订阅 [3] Sora产品发展路线 - Sora当前仅通过独立Web应用提供,支持生成最长20秒的电影风格视频片段 [2] - 公司正在开发Sora Turbo模型的新版本以增强现有功能 [6] - 团队积极招募移动工程师,计划未来推出独立的Sora移动应用程序 [4] 多模态能力扩展 - OpenAI研发基于Sora的AI图像生成器,可能比现有DALL-E 3模型产生更真实的照片 [5] - 公司致力于扩展Sora的内容创作范围,包括视频和图像生成能力的结合 [3][5] 产品战略考量 - 初期将Sora作为独立应用推出是为了保持ChatGPT的界面简洁性 [4] - 已逐步完善Sora网络体验,增加社区视频浏览功能以提升用户参与度 [4]
顺为、朱啸虎入局,AI图像生成平台一年完成四轮融资
创业邦· 2025-02-26 08:23
2024年7月,LiblibAI 完成由明势创投领投的总金额达数亿元人民币融资,创国内AI图像赛道的最大融资 金额。 详情请戳视频 以上就是本期全部内容,如果您想了解更多 最新 企业 动态, 欢迎登录 睿兽分析 查看,解锁 赛道图 谱 以及 行业报告 。 国内 AI应用赛道融资速度新纪录! 近日,AI图像生成平台「LiblibAI-哩布哩布AI」宣布在一年内已连续完成四轮融资。创下国内AI应用赛 道融资速度纪录。 据悉,最新两轮融资由渶策资本、顺为资本及某产业投资方领投, 明势创投等老股东超额跟投 。 ...