DreamGen

搜索文档
计算机行业“一周解码”:英伟达DreamGen项目提升机器人训练效率
中银国际· 2025-05-27 16:31
报告行业投资评级 - 强于大市,预计该行业指数在未来 6 - 12 个月内表现强于基准指数,沪深市场基准指数为沪深 300 指数 [1][28] 报告的核心观点 - 小米发布自研芯片玄戒 O1 与纯电 SUV YU7,玄戒 O1 芯片发布提升国产芯片技术话语权,降低对海外供应链依赖,助力国产软硬件生态协同发展;NVIDIA GEAR Lab 推出 DreamGen 项目,为机器人学习提供新路径,开源计划推动我国技术革新和产业升级;谷歌推出安卓 XR 智能眼镜,推动全球科技巨头加速 XR 领域研发与成果落地,引领未来人机交互潮流,带动产业链发展 [5] - 建议关注科技自主可控相关企业,如软通动力、达梦数据等;以及基本面良好、未来提升空间较大的企业,如合合信息、大位科技等 [3] 根据相关目录分别进行总结 本周重点关注事件 - 小米 5 月 22 日晚发布自研芯片玄戒 O1 与纯电 SUV YU7,玄戒 O1 采用第二代 3nm 工艺,集成 190 亿晶体管,将搭载于小米 15S Pro 和小米平板 7 Ultra;小米 YU7 提供单电机后驱及双电机四驱版本,续航 670 - 760km [10] - NVIDIA GEAR Lab 近日推出 DreamGen 项目并计划未来几周全开源,该项目让机器人“在梦境中学习”,实现零样本行为泛化和零样本环境泛化,实验显示学习新动作成功率从 11.2%升至 43.2%,全新环境成功率从 0%达 28.5% [12] - 5 月 21 日凌晨谷歌在 I/O 开发者大会推出安卓 XR 智能眼镜,由谷歌与三星共同开发,使用 Android XR 系统,搭载 Gemini 模型,具备全天佩戴潜力 [13] 新闻及公司动态 行业新闻 - 芯片及服务器:5 月有多起芯片相关动态,如昂瑞微推新一代低功耗无线射频芯片、英伟达将推下一代人工智能系统等 [15] - 云计算:微软添加 AI 模型到云计算平台,上海推进云计算等技术集成应用,阿里云新增 7 个数据中心 [16] - 人工智能:多地有人工智能相关动作,如北京产投基金入股机器人公司、浙江出台扶持政策等,多家公司有新进展 [17] - 数字经济:深交所发布指数,上合组织将办论坛,多地有促进数字经济发展举措 [17] - 网络安全:“智谱清言”等存在违规收集信息问题,曙光网络发布流量回溯平台 [18] - 工业互联网:山东矿机获软件著作权,铜陵有色项目通过验收,工业互联网大会召开 [19] 公司动态 - 捷顺科技回购注销限制性股票,总股本和注册资本减少,因现金分红调整回购价格上限 [19][20] - 南天信息回购注销限制性股票,总股本减少 [20] - 拓尔思向 98 人首次授予 410.00 万股限制性股票,占公司股本 0.47% [20] - 光洋股份股票停牌,预计 6 月 3 日前披露重组方案 [20] - 海光信息与中科曙光筹划换股吸收合并并募集配套资金,股票停牌 [21]
英伟达让机器人“做梦学习”,仅需 1 个动作数据,解锁 22 种新技能
36氪· 2025-05-23 09:49
机器人前瞻5月22日报道,近日,NVIDIA GEAR Lab推出DreamGen项目,该项目能够让机器人实现"在梦境中学习",在业内真正实现了零样本行为泛化 和零样本环境泛化。同时,英伟达还计划在未来几周对DreamGen进行全开源。 在过去,机器人学习依赖人工收集大规模遥操作数据,这往往耗费大量时间与成本。而仿真合成数据,也会因为sim2real 问题,导致机器人很难学以致 用,应用到真实的场景中。 英伟达机器人总监兼杰出科学家、GEAR Lab联合负责人Jim Fan介绍,DreamGen是一款全新的引擎,它不依赖人类操作员团队来扩展机器人的学习能 力,而是通过数字梦境来实现。 DreamGen 借助Sora、Veo这样的视频世界模型,创造出大规模逼真的机器人训练数据,直接从real2real开始,能应用在不同类型的机器人身上,并让机器 人在新物体、新动作和新环境中实现强泛化能力。 01.简单四步,教会机器人在梦境中学习 DreamGen只需要通过以下四步流程即可实现: 1、微调视频世界模型 基于人类遥操作的机器人轨迹,在目标机器人上对视频世界模型进行微调,这一适配过程使模型能够学习机器人的物理约束和运 ...
腾讯研究院AI速递 20250522
腾讯研究院· 2025-05-21 23:01
生成式AI 一、 真碾压Sora!谷歌Veo 3直接「开口说话」 物理 遵循 性 更 好 1. Veo 3实现音画同步生成功能,能根据提示词同时生成视频画面、对白、唇动和音效,实 现完整的视听体验; 2. 基于V2A(Video-to-Audio)技术,模型能将视频像素转化为语义信号,配合文本提示生 成匹配音频; 3. 模型支持长提示词理解和多步骤事件流生成,但目前仅限8秒视频,面向美国Ultra订阅用 户开放,定价249.99美元/月。 https://mp.weixin.qq.com/s/rJFwZ1lLiWzFLE7jd4jGyA 二、 12秒1万token!谷歌文本「扩散模型」Gemini Diffusion 1. Gemini Diffusion采用扩散技术生成文本,速度达2000token/秒,12秒可生成1万 tokens; 2. 区别于传统自回归模型从左到右生成,通过逐步优化噪声学习生成输出,可快速迭代和错 误纠正; 3. 性能可与更大的模型Gemini 2.0 Flash-Lite相媲美,支持非因果推理,能一次生成整个标 记块。 https://mp.weixin.qq.com/s/paes ...
英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化
量子位· 2025-05-21 18:39
鹭羽 发自 凹非寺 量子位 | 公众号 QbitAI 「仿生人会梦见电子羊吗?」这是科幻界一个闻名遐迩的问题。 现在英伟达给出答案:Yes!而且还 可以从中学习新技能 。 如下面各种丝滑操作,都没有真实世界数据作为训练支撑。 仅凭文本指令,机器人就完成相应任务。 这是NVIDIA GEAR Lab最新推出的 DreamGen 项目。 它所说的"梦境中学习",是巧妙利用AI视频世界模型生成神经轨迹,仅需少量现实视频,就能让机器人学会执行22种新任务。 在真实机器人测试上,复杂任务的成功率更是从21%显著提升至45.5%,并 首次实现真正意义上的从0开始的泛化 。 英伟达掌门人老黄最近也在Computex 2025演讲上将其作为 GR00T-Dreams 的一部分对外正式进行宣布。 接下来就DreamGen构造我们一一拆解。 在梦境中学习 传统机器人虽已展现出执行复杂现实任务的巨大潜力,但严重依赖人工收集的大规模遥操作数据,成本高且耗时长。 纯粹的计算机仿真合成数据,也由于模拟环境与真实物理世界差距大,机器人所学会的技能难以直接应用到现实。 于是研究团队提出要不试试让机器人在梦境中学习? 这个想法也并非空穴来风, ...