Workflow
Genie 3
icon
搜索文档
智源研究院王仲远:世界模型的关键是真正预测下一个状态
经济观察网· 2025-11-01 18:51
世界模型成为AI新焦点 - 2025年“世界模型”成为AI领域最受关注的词汇之一 其核心是让AI理解世界运作规律 实现从识别生成到想象预测的跨越 [2] - 随着大模型红利减弱 行业正寻找新增长点 世界模型被视为重要方向 [2] 智源研究院Emu3.5模型技术突破 - 智源研究院发布悟界·Emu3.5多模态世界大模型 采用自回归架构统一了图像 文本与视频的生成和理解 能够预测下一个状态 [2] - 模型基于超过10万亿token的多模态数据训练 视频数据累计时长达790年 参数规模为340亿 [3] - 通过“离散扩散自适应”推理方法 图像生成速度提升近20倍 同时保持高质量输出 [3] - 模型在三个维度实现突破 理解高层级人类意图并生成多步骤行动路径 动态模拟物理世界 提供泛化交互能力 [3] 世界模型的核心价值与应用 - 世界模型核心是对因果与物理规律的理解 而非简单的视频生成 [3] - Emu3.5不限定用途 既可支撑具身智能 也能生成多模态训练数据 展示了中国科研团队的原创路线 [4] - 未来AI的发展方向是理解世界本身并在其中行动 [4] 行业巨头布局世界模型 - DeepMind推出可生成交互式3D世界的Genie 3 OpenAI强化Sora的物理一致性 [2] - 英伟达 华为 百度等公司正从机器人与自动驾驶场景切入 让AI从看懂迈向参与 [2]
人形机器人前沿:大型科技公司 “投身机器人领域”…… 软银 ABB、苹果、Meta、擎天柱 v3Humanoid Horizons Big Tech 'Doing the Robot'... SoftbankABB, Apple, Meta, Optimus v3
2025-10-27 20:06
好的,请阅读以下根据您提供的电话会议记录整理的详细分析。 行业与公司 * 纪要主要涉及人形机器人及具身智能行业[1][2] * 重点讨论的公司包括特斯拉、苹果、Meta、谷歌、xAI、软银、ABB、Figure AI、1X、优必选等科技巨头及机器人初创企业[3][5][7][29][34][39][42][53] 核心观点与论据 **战略动向与行业整合** * 软银同意以54亿美元收购ABB的机器人部门 标志着大型AI投资者与传统机器人/工业公司潜在合作的开端[3][5][39] * Meta的CTO将人形机器人视为公司下一个“AR级别的赌注” 长期目标是成为可与全球硬件开发商合作的软件/AI提供商[5] * 苹果疑似布局机器人领域 其CEO蒂姆·库克发布的宣传视频中出现了1X人形机器人 同时有报道称苹果将与比亚迪在越南合作生产机器人[7][34][40] **技术进展与模型开发** * 谷歌DeepMind发布了最新的Gemini Robotics 1.5系列模型 这是其最强大的视觉语言动作模型 能够将视觉输入和自然语言指令转化为实际电机命令[45][46] * xAI据称已开始构建世界模型 最初用于创建视频游戏 但未来将扩展到机器人领域 并已从英伟达招募经验丰富的工程师[5][6][45] * 亚马逊的FAR团队发布了ResMimic框架 用于人形机器人的全身运动操控 使机器人能够承载约55公斤的有效载荷[52] **产品发布与性能提升** * 特斯拉计划在2026年第一季度发布完全重新设计的Optimus v3 其拟人程度极高 并设定了v3产量100万台 v4产量1000万台 v5产量5000万至1亿台的宏伟目标[7][53] * Figure AI发布了第三代Figure 03人形机器人 具有增强的传感和触觉能力 无线充电功能 并且为大规模制造做好了准备[42] * 中国公司优必选Walker S2获得了价值1260万元人民币的实体智能项目订单[34] **市场表现与投资活动** * 等权重Humanoid 100指数自2025年2月6日创立以来上涨了27% 超越了标普500指数和MSCI欧洲指数 但落后于MSCI中国和MSCI韩国指数[11][70] * 中国机器人价值链在9月强劲上涨18%后 10月迄今下跌了11% 表现逊于MSCI中国指数[11] * Figure AI完成了由Parkway Venture Capital领投的10亿美元C轮融资 公司估值达到390亿美元[29] * 2025年中国人形机器人公司融资活动活跃 10月份有29笔交易[28][99] **政策支持与区域动态** * 中国各级政府自2023年以来出台了一系列支持人形/具身AI发展的政策 并设立了总规模约1870亿元人民币的产业基金[57][59] * 根据国际机器人联合会的数据 2024年中国占全球工业机器人安装量的54% 较十年前26%的份额大幅提升 国内供应商首次在本土市场占据过半销售额[7] 其他重要内容 **供应链挑战与关键瓶颈** * 特斯拉指出 灵巧的手和前臂是整个人形机器人中最困难的工程挑战 其机电复杂性超过机器人其他部分的总和[7][53] * 人形机器人没有现成的供应链 特斯拉需要高度垂直整合并内部制造零件[53] **长期市场潜力** * 摩根士丹利全球人形机器人总目标市场模型预测 到2050年 人形机器人存量将达到10亿台 年收入规模达5万亿美元 长远来看可能远超全球汽车行业[107]
视远·正心明智——机器之心2025年度AI榜单正式启动
机器之心· 2025-10-24 17:12
全球人工智能技术发展 - 2025年人工智能技术持续深入发展,大模型快速迭代,几乎每天都有新的突破性模型和训练方法出现[2][3] - 模型能力显著进步,例如GPT-4.5、GPT-5、Genie 3等模型在理解、生成、推理能力上不断取得突破[4] - 技术进步催生新的应用形态,代码生成领域模型可自动完成复杂程序编写、优化和调试,智能体领域模型可自主完成多步骤任务和跨应用操作[4] 中国人工智能产业进展 - 2025年中国人工智能发展表现精彩,国产大模型性能逐步逼近甚至领先国际水平[4] - 中国在开源生态方面展现出强劲势头,Design Arena排行榜上排名前15的开源AI模型全部来自中国[4] 人工智能企业评选标准 - 最强技术实力企业TOP 10评选标准包括企业对AI技术进行长期持续研发布局,拥有领先技术储备且积极创新,研究成果及技术实力在领域内保持绝对领先[7] - 人工智能领军企业TOP 20评选标准包括企业在AI技术研发、落地应用、商业模式和财务等方面构建完整运营能力及竞争优势,能引领技术创新且业绩持续增长[8] - 最佳大模型TOP 20榜单评选国内有代表性、实力强大的基础大模型[9] 人工智能应用与产品发展 - 最佳大模型产品TOP 20榜单旨在评选国内发布的最有价值的大模型产品与应用,产品与应用是实现大模型技术价值的关键[10] - 具身智能领军企业TOP 10榜单评选该领域具备系统性技术布局与持续创新能力的领军企业,随着大模型技术突破,具身智能进入新发展阶段[11][12] - ScienceAI领军企业TOP 10聚焦AI与其他学科的交叉领域,通过解决科学问题推动产业发展,企业需拥有突破性研究成果及AI技术实力,并有明确应用场景[13]
人工最高节省90%,AI制作游戏被批“没有灵魂”
第一财经· 2025-10-22 17:15
AI对游戏开发效率的提升 - 在美术成本超过1亿元的3D类游戏中,20%至30%的次级资源可通过AI工具解决,实现千万元级别的成本降低 [1][5] - 游戏开发工作量的70%至80%为美术资产处理,其中动画制作和模型制作是主要部分 [3] - 在动画制作的骨骼绑定环节,AI工具可将原本需要1天半到3天半的工作缩短至1到3小时,节省70%至90%的人工 [3] - 在动画关键帧制作环节,AI模型能根据5至10帧关键帧自动生成60帧流畅动画,将效率提升3至5倍 [3] - 腾讯内部项目应用AI后,角色动画制作周期缩短40%,角色技能原型验证时间从2周压缩至3天 [4] AI工具的应用现状与范围 - 腾讯的全链路AI创作解决方案VISVISE已在其内部头部项目使用,并开放给至少50家外部公司,包括完美世界、库洛游戏,同时向日韩及欧洲头部游戏公司开放试用 [4] - 3D生成工具目前尚难用于3A游戏的核心高品质资产制作,但能高效处理项目中的次级资源,如植被、山林、路边雕像等 [4] - AI工具的使用成本较低,采用订阅制,生成一张符合要求的图像成本极低,开箱率普遍不超过10张(即生成10张必有1张符合要求),其成本远低于游戏外包人员(日薪超千元)或正式员工的人力成本 [6] 行业对AI的不同看法与影响 - 部分行业声音认为AI难以替代创意工作,例如特斯拉CEO马斯克成立的xAI游戏工作室计划遭质疑,有观点认为AI无法提供优秀游戏必需的创意和远见 [6][8] - 一些已发行的AI游戏被玩家评论为更像技术演示,存在程式化、枯燥、对话公式化等问题,削弱了游戏可玩性 [8] - 另有从业者观点发生转变,认为AI在触发联想和概括语义方面进步显著,逐渐学会如何触动人心,AI带来的创作方式多样化是积极发展 [9] AI对不同规模团队的影响 - AI工具对独立游戏等极小团队以及短平快项目的轻量级团队作用最大,使原本需要十人以上团队完成的工作可由一两人完成,实现技术平权 [10] - 目前AI工具更多被中小型团队大量使用,而品质要求极高的3A商业项目为了口碑和研发稳定性,尚未广泛铺开AI工具 [10] - AI工具能降低工作门槛,例如将动作捕捉(成本约50万至100万美元)等高成本技术降至小团队可负担的水平,让不同规模团队在技术上拥有更平等的权利 [10] 技术发展与未来趋势 - 当前AI工具主要聚焦于提升效率,尚未完全颠覆原有的游戏工业管线和工作流程 [11] - 世界模型(如谷歌的Genie 3)等新技术可能改变游戏制作,例如快速生成游戏玩法的Demo,大幅缩短汇报和决策周期 [11] - 未来可能出现聚合解决方案的智能体,用户输入数值、文本等材料即可快速生成完整游戏,若结合世界模型可制作更精彩的游戏 [11] - 行业探索路径包括从传统制作流程推向更自动化,以及从世界模型等最终形态反向推导,两种路径未来可能交汇,预计3D生成世界技术还需三五年才能推动独特工作流出现 [12]
李飞飞世界模型大更新, 实时生成3D世界,只要一块GPU
36氪· 2025-10-17 16:03
技术核心与创新 - 公司发布名为RTFM的全新实时世界生成模型,可从单张静态图片实时渲染出可供自由探索和交互的3D场景[1][4] - 该模型采用类似Sora的“自回归扩散Transformer”架构,不构建任何显式的3D模型,而是通过端到端学习海量视频数据来直接预测新视角画面[9] - 模型核心创新在于引入“空间记忆”机制,为每一帧画面赋予3D空间中的精确姿态,并通过“上下文杂耍”技术仅调用局部参考帧,以维持世界持久性而不显著增加计算负担[11] 性能与效率突破 - 模型经过架构、蒸馏和推理过程的极致优化,设计目标为在现有硬件上运行明日模型,成功实现在单块H100 GPU上以交互式帧率进行实时推理和生成[1][8] - 实时生成4K 60fps交互视频流对算力要求极高,每秒需处理token量约等于一本《哈利·波特》文字量,持续一小时的交互需处理超1亿个token,当前基础设施难以负担[6] - 该技术路线相比传统3D引擎的显式建模方法,能更好地利用增长的数据和算力,实现无限扩展[9][11] 应用与演示现状 - 模型已作为研究预览版正式发布,并提供了名为FRAMEBOY的Demo供体验,其逼真的光影、反射和阴影效果在实时交互中呈现[1][3] - 当前Demo体验时间限制为3分钟,3分钟后世界状态无法维持,展示了模型在空间智能和持续交互方面的探索方向[13] - 该技术被视作通往AGI空间智能方向的重要一步,其单GPU高效运行的特性为未来世界模型的普及提供了可能性[13][15]
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型
具身智能之心· 2025-10-14 08:02
xAI入局世界模型 - 马斯克的xAI公司已正式进入世界模型研发领域,加入与Google DeepMind、Meta、英伟达等巨头的竞争 [2][7][8] - 为增强实力,xAI于2024年夏季从英伟达挖来多名资深研究员,包括Zeeshan Patel和Ethan He [2][9][16] 核心人才引进 - Zeeshan Patel于2024年5月硕士毕业于UC伯克利,研究方向为深度学习、生成模型和物理人工智能,此前曾在英伟达研究院从事生成式世界模型研究 [10][11] - Ethan He本科毕业于西安交通大学,在CMU获得计算机视觉硕士学位,其Google Scholar被引数高达8495,在加入xAI前于英伟达从事MoE模型、多模态模型和世界模型研究 [12][13][15][16] - 两位研究员均参与了英伟达Omniverse平台的核心开发工作,该平台是全球最成熟的物理一致性仿真系统之一 [18][19][20] 世界模型的战略意义与技术路径 - 世界模型被视为实现AGI(通用人工智能)的核心底座,其目标是让AI系统真正理解和推理物理3D世界,而不仅限于文本处理 [23][24][26] - xAI计划将英伟达在图形与物理模拟领域的积累(如Omniverse技术)应用到自家的世界模型体系中 [21][22] - 世界模型的应用前景广泛,可驱动AI游戏、智能体、自动驾驶乃至具身智能机器人 [38][39] 游戏领域作为首要落地场景 - xAI入局世界模型后的首批落点可能是电子游戏,团队正尝试让AI自动生成自适应、逼真的3D场景,并能根据玩家行为实时变化 [30][31] - 马斯克设下目标,计划在2026年底前推出一款由世界模型驱动的AI生成游戏 [3][32] - 为达成目标,xAI正在组建全模态团队(Multimodal Team),并公开招聘“电子游戏导师”(Video Games Tutor),时薪45–100美元,旨在向模型讲解游戏机制与设计逻辑 [33][34][35][36] 马斯克AI帝国的协同效应 - xAI的使命是“让AI理解宇宙的本质”,世界模型是实现该目标的关键路径 [37] - xAI、特斯拉、Neuralink、X平台之间可能形成协同效应:xAI研发模型,特斯拉提供机器人和自动驾驶数据,Neuralink提供脑机接口,X平台则作为社交与实时反馈渠道 [40][41]
马斯克从英伟达挖人做AI游戏!第一步:研发世界模型
创业邦· 2025-10-13 11:53
公司战略与布局 - 马斯克的xAI公司已正式入局世界模型领域,加剧了与Meta、Google DeepMind等巨头的竞争[3][9][10] - 公司计划在2026年年底前发布一款由世界模型驱动的AI生成游戏[3][29] - 公司正在组建全模态团队,专门研究图像、视频、音频的综合理解与生成,以支持世界模型开发[30] 人才招募与技术基础 - 公司于今年夏季从英伟达挖来至少两名资深研究员Zeeshan Patel和Ethan He,以增强世界模型研发实力[3][11] - 新招募的研究员此前均参与了英伟达Omniverse平台的核心开发,该平台是全球最成熟的物理一致性仿真系统之一[18][19] - 公司计划将英伟达在图形与物理模拟领域的积累应用到自家的世界模型体系中[20] 世界模型的应用前景 - 世界模型被视为AGI的核心底座,能让AI系统真正理解和推理物理3D世界,而不仅限于文本处理[23][25] - 该技术首批落地应用可能是电子游戏,旨在生成自适应、逼真的3D场景,并能根据玩家行为实时变化[29] - 世界模型技术未来可驱动智能体、自动驾驶乃至具身智能机器人,与特斯拉、Neuralink等马斯克旗下公司形成协同效应[35][36] 市场背景与行业动态 - 世界模型是近两年全球AI巨头和实验室的新战场,参与者包括Google DeepMind、Meta、英伟达和李飞飞团队等[9][28] - 视频游戏行业市场规模巨大,今年收入约2000亿美元,为AI生成游戏提供了广阔的市场空间[6]
马斯克从英伟达挖人做AI游戏,第一步:研发世界模型
36氪· 2025-10-13 10:14
马斯克的xAI也入局世界模型了! 想必听到这个消息的Meta、Google DeepMind一定会缓缓打出一个问号:冲我们来的? 据《金融时报》(FT)报道,为了增加这场"世界模型大混战"的赢面,今年夏天,xAI已经从英伟达挖来了多名资深研究员来助阵。 另一边,在悄然下场世界模型后,马斯克几天前又在上再次重申了去年定下的那个"小目标"—— 2026年年底前,xAI会发布一款伟大的AI生成游戏。 Stability AI创始人EMostaque在自己的上列出这样一组数字: OpenAI今年收入约100亿美元,视频游戏行业今年收入约2000亿美元。 马斯克呀马斯克,Attention is all you need(狗头)。 从英伟达那儿挖人,开搞! 而它的第一步,就选择了去英伟达挖老黄墙脚—— 今年夏天,xAI至少雇佣了两位来自英伟达的研究人员:Zeeshan Patel和Ethan He。 其中,Zeeshan Patel今年5月硕士毕业于UC伯克利,研究主要面向深度学习、生成模型和物理人工智能。 加入xAI前,他先在苹果AI/ML部门从事基础模型研究,后又加入英伟达研究院从事生成式世界模型研究。 在英伟达工 ...
金融时报:超级智能的下一个入口,谷歌、Meta、英伟达......科技巨头都在加码“世界模型”
美股IPO· 2025-09-29 16:51
行业趋势转变 - AI研发重点正从大语言模型转向"世界模型",以理解和模拟物理世界 [1][3] - 大语言模型技术进步放缓,性能飞跃开始放缓,业界认为其正触及其能力天花板 [7][8] - 这一趋势标志着AI领域竞争焦点从语言领域转向物理世界,被视为推动机器实现"超级智能"的关键一步 [3][4] 主要参与者与战略布局 - 谷歌DeepMind发布Genie 3模型,能逐帧生成视频并考虑过去的交互,通过构建模拟环境训练AI [5] - Meta开发V-JEPA模型,模仿儿童被动学习方式用原始视频内容训练,并已在机器人上进行测试 [5] - 英伟达首席执行官黄仁勋断言公司下一个主要增长阶段将来自"物理AI",正利用Omniverse平台支持向机器人领域扩张 [5] - 英伟达高管表示"世界模型"潜在市场规模可能高达100万亿美元,覆盖制造、医疗等实体领域 [1][3] 技术进展与应用前景 - "世界模型"通过学习视频和机器人数据来理解物理世界,应用前景覆盖自动驾驶、机器人和制造业等领域 [1][4] - 近期应用包括娱乐行业,初创公司World Labs开发从单张图片生成3D环境的模型,Runway推出创建游戏场景的产品 [6] - 构建"世界模型"面临巨大的数据和算力挑战,但可通过仿真环境训练,无需承担在现实世界中犯错的后果 [4][5][9] 发展挑战与时间框架 - 实现由新一代AI系统驱动、具备人类水平智能的机器可能还需要十年时间 [9] - 大语言模型被警告永远无法实现人类那样的推理和规划能力 [9] - 构建模型需要收集海量物理世界数据和算力,是一项未被攻克的重大技术挑战 [9]
AI下一轮飞跃的引爆点:“世界模型”
财联社· 2025-09-29 16:44
科创板日报 . 专注科创板和科技创新,上海报业集团主管主办,界面财联社出品。 人工智能先驱们几乎一致认为,世界模型对打造下一代人工智能正至关重要。许多人表示,该技术终将助力创造超越人类的"通用人工智 能"(AGI)。 早在去年,斯坦福大学教授、人工智能"教母"李飞飞已筹集2.3亿美元创立世界模型初创公司World Labs。英伟达首席执行官黄仁勋今年早 些时候也表示,世界模型能助力实现"物理人工智能",自主操控机器人、自动驾驶汽车等设备。 而就在上周,Meta官宣发布了一款名为代码世界模型(Code World Model)的LLM,探索如何使用世界模型改进AI代码生成性能。Meta新 成立的超级智能AI实验室将与机器人团队合作,构建一个"世界模型",模拟现实世界物理规律,为机器人提供空间感知和精细操作能力,弥 补现有机器人的不足。 在中国方面,全球知名增长咨询公司Frost & Sulllivan近期发布的《2025年中国世界模型发展白皮书》报告显示,中国世界模型领域玩家已 经超过10家。 以下文章来源于科创板日报 ,作者潇湘 优步前AI业务负责人、经常批评当前AI模式的Gary Marcus指出,无论当今 ...