Workflow
世界模型
icon
搜索文档
从世界模型到VLA再到强化,具身大小脑算法原来是这样的!
具身智能之心· 2025-10-26 12:02
具身智能技术框架 - 行业将具身智能技术框架类比为人类的大脑和小脑,大脑负责思考感知(语义理解和任务规划),小脑负责执行(高精度的运动执行)[3] - 细分领域包含仿真、VLA、Diffusion Policy、VLN、世界模型、强化学习等多个子模块[5] - VLA和世界模型目前是自动驾驶和具身智能领域的两大技术路线[5] 核心技术演进路径 - 第一阶段技术研究聚焦于抓取位姿检测,通过点云或图像预测末端执行器姿态,但策略多为单步决策,缺乏对任务上下文和动作序列的建模[7] - 第二阶段进入行为克隆阶段,机器人借助专家演示数据学习端到端映射,但暴露出泛化能力弱、误差累积等问题[7] - 第三阶段以2023年兴起的Diffusion Policy为代表,通过扩散模型生成整个动作轨迹,提升策略稳定性与泛化能力;2024年进入VLA模型阶段,融合视觉、语言与动作生成,支持零样本或小样本快速泛化[8] - 第四阶段自2025年以来,行业探索VLA与强化学习、世界模型、触觉感知等模块的融合,以弥补现有模型在反馈、预测和多模态感知方面的局限[9] 当前技术热点与方向 - VLA目前主要研究热点为端到端和分层两种方案,并分别基于大模型和Diffusion技术拓展,VLA+RL方案正成为学者探索方向[5] - Diffusion Policy作为动作模块,负责学习具体动作和执行,主要方向包括状态扩散、动作空间扩散、三维空间扩散等[6] - 仿真技术关注sim2real和real2sim2real,以解决真机泛化差的问题,该方案已获多家具身公司认可[6] - VLN更关注目标导航,与移动操作相关联,map-free方案利于任务泛化[6] - VLA与强化学习结合提升机器人在长时任务中的试错与自我改进能力;与世界模型结合引入环境动态预测,使机器人具备“想象未来”的能力;与触觉信息结合拓展多模态融合的感知边界[10] 行业应用与市场前景 - 技术发展推动人形机器人、机械臂、四足机器人等产品落地,服务于工业、家居、餐饮、医疗康复等领域[10] - 相关产品和融资络绎不绝,岗位呈现爆发式增长,吸引大量人员转入具身智能领域[10] - 随着产业界重视,行业从“论文”走向“部署”,对工程与系统能力需求激增[14]
Tesla终于分享点东西了,世界模型和闭环评测都强的可怕......
自动驾驶之心· 2025-10-26 00:03
特斯拉FSD技术架构 - 采用单一大型模型处理自动驾驶任务,利用海量数据和长上下文输入[5] - 神经网络计算时间为固定值,不受环境影响,系统运行频率高达36Hz,直接输出控制动作[5] - 工程能力强大,实现了从感知到动作的端到端输出[5] 端到端自动驾驶的驱动因素 - 人类驾驶行为难以用单一评价函数精确描述,规则优化方法存在局限性[8] - 传统模块化架构中感知、预测与规划间的接口定义存在信息损失问题[8] - 端到端架构具备更好的可扩展性,更有利于解决长尾场景问题[8] - 神经网络固定计算时间相比传统规划控制求解器能有效降低系统延迟[8] - 遵循Sutton的"苦涩教训"哲学,强调依赖算力与数据而非过多人工预设[8] 端到端技术面临的核心挑战 - 存在维度灾难问题,即高维输入到低维监督信号导致学习信号不充分[20][21] - 模型可解释性与安全保障是重大挑战,需确保网络真正理解驾驶而非仅拟合捷径[21][23] - 系统评估是三大挑战中最困难的部分,无法直接用损失函数衡量实际表现[36][39] 特斯拉的解决方案与技术亮点 - 通过丰富数据产生有效梯度破解维度灾难,利用各种触发机制和小型神经网络挖掘数据[23][25] - 采用思维链推理过程,融合3D高斯重建、语言理解等多模态信息进行决策[27][33] - 3D高斯重建技术具有速度快、支持动态物体、无需点云初始化、新视角合成效果好等优势[30][31] - 构建基于世界模型的模拟器,通过动作生成后续视频,支持大规模强化学习训练[41][44] - 评估体系强调闭环测试的重要性,需覆盖驾驶行为的多模态性,并平衡评估数据集[39] 技术通用性与应用拓展 - 整套FSD技术架构完全适用于人形机器人领域[46] - 可通过视频数据训练世界模型,并利用仿真环境进行强化学习训练,实现技术闭环[46]
VLA/世界模型/WA/端到端是宣传分歧, 不是技术路线分歧
理想TOP2· 2025-10-25 13:21
自动驾驶技术路线定义与共识 - VLA/世界模型/端到端等技术路线缺乏公认的排他性定义,其共同点是要求模型具备生成与真实世界一致的道路视频数据的能力,并以视觉信息为输入最终控制车辆行动 [1][2] - 技术路线之间的核心区别在于语言是否参与、参与深度以及架构形式,例如语言相关的token是当前LLM的text token还是潜在的photon token [2] - 不同企业宣传的VLA细节可能存在巨大差异,未来VLA与VLA之间的区别可能大于VLA与传统方法的区别 [2][3] 头部车企技术路线共性分析 - 头部智驾车企在自动驾驶探索上共同性大于差异性,内核是宣传分歧而非技术路线分歧 [1] - 理想汽车与特斯拉均认为扩散模型有利于自动驾驶,3D高斯泼溅生成世界模型优于神经辐射场,且世界模型用于评估很重要 [12] - 两家公司均认为将人类价值观编入代码极其困难,并且在输出层面,理想汽车认为输出轨迹优于直接输出油门方向盘电信号 [5][12] 语言在自动驾驶中的作用与潜力 - 语言在自动驾驶中的作用主要体现在长推理、用户交互价值观对齐以及理解世界 [1] - 对“预测下一个token”的理解分歧影响对LLM潜力的判断,越认为其不只是概率分布的人越认可语言可以理解世界 [1][12] - OpenAI联合创始人Ilya Sutskever认为,足够好的下一个token预测意味着模型理解了token产生的潜在现实,这使其可能推断出超越已有数据范围的高智慧行为 [13][15][17] 端到端架构的具体实现探讨 - 端到端缺乏公认的排他性定义,传感器信号进、输出轨迹亦可称为端到端,在此定义下理想汽车的VLA架构符合端到端特征 [5][7] - 有观点认为特斯拉端到端模型实际输出的是轨迹而非油门方向盘电信号,依据包括跨车型适配的冗余设计问题及特斯拉高管在公开场合的模糊回应 [5][6] - 特斯拉技术负责人Ashok Elluswamy在ICCV 2025上表示,端到端的核心前提是梯度必须端到端流动,输出形式是经验性问题,这进一步支持了端到端定义的宽泛性 [6] 技术演进的长远视角 - 马斯克提出长远来看AI模型输入和输出99%以上将是光子,这回应了关于DeepSeek-OCR等工作中降低计算量的潜力 [10] - VLA定义的最大公约数是输入为视觉或多模态,语言以某种形式参与,最终输出指向广义机器人动作的模型 [11] - 长远来看,可能不再使用text token来理解语言,而是采用更底层的表征方式 [10][11]
CVPR 2026倒计时Day21,冲这个方向简直降维打击!
自动驾驶之心· 2025-10-25 00:03
文章核心观点 - 文章预测CVPR2026会议投稿量已超2000篇,主旋律可能是“世界模型”,并以此作为论文辅导服务的核心方向 [1] - 公司提供论文辅导服务,旨在通过学术界/工业界大牛指导,帮助学员在关键节点发力,掌握技术脉络并产出论文,以冲击顶会和中稿 [2] - 公司拥有国内顶尖学术资源,300+专职老师来自全球QS前100高校,近3年辅导学员成果显著,涵盖CVPR、ICRA等顶会 [3] 公司服务与资源 - 公司作为国内最大AI类技术自媒体平台,拥有自动驾驶之心/具身智能之心/3D视觉之心等IP,深耕自动驾驶、具身智能、机器人方向 [3] - 公司拥有300+专职于自动驾驶/具身智能方向的老师,来自全球QS排名前100高校,发表过多篇顶会/子刊/A会/B会论文 [3] - 公司提供个性化论文指导服务,包括导师实时互动、录播无限次回看、免费课后答疑、24h无时差上课,覆盖选题至投稿一站式科研服务 [11] 服务流程与成果 - 公司辅导流程包括掌握技术脉络、复现模型、产出1篇论文初稿、投稿指导,助力学员冲击高区/顶会 [2] - 公司展示学员成果案例,如程同学(研二)4个月中稿CVPR顶会,张同学(博五)3个月中稿emnlp顶会 [4] - 公司服务帮助解决导师放养、科研体系不清晰等问题,协助学员建立科研思维、掌握算法、提升实践能力,并将baseline深化为论文 [5] 目标学员与方向 - 公司主要辅导方向包括三维重建、relighting、NVS、SLAM、点云处理、VLA、机器人导航、计算机视觉等 [8] - 目标学员为有科研需求、从事人工智能领域工作想升职加薪、考研申博留学提升简历含金量的人群 [9][10] - 学员要求自带简历,有一定pytorch基础,公司通过精准匹配系统从300+导师中筛出3-5位最契合人选 [8][15] 服务优势与附加价值 - 公司提供基础课程供零基础学员自主学习,承诺踏实地跟导师学习6个月能出一篇小论文 [14] - 优秀学员可获清北/MIT等名校推荐信,推荐到实验室实习,表现突出者直接内推阿里达摩院、华为诺亚方舟等企业研发岗 [16] - 公司承诺预收定金后可和名师meeting,不满意可免费更换老师/退款,收费根据分区目标和学员情况详细报价 [16]
自动驾驶之心合伙人招募!
自动驾驶之心· 2025-10-25 00:03
业务拓展计划 - 公司计划在2024年向国内外招募10名业务合伙人 [2] - 合伙人将负责自动驾驶相关课程研发、论文辅导业务开发及硬件研发 [2] 重点技术方向 - 公司关注的前沿技术方向包括大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶 [3] - 其他重点方向涵盖具身交互、联合预测、SLAM、3D目标检测、世界模型 [3] - 同时关注闭环仿真3DGS、大模型部署与量化感知推理等关键技术 [3] 人才招聘要求 - 合伙人岗位要求应聘者毕业于QS200以内高校并拥有硕士及以上学历 [4] - 优先考虑在顶级学术会议上有研究成果的候选人 [4] 合伙人待遇与激励 - 提供自动驾驶领域的资源共享,包括求职、读博及出国留学推荐 [5] - 合伙人将获得丰厚的现金激励 [5] - 提供创业项目合作与推荐机会 [5]
机器人何时能迎来自己的“DeepSeek时刻”?
虎嗅APP· 2025-10-24 17:53
文章核心观点 - 文章通过对话北京人形机器人创新中心CTO唐剑,探讨了具身智能领域的发展现状、技术挑战及未来方向,核心聚焦于“世界模型”作为实现机器人智能涌现的关键技术路径 [5][6][15] - 世界模型被视为具身智能的“DeepSeek时刻”,其通过引入奖励机制和双模驱动架构,在有限算力下实现性能超越,并坚持开源以推动行业演进 [16][20][27] - 公司认为世界模型是提升机器人泛化能力、实现其在开放世界中可靠行动的必选项,而非可选技术路线 [21][24][31] 从AI控制到具身智能的起点 - 唐剑的研究方向从传统的基于数学建模的系统控制转向“经验驱动”的控制方式,后者通过历史数据和经验学习控制规律,适用于复杂系统 [9] - 经验驱动控制在自动驾驶领域的应用体现为“端到端控制”,如特斯拉FSD 12.0版本,将感知、规划、控制三模块合并,提升复杂场景下的泛化能力 [11] - 具身智能被视为比自动驾驶更高维度的挑战,因其自由度更高、环境更开放、任务类型更繁杂,对理解能力和泛化能力要求极高 [12] 世界模型与具身智能的“DeepSeek时刻” - 公司将世界模型类比为具身智能的“DeepSeek时刻”,基于三点相似性:在有限资源下超越SOTA性能、训练范式有突破(如奖励机制)、坚持开源 [16] - 公司世界模型采用“双模驱动”结构,世界模型与VLM相互促进,VLM为世界模型提供奖励反馈,确保生成内容符合物理规律和因果一致性 [16][17] - 公司世界模型同样引入GRPO机制进行微调,并计划开源新的VLM模型Pelican,形成更紧密的认知与物理交互闭环 [19][20] 世界模型的本质与行业分歧 - 世界模型的核心是帮助机器人理解世界,其不仅是“像人”,更要在认知上接近人,能理解、预判并在物理世界中行动 [21] - 行业对世界模型尚无统一定义,公司区分了面向娱乐的视频生成模型和面向机器人操作的模型,后者强调严格的物理一致性与时空一致性 [24][26][27] - 世界模型被视为具身智能的必选项,而非类似自动驾驶激光雷达的技术路线选择分歧,因为它是实现机器人开放世界行动可靠性的基础 [20][21] 世界模型的三种用途与进化方向 - 世界模型主要用途包括:与机器人大脑形成闭环互相促进、直接生成机器人训练所需的轨迹数据、作为机器人操作模型的一部分具备物理理解与控制能力 [25] - 公司当前世界模型基于视频生成的DiT架构,但未来可能采用全新架构,以更好地注入物理约束,如牛顿定律、能量守恒等 [27][28] - 世界模型的应用处于早期阶段,其核心目标是提高机器人的泛化能力,以支持从工业场景向更复杂的商业和家庭生活场景拓展 [28][29][31] 数据、算力与智能涌现的挑战 - 具身智能尚未出现类似ChatGPT的“突破时刻”,因其数据主要为轨迹数据,数据量级、采集难度和成本远高于语言模型,进化更慢 [14] - 目前无人能准确给出具身智能的“Scaling Law”,即智能能力随数据、算力、算法增长的规律,其是否存在及曲线形态均为未知 [20] - 公司使用“百卡级”算力训练出2B、7B、14B规模的世界模型,并在多项主要指标上超过SOTA模型,如英伟达的Cosmos Predict 2 [16]
美国AI,踏入“旋转门”
虎嗅· 2025-10-23 17:56
Sora2产品表现与市场影响 - Sora2在多重高门槛限制下仍实现爆发式增长,上线不到五天即登顶美国App Store应用榜榜首[2] - 产品技术实现显著突破,具备原生音频、音画同步和一定故事性,被专业人士视为目前最接近"世界模型"的应用[3][26] - 用户创作内容呈现高度多样性和病毒式传播特征,涵盖动物拟人、经典IP混搭等创新形式,但引发大量版权纠纷[5][6][10] OpenAI财务状况与融资活动 - 公司面临严重盈利危机,2025年上半年营收仅43亿美元,但研发支出高达67亿美元,现金流为负[15][48] - 估值达到5000亿美元,已从特斯拉、微软、软银等企业募集不少于500亿美元资金,并获得英伟达最高1000亿美元融资计划[15][28][29] - 投入预算高达4500亿美元,资本消耗速度远超收入增长,存在明显的估值泡沫风险[49][50] 美国AI产业格局与资本循环 - 产业呈现两极分化格局,美国专注底层大模型研发,但面临商业变现难题,投入上不封顶[19][20][21] - 形成"旋转门"式资本循环:头部企业通过爆款应用吸引投资→向上游算力供应商采购→资金最终汇集至芯片厂商再回流至初创企业[37][40][43][47] - 2024年美国风险投资总额的71%集中于AI领域,较2020年的14%大幅提升,资本集中度极高[55] 巨头战略投入与行业影响 - "新美股七姐妹"全面重注AI,微软、Meta、亚马逊、谷歌四家2024年在AI基础设施上预计投入3200亿美元[73][74] - 大型项目频出,如OpenAI与微软联手的"星际之门"项目计划投入5000亿美元,相当于美国铁路网翻新8次的预算[66][68] - 资本过度集中导致行业多样性风险,创新型小企业发展受阻,高盛CEO警告资本可能无法获得预期回报[57][58][59] 技术应用前景与产业价值 - AI在生物科技领域展现革命性潜力,药物研发可缩短10年试错周期,基因分析能发现抗衰靶点[91][92] - 内容创作领域形成对普通从业者的替代压力,如广告视觉领域的低端P图师无法与AI竞争[89][90] - 技术终极意义在于突破人类认知和能力边界,需深度融入产业提升生产力而非单纯追求参数竞赛[95][97][98]
预见未来,《Al Car的初步畅想与探索实践》白皮书发布
中国汽车报网· 2025-10-23 16:15
白皮书核心发布 - 中国汽车工程学会与吉利汽车研究院在SAECCE 2025上联合发布行业首份以AI Car为主题的白皮书《Al Car的初步畅想与探索实践》[1][3] AI Car的产品定义与本质 - AI技术将颠覆智能终端开发范式,推动汽车成为具身智能体(AI Car)[3] - AI Car将扮演司机与伙伴两个核心角色[3] - AI Car的本质是由驾驶、座舱、底盘、动力等多个子智能体有机融合的超级智能体[3] 十大关键技术判断 - VLA将改变自动驾驶系统设计逻辑,成为驾驶智能体基础模型[3] - 世界模型作为对真实世界的极致压缩,将成为理解预测未来的基础工具[3] - 算力优化与数据闭环是驾驶智能体实现高效自迭代的核心抓手[4] - 超拟人交互将重塑人车关系,助力座舱智能体迈向终极形态[5] - 基于端云协同、大小协同的交互功能智能分配将成为座舱应用范式[6] - 在多端互联推动下,AI OS将加速从座舱开始落地应用[6] - 智能底盘与动力将成为精准动态控制、保障行车安全的运动控制大脑[7] - AI将赋能形成智驾+底盘更大的端到端系统,重构驾乘体验[8] - 动力电池向集实时感知、自主决策、动态响应的智能电池系统转型[9] - AI赋能下的全局最优能量策略将重塑车辆全周期能量管理范式[10] 对产业与企业的影响及建议 - AI Car产品变革将改写企业生存发展逻辑,战略目标由造好车转型为运营智能体[10] - 数据成为影响企业竞争力的核心战略资产,性能成本竞赛转为生态体系间价值网络对抗[10] - 企业突围需遵循生存三角新法则:定义智能体独特人格与价值主张以焕新品牌[10] - 资源配置需深挖全流程数据价值,打造开发至体验闭环,并搭建跨职能AI大研发团队[10][11] - 博弈逻辑要求整车企业加速构建全生态资源整合能力,提升跨终端智能协同体验以强化用户粘性[11]
人工最高节省90%,AI制作游戏被批“没有灵魂”
第一财经· 2025-10-22 18:12
AI对游戏行业影响的共识 - AI已进入影响游戏行业的重要时刻,能够显著缩短游戏开发周期,将需要数年甚至十年开发的游戏更快付诸实践[3] - 业界创业团队正在探索复杂AI应用方式,开发可快速生成完整游戏的智能体工具[3] - 部分业内人士已看到AI对游戏研发效率的巨大影响,并开始展望新的游戏生产方式[3] AI提升游戏制作效率的具体表现 - 游戏开发工作量约70%~80%集中于美术资产处理,其中动画制作和模型制作是两大重点环节[5] - 腾讯VISVISE解决方案的AI自动蒙皮工具可将原本需要1天半到3天半的工作缩短至1~3小时,节省70%~90%人工[5] - 动画生成大模型可根据5~10帧关键帧自动生成60帧流畅动画,将效率提升3~5倍,替代占角色动画制作总工时60%~70%的手工补帧工作[5] - 腾讯光子工作室角色动画制作周期缩短40%,部分项目角色技能原型验证时间从2周压缩至3天[6] AI工具的应用现状与成本效益 - 腾讯AI工具已在其内部头部项目使用,并开放给至少50多家外部公司包括完美世界、库洛游戏,同时向日本、韩国头部游戏公司和欧洲公司开放试用[6] - 对于《黑神话:悟空》这类制作成本超3亿元的3D产品,AI工具可解决20%~30%的次级资源,实现千万元级别降本[7] - AI工具使用成本显著低于人力成本,游戏外包人员日薪超千元,而AI生成一张符合要求的图成本极低,开箱率普遍不超过10张[7] 不同规模团队对AI的接受度差异 - AI工具对独立游戏等极小团队和轻量级团队作用最大,使原本需要十人以上团队完成的工作可由一两人完成,体现技术平权[11] - 中小型团队正在大量使用AI工具,而3A级高品质商业项目为保障口碑和研发稳定性,尚未广泛铺开AI应用[11] - AI工具能将动作捕捉等高端技术门槛降低,使单角色面部及身体捕捉成本约50万~100万美元的3A级制作技术变得中小团队可负担[11] 行业对AI能力的争议与看法演变 - 部分行业声音认为AI无法替代创意工作,如Larian Studios发行总监指出AI无法提供优秀游戏必需的创意和远见[8] - 玩家反馈显示现有AI游戏存在程式化问题,如米哈游联合创始人发布的《星之低语》被评价为技术演示,对话公式化且乏味[10] - 盛趣游戏美术总监林蕤观点发生转变,从认为AI缺少人性表达转为认可AI在语义概括和触发联想方面的进步,认为从业者需要积极了解AI技术[10] 技术发展趋势与未来展望 - 游戏工业管线尚未被AI颠覆,当前工具主要关注提效而非完全打破原有工作流程[12] - 谷歌Genie 3等世界模型技术可快速生成游戏玩法Demo,将按月规划的汇报决策流程大幅加速[13] - 行业正探索两种路径:传统角度的自动化工具推进与从最终形态回溯的世界模型,预计三五年后3D生成世界将推动新工作流出现[14]
人工最高节省90%,AI制作游戏被批“没有灵魂”
第一财经· 2025-10-22 17:15
AI对游戏开发效率的提升 - 在美术成本超过1亿元的3D类游戏中,20%至30%的次级资源可通过AI工具解决,实现千万元级别的成本降低 [1][5] - 游戏开发工作量的70%至80%为美术资产处理,其中动画制作和模型制作是主要部分 [3] - 在动画制作的骨骼绑定环节,AI工具可将原本需要1天半到3天半的工作缩短至1到3小时,节省70%至90%的人工 [3] - 在动画关键帧制作环节,AI模型能根据5至10帧关键帧自动生成60帧流畅动画,将效率提升3至5倍 [3] - 腾讯内部项目应用AI后,角色动画制作周期缩短40%,角色技能原型验证时间从2周压缩至3天 [4] AI工具的应用现状与范围 - 腾讯的全链路AI创作解决方案VISVISE已在其内部头部项目使用,并开放给至少50家外部公司,包括完美世界、库洛游戏,同时向日韩及欧洲头部游戏公司开放试用 [4] - 3D生成工具目前尚难用于3A游戏的核心高品质资产制作,但能高效处理项目中的次级资源,如植被、山林、路边雕像等 [4] - AI工具的使用成本较低,采用订阅制,生成一张符合要求的图像成本极低,开箱率普遍不超过10张(即生成10张必有1张符合要求),其成本远低于游戏外包人员(日薪超千元)或正式员工的人力成本 [6] 行业对AI的不同看法与影响 - 部分行业声音认为AI难以替代创意工作,例如特斯拉CEO马斯克成立的xAI游戏工作室计划遭质疑,有观点认为AI无法提供优秀游戏必需的创意和远见 [6][8] - 一些已发行的AI游戏被玩家评论为更像技术演示,存在程式化、枯燥、对话公式化等问题,削弱了游戏可玩性 [8] - 另有从业者观点发生转变,认为AI在触发联想和概括语义方面进步显著,逐渐学会如何触动人心,AI带来的创作方式多样化是积极发展 [9] AI对不同规模团队的影响 - AI工具对独立游戏等极小团队以及短平快项目的轻量级团队作用最大,使原本需要十人以上团队完成的工作可由一两人完成,实现技术平权 [10] - 目前AI工具更多被中小型团队大量使用,而品质要求极高的3A商业项目为了口碑和研发稳定性,尚未广泛铺开AI工具 [10] - AI工具能降低工作门槛,例如将动作捕捉(成本约50万至100万美元)等高成本技术降至小团队可负担的水平,让不同规模团队在技术上拥有更平等的权利 [10] 技术发展与未来趋势 - 当前AI工具主要聚焦于提升效率,尚未完全颠覆原有的游戏工业管线和工作流程 [11] - 世界模型(如谷歌的Genie 3)等新技术可能改变游戏制作,例如快速生成游戏玩法的Demo,大幅缩短汇报和决策周期 [11] - 未来可能出现聚合解决方案的智能体,用户输入数值、文本等材料即可快速生成完整游戏,若结合世界模型可制作更精彩的游戏 [11] - 行业探索路径包括从传统制作流程推向更自动化,以及从世界模型等最终形态反向推导,两种路径未来可能交汇,预计3D生成世界技术还需三五年才能推动独特工作流出现 [12]