空间智能 - 财报，业绩电话会，研报，新闻 - Reportify

空间智能

搜索文档

【金猿人物展】袋鼠云CEO宁海元：AI浪潮下，数据中台的生存与跃迁

搜狐财经· 2025-12-18 20:20

过去十年，数据中台经历了"全民建中台"的热潮，也走过"建用脱节"的迷茫。随着AI技术的爆发，尤其是大模型对高质量数据供给的迫切需求，数据中台的定位正在被重塑——它不只是数据的"管理者"，更要成为AI能力落地的"赋能者"。未来的数据中台，只有两条路：要么成为AI Infra的核心支撑，要么在技术迭代中被边缘化出局。这是我深耕大数据产业十年，最坚定的判断。十年前，我在阿里深耕大数据基础设施——搭平台、建数仓、做实时计算，服务电商、金融等核心业务。彼时一个判断愈发清晰：数据基础设施绝不会只服务互联网公司，终将成为所有行业的"公共基建"。正是这个判断，让我选择离开阿里云，联合创办了袋鼠云，全力投身"让大数据走进产业"的事业。这个决定在当时并不被普遍理解：从头部平台"下船"，去做一件高投入、长周期、短期看不到回报的事，风险不言而喻。但对我而言，大数据已证明技术可行，接下来必须回答：它在产业一线是否真的有价值？我想成为验证这件事的人。宁海元 "【提示】2025第八届年度金猿颁奖典礼将在上海举行，此次榜单/奖项的评选依然会进行初审、公审、终审三轮严格评定，并会在国内外渠道大规模发布传播欢迎申报。回望袋鼠云 ...

多模态数据操作系统

多模态数据操作系统

Xiaomi MiMo 大模型落地应用，小米“人车家全生态”合作伙伴大会介绍IoT平台生态新进展

搜狐网· 2025-12-18 18:06

2025年12月17日，小米"人车家全生态"合作伙伴大会在北京国家会议中心成功举办。大会期间，除了主论坛分享外，小米IoT平台还设立了三个分论坛，分别是IoT未来峰会 2026、IoT生态接入与体验创新以及IoT平台技术论坛，全面展示了面向开发者的最新能力和用户体验创新。在主论坛，小米核心系统部总经理牛坤公布了小米人车家全生态互联体验的最新进展。截至三季度，小米 IoT 平台的连接设备，首次跨越 10 亿的里程碑，达到10.4亿台。米家App月活用户突破1.1亿，小米 IoT模组的年出货量，首次突破 1 亿片。这些核心数据都标志着小米IoT平台稳居全球最重要的智能生态平台之列。生态的繁荣也吸引了更多伙伴加入，目前已与全球超过15000家企业合作，并迎来了美诺、博世西门子、LG等国际知名品牌。在创造商业价值的同时，小米积极践行社会责任，与相关部门合作，为障碍人士家庭进行智能化家居改造；同时，通过与全国350多所院校的产教融合，计划未来5年为物联网行业培养超50000名高质量人才。在大会现场，小米还介绍了智能家居未来探索方案——Xiaomi Miloco。它基于端侧部署的MiMo-VL- Mi ...

小米集团(HK:01810)

人车家全生态

MiMo-VL-Miloco-7B视觉语言大模型

人车家全生态

MiMo-VL-Miloco-7B视觉语言大模型

接入高德，千问打通“AI干活”最后一公里

华尔街见闻· 2025-12-18 17:58

在移动互联网流量红利见顶、 AI 技术狂飙的 2025 年，提前一个身位布局的阿里，出牌愈发密集。 12 月 17 日，千问接入了高德地图，从此有了认路、在现实世界干活的能力。这意味着，无论是餐馆推荐、路线规划，还是房产选址、旅行行程规划，千问都能基于实时地图数据直接回答。高德仅仅是第一步。千问 App 本体，正悄然将整个阿里的生态悉数收入囊中，成为那个 ALL IN ONE 的超级入口，实现 Manus 都没完成的愿景。眼下，长出 " 手脚 " 的千问，跳出聊天框开始输出行动。这个 C 端的超级应用，也侧面回击了 AI 泡沫论调，它正将大模型和算力，转化为实实在在的生产力价值和问题解决能力。这标志着阿里的 AI 战略，终于从技术的 " 云端 " 转向了商业的 " 地面战争 " 。此刻的阿里正用 AI 黏合起整个集团的资源富矿，由此构建起的庞大护城河，几乎无人能敌。大模型有了 " 手脚 " " 没有空间智能， AGI 就不完整。 " 今年 7 月， "AI 教母 " 李飞飞在 YC 全球创业者峰会上如是说道。这样的观点，其实早已凝结为共识，高德地图 CEO 郭宁说，任何行动，都离不开对时间和空 ...

特斯拉再一次预判潮水的方向

自动驾驶之心· 2025-12-18 17:35

以下文章来源于圆周智行，作者圆周智行圆周智行 . 具身智能产业研究与服务平台，智能出行与机器人。来源 | 圆周智行点击下方卡片，关注" 自动驾驶之心 "公众号戳我-> 领取自动驾驶近30个方向学习路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球本文只做学术分享，如有侵权，联系删文 10月25日，特斯拉AI负责人阿肖克·埃卢斯瓦米（Ashok Elluswamy）在X上发布长文，揭秘了特斯拉FSD的技术方法论。他重点解释了为什么特斯拉要选择端到端神经网络模型，以及在实践中遇到的问题和解决方案。 2023年6月端到端以后，特斯拉再没有公布过新的技术方向。而在特斯拉闭麦两年后，国内自动驾驶公司又先后在VLA，世界模型上争论不休。这一次，特斯拉再一次通过一篇论文回到舞台中央。在国内争论不断地端到端、VLA和世界模型，特斯拉又是如何理解的。接下来，在这篇文章里，我们会提到多个反共识。特斯拉在长文中解释了为什么要选择端到端神经网络。日常驾驶里，随时随地都存在"电车难题、二阶效应（如果A，那么B）"等长尾问题，规则写不出来，很多场景也无法提前预判。只能通过AI的方式来解决。关于这一 ...

特斯拉(US:TSLA)

端到端神经网络模型

强化学习模型

端到端神经网络模型

强化学习模型

大模型的进化方向：Words to Worlds | 对话商汤林达华

量子位· 2025-12-17 17:07

金磊发自凹非寺量子位 | 公众号 QbitAI 李飞飞团队最新的空间智能模型 Cambrian-S ，首次被一个国产开源AI超越了。从这张展示空间感知能力的雷达图中，一个名为 SenseNova-SI 的模型，它在多个维度上的能力评分均已将Cambrian-S给包围。而且从具体的数据来看，不论是开源或闭源，不论是2B或8B大小，SenseNova-SI在各大空间智能基准测试中都拿下了SOTA的成绩： | Model | vsı | MMSI | MindCube-Tiny | ViewSpatial | SITE | | --- | --- | --- | --- | --- | --- | | Open-source Models (~2B) | | | | | | | InternVL3-2B | 32.9 | 26.5 | 37.5 | 32.5 | 30.0 | | Qwen3-VL-2B-Instruct | 50.3 | 28.9 | 34.5 | 36.9 | 35.6 | | MindCube-3B-RawQA-SFT | 17.2 | 1.7 | 51.7 | 24.1 | 6. ...

商汤(HK:00020)

原生多模态

原生多模态

数码家电行业周度市场观察-20251217

艾瑞咨询· 2025-12-17 16:38

行业投资评级 * 报告未明确给出统一的行业投资评级，但通过对多个细分领域的分析，整体透露出对AI技术驱动下的数码家电行业智能化、场景化转型持积极观察态度 [1][3][4][6][9][10][12][13][14][16][17][19][20][21] 报告核心观点 * **AI技术成为核心驱动力**：生成式AI、大模型等技术正全面渗透并重塑数码家电行业，从产品功能、生产供应链到消费决策和商业模式均发生深刻变革 [1][2][3][4][6][9][10][12][13][14][16][17][20][21] * **发展重心从技术突破转向场景落地**：AI竞争从早期的拼模型参数进入“拼世界理解”和“拼场景应用”的新阶段，商业化落地能力和明确的垂直场景成为资本关注焦点 [4][6][7][10][13][14][17][18][22] * **“人车家全生态”与空间智能成为新趋势**：通过5G、AIoT等技术融合，实现人、车、家庭场景的智能互联，构建无缝体验的智慧生态系统，是巨头竞逐的新赛道 [3][4] * **传统家电市场分化，高端化与模式创新成出路**：白电与黑电市场表现分化，行业整体从增量市场转向存量市场，竞争焦点从“量”转向“质”，高端化、智能化、健康化以及内容运营等模式创新成为关键 [7][9] * **新兴智能终端在探索中前行**：AI手机、AI PC已形成规模，而人形机器人、智能眼镜等下一代终端处于技术验证与商业化探索期，面临技术、成本、生态等多重挑战，但市场潜力巨大 [4][6][7][10][16][18][19][20] 行业趋势总结 * **教育行业AI应用**：生成式AI推动教育行业变革，粉笔等公考培训企业推出AI老师等产品，通过提供个性化、高性价比服务提升学习效率并带动销量，但尚未显著改善整体业绩 [1] * **新零售AI重构**：AI助力新零售从“供给驱动”转向“需求拉动”，通过实时需求感知、柔性采购和个性化体验优化库存与客户关系管理，其深层意义在于构建可持续的客户关系 [2] * **“人车家”生态互联**：美的、比亚迪、小米、华为等企业竞相布局，通过5G、AI和物联网技术实现人、车、家场景的智能互联，旨在提升生活便利性并开辟新商业模式 [3] * **AI视频创作平权**：AI视频时长和叙事能力取得突破，可生成5分钟至半小时的完整作品，播放量破百万，技术重构了传统影视线性工作流，降低了创作门槛，推动中尾部内容生态繁荣 [3] * **AI终端生态发展**：2025年AI手机出货量达2.2亿台，智能穿戴月活1.59亿，家居App用户3.83亿，L2级辅助驾驶普及率69.4%，具身智能领域融资409起，空间智能成为新趋势 [4] * **人形机器人产业化**：中国人形机器人市场规模2024年达27.6亿元，预计2030年或突破千亿，优必选、宇树科技等企业已获千台级订单，主要驱动力包括填补劳动力缺口和实现“具身智能” [4][6] * **AI创业进入新阶段**：在2025年世界互联网大会上，“杭州六小龙”等企业展示中国AI向智能制造（具身智能、脑机接口等）的转型，标志AI发展进入“拼世界理解”和场景落地的新阶段 [6][7] * **企业战略模式变革**：AI时代要求企业从传统的五年战略规划转向“战略敏捷性”，采用“三年滚动规划+季度敏捷调整”的动态模式，结合AI数据分析以快速应对市场变化 [6] * **传统家电市场表现**：2025年前三季度空调销量6583万台，但三季度均价下跌15.7%，冰箱销量下滑1.4%，洗衣机9月销量同比下降16.6%，彩电三季度销量下降12.1%，全球电视出货量首度跌破5000万台，开机率降至30.2% [7] * **咖啡机市场逆势增长**：在“双11”期间，家用咖啡机销售额同比激增，呈现量价齐升，消费升级推动产品结构高端化，消费者从“喝咖啡”转向“玩咖啡” [9] * **“双11”家电AI渗透**：2025年“双11”全网销售额16950亿元，家电以2668亿元位居品类榜首，苏宁易购智能家电占比超55%，COLMO和海尔智家AI产品销售额分别增长40%和占比30%，超四成用户借助AI工具比价选品 [9] * **AI领域资本动向**：2025年前三季度AI领域一级市场融资达548起，同比增长44.59%，资金集中流向AI通用应用、行业应用和基础技术，AIGC赛道降温，资本更青睐医疗、物流等能落地的领域 [10] * **AI医疗进阶**：2025年AI医疗行业规模预计突破千亿元，AI在医疗影像领域覆盖率超80%，AI制药可缩短研发周期40%，行业进入政策与市场双轮驱动的实质发展期 [10] 头部品牌动态总结 * **Soul赴港IPO**：AI社交平台Soul于11月27日向港交所递交上市申请，2024年盈利3.37亿元，毛利率83.7%，AI情绪价值服务贡献超九成收入，ARPPU达104.4元，2025年前八个月DAU约1100万 [12] * **阿里AI产品矩阵**：阿里推出面向C端的AI助手“千问”和“灵光”，与原有的“夸克”构成产品矩阵，试图通过差异化功能和生态协同覆盖用户需求 [12] * **宇树科技完成上市辅导**：宇树科技于2025年11月完成上市辅导，公司估值达120亿元，以低成本高性能技术路线为核心，推出人形机器人及UnifoLM大模型 [13] * **海尔机器人达成合作**：海尔机器人与INDEMIND达成战略合作，结合海尔智家的场景数据与供应链优势，共同推进家用具身机器人的研发与场景开发 [14] * **Rokid智能眼镜破圈**：Rokid Glasses销量突破4万台，日均使用时长近8小时，与BOLON联合推出售价2199元的AI智能眼镜，在B端拓展交通、康养等场景应用 [16] * **Zoom财报关注AI**：Zoom财报预计调整后每股收益1.44美元，营收12.1亿美元，其AI助手被视为增长关键动力，AI工具可辅助会议记录与总结 [16] * **快手AI商业化加速**：快手第三季度总营收356亿元，同比增长14.2%，经营利润53亿元，同比增长69.9%，可灵AI用户突破4500万，三季度营收超3亿元，AI技术为线上营销收入带来4-5%的增量 [17] * **黑芝麻智能发布机器人计算平台**：黑芝麻智能发布面向全脑智能的多维具身智能计算平台SesameX，将智能汽车领域的车规级芯片技术迁移至机器人赛道，以解决可靠性、算力和量产瓶颈 [17] * **AI眼镜投资案例**：某知名投资人投资了采用DigiWindow技术的Halliday Glasses，该技术通过微型投影仪直投眼球，以解决传统AR眼镜的彩虹纹、重量和续航问题 [19] * **小鹏汽车激进布局机器人**：小鹏汽车CEO何小鹏预测，到2030年小鹏机器人年销量或突破100万台，并认为机器人市场潜力远超汽车 [19] * **苹果CEO接班人选**：2026年苹果CEO蒂姆·库克可能卸任，硬件工程负责人约翰·特努斯成为接班热门，预示苹果可能押注“设备端AI”战略，强调硬件与芯片优势 [20] * **百度发布自研AI芯片**：百度发布昆仑芯M100和M300两款自研AI芯片及天池超节点方案，旨在提升算力效率与规模，以应对大模型时代的算力需求并优化AI产业价值结构 [20]

数字科技产业观察 | 双周要闻（2025.12.02—12.16）

每日经济新闻· 2025-12-16 18:45

01 部委动态（1）工信部修订印发《产业技术基础公共服务平台管理办法》为加快推进新型工业化，筑牢产业技术基础根基，工业和信息化部近日印发新修订的《产业技术基础公共服务平台管理办法》，包括总则、申报、审核发布、运行、动态管理、附则等6章22项条款，自2025 年12月5日起施行。《管理办法》提出，服务平台申报单位应当明确申报的服务行业领域及服务范围。服务重点行业和领域包括装备、石化化工、钢铁、有色、建材、轻工、纺织、食品、医药、新一代信息技术、生物技术、新能源、新材料、新能源汽车、人工智能、元宇宙、脑机接口等；服务范围主要包括计量检测、标准验证与检测、质量可靠性试验检测、认证认可、产业信息、知识产权、技术成果转化等。（来源：工业和信息化部科技司） 12月2日，江苏省元宇宙标准化技术委员会在南京成立。江苏省元宇宙标准化技术委员会的成立，填补了省内元宇宙领域标准化体系的空白，将重点承担元宇宙标准化路线规划、发展策略制定及前沿标准前期研究等顶层设计工作，为产业高质量发展划定"标准线"、明确"施工图"。（来源：新华日报·交汇点）（2）国家发展改革委国家数据局教育部科技部中共中央组织部关于加 ...

博瑞传播(SH:600880)

产品碳足迹

产品碳足迹

全球最大规模！如视开源室内三维数据集Realsee3D

36氪· 2025-12-16 16:50

此前，如视发布空间深度推测大模型 Argus1.0。作为首个支持全景图输入的空间深度推测大模型，Argus1.0依托如视所积累的千万级三维空间数据库训练而成。而此次开放的 Realsee3D三维数据集，正是从这一海量数据库中精选出的高质量样本。数据集优势 Realsee3D 是一个大规模多视角RGB-D数据集，旨在推动室内三维感知、重建与场景理解领域的研究。该数据集具有以下优势特征： 2025年12月16日，如视宣布，面向学术研究及非商业用途正式开放10000套室内三维数据集 Realsee3D——这或是全球目前最大规模的空间三维数据集，旨在为空间智能领域的研究者、开发者提供高质量数据基础，加速整个行业的技术迭代与应用落地。 Realsee3D 场景多样为了确保模型在复杂现实环境中的鲁棒性，我们采用了"真实数据+程序化生成"的双引擎策略：数据类型 - 10,000个独特的室内三维场景 - 95,962个细分房间单元 - 299,073组视点/RGB-D 图像对 - 几何层：提供高精度 CAD 图纸与平面图。 - 语义层：包含 2D语义分割与3D检测标签。 - 采集数据：1,000 个真实场景（捕捉现 ...

3D Data Technology

3D Data Technology

AI发展史上重要的转折，源于这位华裔女生

吴晓波频道· 2025-12-15 08:21

立即点击 ▲ 观看视频该模型的突破性在于，它能够通过一张图片或一句话来生成具有交互性、可编辑、可扩图的虚拟3D场景。用户不仅可以通过拖动鼠标探索虚拟世界，还能自由改变物体颜色、光影、动画效果等。这款模型的发布，被很多专业人士视为是人类迈向空间智能的第一步。那是人工智能领域发展过程中的一个转折性时刻。 2009年，一位年仅33岁的女性，在网络上发布了一个名为ImageNe t 的数据库。这个数据库规模庞大，涵盖了22000个类别、1400多万张经过精心筛选和标注的图片。其核心作用在于对训练和测试AI算法在对物体进行识别时的有效性与准确度。正是依托这一数据库，彼时仍在学术领域默默耕耘的杰弗里·辛顿验证了AI神经网络算法的有效性，由此掀起了人工智能领域的深度学习革命。可以说，这位33岁女性所创建的ImageNet数据库，让全球见证了深度学习的无限潜力。她，正是如今被誉为"AI教母"的李飞飞。李飞飞1976年出生于北京，16岁时随父母移民美国。凭借不懈努力，她逐步成长为顶尖的AI科学家。2007年，李飞飞加入普林斯顿大学担任助理教授；两年后，她带领团队发布ImageNet，同年成为斯坦福大学终身 ...

ImageNet数据库

可生成虚拟3D场景的模型

ImageNet数据库

可生成虚拟3D场景的模型

东方理工金鑫：如何找到自动驾驶与机器人统一的「空间语言」丨GAIR 2025

雷峰网· 2025-12-14 14:27

文章核心观点 - 文章介绍了宁波东方理工大学金鑫教授团队在空间智能与世界模型领域的研究进展，其核心思路是采用“混合”路径构建世界模型，即结合明确的物理规则知识与数据驱动方法，并率先应用于工业制造等产业场景以实现技术验证与落地 [3][4][5] 空间智能（世界模型）的起源与概念 - 空间智能概念在SLAM技术时期已被讨论，2024年由斯坦福大学李飞飞教授拓展至与物理世界的交互、感知和理解 [8] - 世界模型技术近期取得显著进步，例如李飞飞团队发布的Marble 3D世界模型和谷歌DeepMind发布的Genie 3，后者在写实性、一致性及物理正确性上达到更高水平 [9] - 世界模型有望成为继数据增强、数据合成之后，为人工智能训练提供高效路径的新选择 [9] 空间智能的技术框架 - 团队将空间智能或世界模型划分为三个部分：空间感知（基础3D建模与物理定律嵌入）、空间交互（支持智能体与环境及多智能体间互动）、空间的理解泛化与生成（基于充分理解衍生生成能力） [10][12][13][14] - 整体工作细分为两个方向：空间构建（搭建仿真环境）与智能体训练（在环境中训练AI），两者可形成不断优化迭代的闭环 [15][18] 核心研究成果：自动驾驶场景生成 - **UniScene**：团队提出的专注于驾驶场景生成的工作，已被CVPR接收，后续有V2等版本 [20] - **生成动机**：由于合规、隐私及车队规模限制，真实数据难以覆盖足够多的“corner case”危险场景，需通过生成式方法合成逼真有价值的场景数据 [22] - **技术路径**：采用以Occupancy（占据栅格）为中心的生成方案，因其蕴含丰富语义与必要几何信息，是连接场景理解与建模的有效“桥梁” [27][32] - **生成流程**：以简单的鸟瞰图布局为输入，首先生成语义Occupancy，再以此为中心分别衍生生成激光雷达点云和多视角视频，是一个两阶段的解耦过程 [34] - **进展与产业合作**：UniScene V2版本在NuPlan数据集上扩展了数据量，新增深度图和语义分割模态，并能根据车辆传感器位置生成对应视角数据 [37][40]；该版本在GitHub上线不到一周获得数百个star（后超过2000个） [41]；正与理想汽车合作，测试生成器对带有镜头畸变数据的泛化能力，以低成本支持其自动驾驶算法迭代 [41] 核心研究成果：规划与机器人场景生成 - **OmniNWM**：团队引入闭环的“规划-生成”串联机制，将规划的轨迹作为条件输入，预测执行该轨迹后未来场景的变化，可称为“万能的驾驶导航世界模型” [42][44] - **模型能力**：需同时预测全景RGB视频、语义分割、深度图、3D结构及未来规划轨迹，重点在于状态、动作及闭环奖励三个维度的扩展 [45][50] - **技术迁移**：将相同方法论迁移至机器人领域，应用于具身智能场景进行数据合成，能以Occupancy为桥梁生成机器人视频，处理软体、绳体等物体的数据合成，并与主流仿真器兼容实现批量并行生成 [45] 核心研究成果：机器人数据与训练模型 - **InterVLA数据集**：为补充机器人第一人称视角数据缺失，团队构建了包含约3.9千个序列的新基准数据集，包含第一人称视角视频、第三人称视角视频及动作捕捉数据 [46][49][57] - **DreamVLA模型**：针对“抓放”等任务，提出将大语言模型中的“思维链”思想引入视觉-语言-动作模型，让模型在输出最终动作前，先输出“世界嵌入”或“世界知识”等中间产物，形成多模态推理链条 [63][71][73] - **模型效果**：相比于Open-VLA等方案，DreamVLA泛化性更好，并能实现更快、更高效的收敛 [75] - **方位基础模型**：通过模块化方案赋予机器人“方位感知”能力，使其能像人一样从合适方位抓取物体（如抓瓶身而非瓶盖） [76][80] - **解耦世界模型**：将“解耦学习”嵌入世界模型，提取对任务至关重要的环境关键因子，排除非任务相关干扰，从而提升训练效率与模型鲁棒性 [81][83] 研究背景与团队发展 - 研究重点自2024年初开始聚焦世界模型与空间智能，标志着从处理2D视觉信号转向理解3D、4D等高维信号，旨在让AI获得对物理空间的认知能力 [85] - 团队在2025年NeurIPS会议上有两篇合作论文受到广泛关注 [85] - 团队学生培养取得初步成效，2024年有一位博士获得国家奖学金，2025年增加至两位 [91] - 招生最看重学生的自驱力与对科研的热情，并通过实习期进行双向考核 [91][92] 产业应用与场景选择 - 基于宁波强大的制造业背景（拥有104家国家级制造业单项冠军企业，数量全国第一），团队优先选择工业场景构建“工厂世界模型”，与奥克斯空调、均胜电子、吉利汽车等当地龙头企业紧密合作 [93] - 与专注于探索底层原理的知名团队（如LeCun团队、李飞飞团队）不同，该团队采取“两条腿走路”策略，既探索前沿技术，又聚焦有特色的应用场景 [94] 世界模型的构建方法与挑战 - **构建数据**：分为静态数据（物体级静态资产）和动态数据（RGB视频、激光点云、动作捕捉数据），两者均为必需 [95][96] - **构建步骤**：采用自上而下的技术路径，先定义物理规则，再叠加动态数据，最后以静态数据打底，涉及数据采集、处理、合成与模型训练 [97] - **兴起原因**：AIGC技术使得通过生成方式快速创建物理正确、视觉真实的场景成为可能，在效率与成本上相比传统手工建模有量级提升 [97] - **最大挑战**：成本最高的部分是前期静态资产和动态场景数据的创建与采集；技术难度最大的在于将软体、弹性体、流体等第一性原理和物理规则有效嵌入模型中 [98] 技术路径讨论与行业观点 - **关于Sora等视频生成模型**：认为其是否为世界模型取决于应用场景，在游戏、娱乐等内容生成领域有价值，但在需要精细空间感知与动作策略的机器人或自动驾驶领域存在局限性 [99] - **载体差异**：当前趋势是采用数据驱动的端到端模式（如VLA模型），倾向于为不同形态的智能体（汽车、机械臂）构建统一的世界模型服务，避免重复造轮子 [99][100] - **技术路径选择**：团队倾向于“混合”路径，结合端到端黑盒方法的能力与显性、可解释的组件 [101] - **学术界价值**：面对企业界强大的大模型路径，不必焦虑于快速商业变现，技术持续发展总需要新的突破，许多奠基性技术最初源于高校 [102] - **物理规律掌握**：关键在于构建高度物理真实的世界模型本身，若能真实还原材质物理属性，仿真环境中训练出的智能体行为结果会与真实世界一致 [102][103] - **实现方法**：采用知识库与数据库结合的混合路径，对明确规则（如碰撞检测、摩擦力）进行知识嵌入，对复杂现象（如流体运动）则采用数据驱动方法 [104][105]