时空AI
搜索文档
京东副总裁郑宇:未来管理智慧城市,会像玩游戏一样简单丨GAIR 2025
雷峰网· 2025-12-19 18:29
文章核心观点 - 时空AI是人工智能进入物理世界、发挥巨大产业价值的基础理论和关键技术,但其发展面临数据稀缺、模型能力弱、方案闭环难三大核心挑战 [1][4] - 城市计算可作为实现具身智能的方法论和计算框架,而具身智能将成为城市计算的核心组件,未来城市有望成为一个“巨大的具身智慧体” [3][35][36] - 时空AI的发展道路漫长且艰难,需要长期攻坚关键技术和基本理论,但其应用前景光明,在智能城市建设等领域已展现出巨大价值 [22][40] 时空AI的定义与重要性 - 时空AI是基于时间和空间维度观测,以带有时空属性的数据为主要描述,通过与物理世界动态交互和循环反馈,来感知、理解、影响和掌控物理世界中物体行为和自然现象的人工智能理论、机器学习方法和数据挖掘技术 [12] - 人工智能过往的成功主要集中在虚拟世界,但要发挥巨大的产业价值,必须进入物理世界,即问题和数据都来自并反馈于物理世界,如具身智能、无人驾驶、城市应急管理等 [3][6][7] 物理世界与虚拟世界的核心差异 - **空间约束**:包括江河、湖泊、海洋、山川、道路等无法穿越的实体 [15] - **物理规律**:包括力学规律、能量守恒定律、星际运行法则等 [16] - **物种行为**:包括动物迁徙、人类活动、生物繁衍等 [17] - **运行法则**:包括城市运行管理、交通管理规则、航空运输法则等 [18] - 这些差异叠加,使得物理世界的AI交互非常复杂,需要形成“观测-建模-反馈-执行”的完整闭环,并涉及大量人力因素 [19] 时空AI面临的三大挑战 - **数据稀缺体量小**:传感器不可能遍布任何地方,数据不能无时无刻获得,且采集成本高、周期长 [4][9][19] - **模型时空能力弱**:许多物理规律未知、观测方法有限、人为因素不确定,三者叠加导致时空AI建模非常困难 [4][22] - **智能方案闭环难**:需要完成从物理世界观测到数字信号,再经建模、人工修订反馈,最终执行回物理世界的完整闭环,过程复杂 [4][19] 时空AI的关键特性与解决思路 - **时间属性**:包含临近性、周期性、趋势性等特性,例如交通流量的相似性与变化趋势 [20] - **空间属性**:包括空间距离、空间层次及地理学第一定律等特性,例如城市从市到房间的空间层次感 [20] - 解决思路在于对观测数据中的时空属性进行提炼和理解,并将这些属性运用到AI模型中,以降低复杂度、提升效率 [20][22] - 即便许多规律未知,仍可通过在观测的时空数据与执行的时空动作之间建立映射,利用已知物理规律和时空数据特性来部分解决问题 [23] 时空AI的发展历程与阶段 - **第一阶段 (1960-1995) 时空经典模型**:基于少量人工采样数据和经典假设(如距离反比差值)进行简单统计,方法至今仍有部分应用 [26] - **第二阶段 (1995-2008) 时空模式发掘**:开始利用空间数据库技术进行时空关联规则和模式发掘(如商业网点分布),但初期未充分考虑时间特性 [27][28] - **第三阶段 (2009-2016) 时空经典机器学习**:通过经典机器学习模型结合时空特征工程解决实际问题,例如将城市空气质量预测精度从60%提升至80%以上 [29][30] - **第四阶段 (2016-2030) 时空大模型**:为解决复杂问题(如城市人流预测)提出了面向时空数据的深度学习模型,进入时空大模型阶段 [32][33] - **第五阶段 (2023-2035) 城市大模型**:强调跨域多源多模态数据融合与城市知识体系构建,是时空AI走向产业级应用的关键 [34][35] 时空AI的应用实践与价值 - **空气质量预测**:通过大数据和AI方法,将中国城市空气质量预测精度提升20%以上,帮助300多个城市节约了100多亿的污染治理费用 [30] - **城市人流与安全预测**:为解决外滩踩踏事件等公共安全问题,开发了时空图卷积模型,能预测区域间人流转入转出,实现源头治理 [32][33] - **智能城市建设(雄安案例)**:以城市计算理论为支撑,构建城市操作系统,整合消费、交通、政务、水电气热等实时数据,提供交通事故影响分析、绕行推荐、用电负荷分析、燃气管网异常预警与处置、景区安全管理等服务 [39][40] - 在雄安案例中,通过AI检测燃气管网异常并预警后,系统可调取物理摄像头验证,并派单给最近的工作人员处理,结果实时反馈形成管理闭环 [40] 时空AI的技术框架与成效 - 团队深耕时空AI领域二十年,形成的方法论包括:洞悉时空规律特性、设计时空AI建模方法(经典时空特征工程+经典机器学习 或 时空表征学习+时空深度学习)、提供时空AI机器学习框架 [24] - 应用该体系可将模型复杂度降低90%,算法精度提升20%,研发效率提升100% [24] 城市计算与具身智能的关系 - 城市计算可作为实现具身智能的方法论和计算框架,而具身智能可以成为城市计算整体中的一个核心部件 [35] - 具身智能并非特指人形机器人,而是所有AI与物理世界实体结合、能满足自我迭代演进特性的智能体,未来整个城市可成为一个巨大的具身智能体 [36][40]
GAIR 2025 大会首日:AI重构教育、科学与产业的十三重碰撞
雷峰网· 2025-12-13 12:02
文章核心观点 文章报道了第八届GAIR全球人工智能与机器人大会首日主论坛的盛况与核心讨论,大会主题聚焦于AI对教育的重新定义(AI之道)与AI在各领域的范式重构(AI之术)[1][3],与会顶级学者分享了AI前沿技术进展、产业应用挑战与未来发展趋势,认为AI正从技术讨论迈向重塑教育、产业乃至文明的内在力量[1] AI之道:教育的重新定义 高等教育培养模式的重构 - 深圳理工大学提出“加减替换”培养模式以应对AI冲击:减法包括压缩课堂时长20%、每周减少一天上课时间并删减低效课程内容;加法包括要求大一学生必修两学期人工智能导论、每周腾出一天进实验室;替换包括用跨文化交流课替代传统英语教学、计划以智能APP取代传统教科书[6] - 高等教育管理需从传统“电子版电话黄页”式信息系统迭代为智能信息系统,弱智能层面可在现有平台接入大语言模型,强智能层面则让系统直接对接各子系统以实现实时响应与智能决策[7] - 大学应回归培养“有智慧的人”的本质,帮助学生找到自身定位,并推出科研成果与素质教育双成绩体系进行全面评价[6] 教育理念与目标的根本转变 - 生成式AI使知识从“黄金”变成“无处不在的空气”,教育应从“知识传输”转向培养学生的能力、好奇心、学习主动性和共创意识[9] - 未来教育的重点需从“真”(知识与事实)转移到“善”(价值观、自省力、判断力)与“美”(独特的自我展现),以培养更聪明的人并防范缺乏价值判断的AI系统风险[9][10] - 大学的核心竞争力最终产品是“人”,重要能力包括运用知识的能力、沟通能力(人与机器)、创造力以及人文素养,好大学和好学科的共同特征都与数学及母语语言文学有关[15] 教育体系与评估的变革讨论 - 当前AI教育转型不存在“弯道超车”,社会对教育抱有过高期望,进步应是全社会责任而非仅由师生承担[13] - 应创造自有教学理念而非跟随他人“领先”话语体系,AI极大地推动了教育民主化并为师生带来更强自主性[14] - 考核方式需因应AI时代改变,若学生能用AI作弊则说明考试方式本身出了问题,港科大是全球首个宣布GPT是好东西并在教学中广泛使用的学校[9][11] - 在应试教育现实下,校内应减教学、减刷题、减考试量,增加“体验”以让孩子找到AI不能代替的科研与人生快乐[17] AI之术:领域的范式重构 机器人技术与产业自动化 - 全球服装市场规模巨大,预计到2030年价值达2.3万亿美元,但智能化不足,2019年数据显示纺织产业机器人密度很低,总生产时间和成本的80%用于物料搬运,67%劳动力集中于缝纫过程[23] - 研究团队开发了可像人一样思考、配合旋转布料方向的缝纫机器人,以及被动式无致动器抓手、布料边缘高速检测、双臂机械手2D和3D裁剪等技术,以革新服装生产流程[22][24] - 选择汽车座椅作为3D剪裁自动化方案的优先商业化场景,因为该品类产量高且预计到2028年相关工业生产设备投入达3.63亿美元,目前尚无自动化解决方案[24] - 欧洲因人工昂贵将成为继中国、北美、东南亚和日本之外最大的自动化服装市场[25] 大模型技术演进与挑战 - 大模型需从当前“一次性学习”模式革新为人类“连续学习”式的终身学习,并从“虚拟大脑”走向与机器人等实体载体结合的“感知机器”,这是未来5-10年的核心方向[28][29][30] - 需改善神经元连接方式让模型在同等数量神经元上变得更聪明,发展进程可能缓慢但方向明确[28] - 面临幻觉与长上下文处理瓶颈,可通过“有损计算”理念破解,即利用参数精度无需过高、无需启用全部参数两个关键点,开发简易算法优化相对位置信息与KV缓存显存占用[38][39] - 大语言模型依赖公开数据的发展模式即将触顶,如何利用私有数据持续赋能是巨大挑战,且将基于公开语言数据的成功经验迁移到其他非语言数据领域是错误的[49] 科学基础模型与AI+科学 - 科学基础模型面临语言边界限制与科学数据复杂性两大瓶颈,例如一张光谱信息量相当于1000张图片,人类30亿个基因可存储全球数据,语言作为低维离散符号系统难以覆盖[42] - 构建路径包括将分子、基因、光谱等非文本科学数据转化为Token表示并统一编码,以及通过数据对齐(如基因数据与病理数据对齐)推动科学发现[43] - 团队已完成覆盖十余门学科的超大规模模型训练,并推动“大模型种子班”和“科学家工作坊”以加速AI+科学研究[44][45] 时空AI与城市计算 - AI真正产业价值需进入物理世界(如具身智能、无人驾驶、城市管理),面临数据稀缺、需结合行业知识、现有模型非为时空而设三大挑战[33][34] - 城市计算可作为具身智能的方法论,具身智能将成为城市计算的核心组件,未来城市有望成为“巨大的具身智能体”[35] - 城市知识体系是实现时空数据与其他数据融合的路径和方法论[34] 算力基础设施与超智融合 - 超算核心逻辑是集聚算力攻克复杂科学问题(如地球系统模式、气候变化研究),与AI大模型的并行思维本质相通[52][55] - 超算领域面临国产算力硬件投入大、软件生态投入相对少以及复合型人才流失的困境[55] - 需借鉴通用人工智能的可扩展模型经验,加强算力软件与科学发现协同,完善国产生态以留住人才,深圳超算将搭建超智融合平台形成开源生态[55][56] 医疗人工智能的应用 - 医学人工智能应由医生主导,因为所有工具最终都要落到医生面对患者的场景中,AI是医生调用或辅助诊疗的工具,从人文关怀角度医生使用AI比患者独自面对机器体验更好[60] - 实现路径包括基于现有语言大模型接入更多数据模态并构建应用体系,以及大模型与小模型协同,由垂域小模型纵向攻克预警、诊断、治疗等核心环节[60] - 落地需放在整个医院医疗体系中思考,构建培训、AI赋能、后续医疗支撑的体系以实现“强基层”和真正落地价值,而非仅技术解决[60] 智能硬件与端侧AI - 云端模型存在显著浪费,一些语音指令经云端解析再回传至少50%传输成本被无效消耗,全球云端模型每日消耗成本高达万亿至百万亿量级但有效利用率存疑[63] - 行业正从云端向端侧战略转移,未来智能硬件最重要的是原生记忆和自主学习,大模型需从固定工具转向持续学习和实时成长[63][64] - 当前“更多数据、更大算力、更高人才密度、更大参数=更好模型”的共识可能扼杀创新,Transformer架构偏向压缩智能和静态函数,并未真正产生知识[63] 新型模态感知与空间智能 - 未来5-10年,面向新型模态(如声波、毫米波)的新型感知模型会非常繁荣,传统AI与新型传感将“殊途同归”以实现对物理世界的准确感知和空间智能[65][67][68] - 当前多模态感知仍集中在语音、文字、图像、视频,对新型模态探索不多,需用最新模型技术理解新型传感器数据以进行空间感知、智能交互、健康监测等技术探索[67][68]