空间智能
搜索文档
潮声丨人工智能有时比人还“蠢”,AI版图缺的这块拼图是什么
搜狐财经· 2025-12-03 08:35
文章核心观点 - 当前以大语言模型和图像分类器为主导的人工智能发展已达到极限,缺乏对物理世界的深度理解,导致生成内容常出现不合常理的问题[2][6][7][10] - 空间智能被视为人工智能突破当前瓶颈、实现下一个飞跃的关键前沿,其核心是让机器像人一样理解并交互于三维物理世界[2][11][12] - 实现空间智能的根本路径在于构建“世界模型”,该模型能赋予AI对物理规则进行推理和预测的能力,已成为学术界和产业界新的重点投入方向[19][20][23] 人工智能当前发展的局限性 - 现有大语言模型和多模态模型在生成可靠文本方面强大,但在处理与物理世界相关的任务时表现不佳,常被调侃为“人工智障”[6][7] - 具体案例显示AI缺乏物理常识:豆包模型在图像生成中将骆驼比例严重失调,并添加了不符合生物特征的动物[7];OpenAI的Sora模型生成的蚂蚁视频中蚂蚁只有四条腿,且升级版Sora2在视频细节衔接上仍存在不符合常识的瑕疵[10] - 根本原因在于语言是人造信号,处理过程有信息损耗,而AI缺乏对真实物理世界体系的经验和根基[10] 空间智能的定义与重要性 - 空间智能概念源于教育心理学,指对空间信息进行感知、理解与操作的综合智能,涉及三维思维和空间想象,是人类从婴儿期发展的本能[12] - 在人类文明进步中,空间智能是关键驱动力,例如用于计算地球周长、发明珍妮纺纱机(使单人工效提升八倍)以及发现DNA双螺旋结构[12] - 将空间智能迁移至科技领域,旨在让机器获得理解并交互于三维世界的能力,这是AI发展的终极愿景之一,例如响应“去买杯咖啡”这类需要自主任务拆解与规划的高层指令[11][12] 空间智能的技术发展与产业应用现状 - 空间智能研究历史悠久,早在1970年代,大卫·马尔在《视觉》一书中就系统提出了从图像恢复三维世界的框架[15] - 技术已在部分产业中应用,例如手机AR测量、VR眼镜、扫地机器人、服务型机器人和机器狗,但这些应用或需人为操控,或对环境适应能力不强,容易因识别不清等问题导致故障[16] - 自动驾驶被视为目前规模最大、最成熟的空间智能应用,但其系统仍难以在复杂城市街道上进行安全推理,例如无法从突然出现的小球推测出可能有儿童跑上马路的潜在危险[17] - 当前技术的瓶颈在于“感知-推理-行动”链条中的“推理”环节,即缺乏能够理解物理规则并进行因果预测的内部模型[17] 实现突破的关键:世界模型 - 在数据(高质量语言数据可能在2026年左右耗尽)和算力(训练GPT-4成本可能超过1亿美元)存在限制的背景下,模型成为推动AI发展的关键[19] - “世界模型”于2018年提出,灵感来自人脑构建并运用“内部世界”的机制,旨在让AI能够整合感官信息,对物理世界进行直觉式推理和预测,例如预判咖啡杯滑落轨迹并接住[19] - 世界模型被视为实现空间智能的根本路径,因此成为产业界竞相投入的新焦点[20][23] 产业界的最新动态与投入 - 2025年1月,英伟达在CES上宣布推出可预测和生成“物理感知”视频的Cosmos世界模型[22] - 2025年3月,拥有全球最大室内场景空间数据集的空间智能企业群核科技,开源了空间语言模型SpatialLM,该模型登上HuggingFace模型趋势榜第二位[22] - 2025年8月,谷歌DeepMind发布了支持“实时交互”的世界模型Genie 3,为智能体训练及游戏开发等领域带来新可能性[22] - 近期,李飞飞参与创建的公司World Lab发布了首款多模态世界模型产品Marble,支持通过多种输入生成可编辑的3D环境[22] 未来展望与挑战 - 大语言模型的成功验证了“基础模型”技术路线的潜力,促使业界瞄准下一个前沿——赋予AI对物理世界的理解与交互能力[23] - 世界模型的搭建仍面临诸多难点:真实世界的复杂性与不确定性难以用现有数学模型全面处理;某些领域(如地球内部构造)数据获取有限;物理学本身对暗物质等现象的认知局限也限制了模型的完整性[23] - 尽管挑战巨大,但发展空间智能和世界模型代表了AI技术演进的重要方向[24]
世界模型,是否正在逼近自己的「ChatGPT时刻」?
新浪财经· 2025-12-02 19:22
世界模型的定义与前景 - 世界模型本质是预测模型,给定当前状态及动作序列,预测下一个状态 [3] - 世界模型可理解为AI对环境状态的预测和判断,从简单游戏世界逐渐走向高质量状态模拟 [3] - 终极目标是对世界进行1:1建模,可能达到原子级别,但实际需根据不同任务目的进行建模 [3] - 三大应用前景包括:为自动驾驶、具身智能等多模态任务提供更多数据、建立模型与世界的结合替代传统模拟器、以及最终成为端到端系统的一部分 [3] 世界模型的构建与数据挑战 - 构建面临核心悖论:先有模型还是先有数据,自动驾驶公司积累上亿公里数据但99%为晴天道路数据,缺乏危险场景数据 [5] - 可行路径为先用常见数据训练垂类模型,再生成更多极端案例数据,通过迭代增强世界模型 [5] - 有公司构建世界模型时数据采集成本达千万级,研究团队难以承担,需通过特定高质量数据提升模型效果 [5] - 提出循环过程:先有0.1版本模型生成0.1版本数据,再进一步训练模型,采用生成数据与真实数据混合模式 [5] 技术实现路径与架构分歧 - 技术路径存在分歧,有研究团队偏向融入物理信息保持视觉模型与物理世界一致性如重力 [6] - 模型构建与需求相关,面向影视游戏方向视频生成更合适,面向通用任务可能不需严格保持物理规律 [6] - 随着生成能力增强,模型最终形态可能是纯生成式,无需重建 [6] - 架构存在扩散模型与自回归模型之争,扩散模型从随机噪声还原内容更接近物理世界生成方式 [7] - 观察到技术融合趋势,包括OpenAI正探索将不同架构在特定阶段统一,如使用token化扩散 [7] - 已有扩散和自回归结合工作,扩散擅长捕捉现实世界分布,自回归补足时序与逻辑连贯性 [7] 发展时间表与商业化前景 - 世界模型的ChatGPT时刻可能需要三年左右出现,目前最困难是缺乏高质量长视频数据 [8] - 视频生成时长大多在5到10秒,大厂演示仅达一分钟量级,因此ChatGPT时刻可能需更长时间 [8] - 世界模型可能是现在及未来十年新的爆发方向,随着语言模型发展成熟需开拓新研究方向 [8] - 存在ToB和ToC商业化挑战,如ToB端按token收费时如何定义视频生成数据价值,ToC端如何提升token [8] - 未来需训练强化学习Agent并将视觉-语言-动作技术进化为世界-语言-动作技术 [8]
大咖热议:文化撞上科技 下一个爆点在哪里?
21世纪经济报道· 2025-12-02 15:13
文章核心观点 - 文化与科技的深度融合正在重塑文化产业,从内容生产到产业链条均迎来变革机遇,其关键突破点在于人才、企业家精神以及软件与硬件的协同发展 [1][10][11] 文化科技融合的实践案例与商业前景 - 4K花园通过AI技术解决了超高清视频制作的历史难题,例如用AI提升1080P素材至与4K拍摄几乎无差别的效果,显著降低了成本并提升了质量 [3][4] - AI与超高清融合催生了新的盈利项目,如AI+超高清视频彩铃和AI+超高清KTV,为公司带来了可观的现金流 [3] - AI+8K+裸眼3D技术在第十五届全运会期间得到应用,打造的裸眼3D跨屏互动视频和户外广告吸引了大量关注,该技术能以低成本赋能文旅场景,商业前景可观 [4] - 找钢集团将约50%的研发投入AI,其AI智能体在售前报价环节准确率超过95%,将员工效率提升10倍以上,并在今年上半年协助产生了1亿元收入 [4][5] - 山西礼物将文物数字资产应用于3A游戏《黑神话:悟空》的场景制作,是文物活化创新的典型案例,并推动了当地文旅市场的火热 [6] - 天娱数科开发了空间智能MaaS平台BehavisionPro,其数据资产部分已累计超过150万条3D数据和65万条多模态数据,3D铰接数据集在HuggingFace全球下载榜前列 [6][7] 技术发展的关键要素与趋势 - 发展空间智能及大模型依赖于海量的空间智能数据,而此类数据目前极度匮乏,数据被视为重要的基础设施建设 [8] - 在AIGC发展中,确保训练数据的合法合规至关重要,否则可能污染模型并导致权利无法保障 [8] - 用户利用大模型生成内容时,版权的归属取决于用户是否提供了创造性指令,保留创作记录对证明版权至关重要 [9] - 未来文化科技的突破需要软件与硬件的双重跃升,软件核心在于大模型能力,硬件则依赖6G网络、VR/AR设备及电子皮肤等技术的突破,预计未来三至五年将有实质性进展 [11] 文化与科技融合的突破点与驱动力 - 文化与科技融合的真正突破点并非单一技术,而是怀揣热情的年轻创业者所代表的自下而上的创新动力 [10] - 企业家精神在技术快速演进的时代尤为关键,科技进步正催生如AI生成视频等新内容形态,未来文化产品的形态和影响力可能远超当前想象 [10] - 推动融合的关键在于复合型人才,即兼具文化想象力与科技素养的人才,科技需要文化拓展边界,文化需要科技实现创新表达 [11]
大咖热议:文化撞上科技,下一个爆点在哪里?
21世纪经济报道· 2025-12-02 14:28
文章核心观点 - 文化与科技的深度融合正在重塑文化产业链条,为行业发展带来新机遇,其关键突破点在于人才、企业家精神以及软件硬件的协同发展 [1][10][11][12] 文化科技融合的应用案例与商业前景 - 4K花园通过AI+超高清技术实现降本增效,例如AI提升1080P素材至接近4K画质,并在全运会应用AI+8K+裸眼3D技术,成本低且效果震撼,具备可观商业前景 [2][3] - AI+超高清视频彩铃、AI+超高清KTV等应用为4K花园带来可观现金流 [2] - 找钢集团将约50%研发投入AI,其AI智能体在售前环节报价准确率超95%,员工效率提升10倍以上,并在上半年协助产生一亿元收入 [3][4] - 山西礼物将文物数字资产用于3A游戏《黑神话:悟空》场景制作,是文物活化的典型创新案例,并带动山西文旅市场火热 [6] 空间智能与数据要素的发展 - 天娱数科升级发布BehavisionPro空间智能MaaS平台,其Assets部分已累计超150万条3D数据和65万条多模态数据,3D铰接数据集位列HuggingFace全球下载榜前列 [7] - 发展空间智能大模型需基于海量数据训练,天娱数科已在多地数据交易所上架数据产品,视数据为基础设施建设 [8] - 数据合法性是AIGC发展的基石,训练大模型需保证数据来源合法合规,否则可能污染模型 [8] 文化与科技融合的未来关键突破点 - 真正的突破点在于怀揣热情的年轻创业者,其自下而上的创新动力是文化科技突破的关键 [10][11] - 企业家精神在技术快速演进的时代尤为关键,新技术正催生新的内容形态,未来文化产品形态可能远超今日想象 [11] - 未来突破是软件与硬件的双重跃升,软件依赖大模型能力提升,硬件需突破网络传输速度(如5G向6G演进)及VR/XR设备瓶颈,预计三至五年内有实质性进展 [11] - 复合型人才是融合关键,需兼具文化视野与科技理解力,以科技拓展文化边界,以文化驱动科技表达创新 [12]
51WORLD更新招股书并获备案通知书:18C板块或再迎AI标的
搜狐财经· 2025-12-02 13:17
上市进程与监管备案 - 公司于12月2日更新招股书,继续推进18C港交所主板上市进程,联席保荐人为中金公司和华泰国际 [2] - 中国证监会国际合作司已于11月28日披露公司境外发行上市及“全流通”备案通知书,意味着公司已获得进入港交所聆讯阶段的前置条件 [2] 公司业务与行业地位 - 公司成立于2015年,致力于克隆地球5.1亿平方公里,核心技术围绕3D图形、模拟仿真及人工智能三大领域 [2] - 公司已推出三大核心业务:51Aes(数字孪生平台)、51Sim(合成数据与仿真平台)及51Earth(数字地球平台) [2] - 根据弗若斯特沙利文资料,公司是中国数字孪生行业的全面领导者:2024年收入在行业中排名第一;截至2024年12月31日的融资金额在中国数字孪生解决方案市场排名第一;是行业首家实现一年内收入超2.5亿港元的公司;是行业唯一一家能够提供全面数字孪生解决方案的公司 [2] - 在空间智能方向,公司推出了空间智能交互平台Clonova,该平台利用自然语言处理技术使用户能在沉浸3D空间中进行互动,应用场景广泛 [3] - 在具身智能方向,公司致力于通过仿真与合成数据技术,为各种具身智能提供模拟训练与高质量合成数据,以突破Physical AI的数据瓶颈 [3] 财务表现 - 2022年至2024年,公司营收分别为1.70亿元、2.56亿元和2.87亿元 [3] - 2025年上半年,公司营收从2024年同期的0.33亿元增加63.6%至0.54亿元 [3] 融资历史与股权结构 - 公司已获得光合创投、云九资本、StarVC、商汤科技、SBI、摩尔线程、当代置业、微木资本等机构,梁伯韬、葛卫东等个人,以及重庆、南宁等地方政府的投资 [4] - 在18C章程下,光合创投和云九资本是公司的领航资深独立投资者,商汤科技为资深独立投资者 [4] - IPO前,光合创投、云九资本以及商汤科技分别持有公司17.3%、3.4%以及2.3%的股份 [4] - 在2024年6月完成F轮融资后,公司的估值为44亿元人民币 [4] 募资用途 - IPO募集所得资金净额将主要用于研发;中国及海外的营销活动;以及用作营运资金及一般企业用途 [5]
51WORLD更新招股书:港股18C板块有望再迎「AI标的」,日前已获备案通知书
IPO早知道· 2025-12-02 13:17
公司概况与上市进展 - 北京五一视界数字孪生科技股份有限公司(51WORLD)于12月2日更新招股书,继续推进港交所主板18C章节上市进程,联席保荐人为中金公司和华泰国际 [2] - 公司已于11月28日获得中国证监会境外发行上市备案通知书,意味着已获得进入港交所聆讯阶段的前置条件 [2] - 公司成立于2015年,致力于克隆地球5.1亿平方公里,核心技术围绕3D图形、模拟仿真及人工智能三大领域 [2] 行业地位与业务构成 - 根据弗若斯特沙利文资料,公司是中国数字孪生行业的全面领导者,2024年收入在行业中排名第一,融资金额在中国数字孪生解决方案市场排名第一 [3] - 公司是中国数字孪生行业首家实现一年内收入超2.5亿港元的公司,也是行业内唯一一家能够提供全面数字孪生解决方案的公司 [3] - 公司现已推出三大核心业务平台:51Aes(数字孪生平台)、51Sim(合成数据与仿真平台)及51Earth(数字地球平台) [2] 技术方向与产品布局 - 在空间智能方向,公司推出空间智能交互平台Clonova,使用自然语言处理技术使用户能在沉浸3D空间中进行互动,应用场景涵盖景区旅游、社交娱乐、企业管理、城市规划等 [4] - 在具身智能方向,公司通过仿真与合成数据技术,为各种具身智能提供高效的模拟训练与高质量合成数据,旨在突破Physical AI数据多样性不足与高质量数据短缺的瓶颈 [4] 财务表现 - 2022年至2024年,公司营收分别为1.70亿元、2.56亿元和2.87亿元,呈现持续增长 [4] - 2024年上半年,公司营收从2023年同期的0.33亿元增加63.6%至0.54亿元 [4] 股东背景与融资情况 - 公司获得了包括光合创投、云九资本、StarVC、商汤科技等知名机构,以及梁伯韬、葛卫东等个人和地方政府的投资 [5] - 在18C章程下,光合创投和云九资本是公司的领航资深独立投资者,商汤科技为公司的资深独立投资者 [5] - IPO前,光合创投、云九资本以及商汤科技分别持有公司17.3%、3.4%以及2.3%的股份 [6] - 在2024年6月完成F轮融资后,公司的估值为44亿元人民币 [7] 募资用途 - IPO募集所得资金净额将主要用于研发、中国及海外的营销活动以及用作营运资金及一般企业用途 [7]
商汤分拆了一家AI医疗公司,半年融资10亿,剑指“医疗世界模型”
量子位· 2025-12-02 12:59
公司概况与战略定位 - 商汤医疗是商汤集团“1+X”战略生态的核心延伸,集团是其稳固的技术后盾与战略伙伴 [4] - 公司定位为以医疗大模型驱动的“未来医院”设计者与赋能者,目标是构建医疗领域的世界模型 [2] - 公司团队规模约100人,其中产研人员占比超过70%,成员多毕业于海内外顶尖高校并具备行业头部企业经验 [20] 融资进展与股东背景 - 公司在半年内累计融资规模已达10亿元,A轮融资已正式启动 [3] - 战略投资者包括美的系盈峰控股、人民卫生出版社集团旗下人卫科技发展公司 [2] - 后续数亿元融资由联想创投、联创资本、九弦资本、申冉投资等机构参与 [2] 核心技术体系与架构 - 技术路线为“通专融合”,顶层为自研医疗大语言模型“大医®”,下层为覆盖多模态医学图像的基础模型群 [6] - “大医®”模型在包含13191道题目的专业测试集上整体表现位居第一,超过DeepSeek满血版、GPT-5等通用模型 [8] - 构建了超250B tokens(约4000亿汉字)、覆盖100+医学学科的高质量语料库作为数据基座 [9] - 搭建了面向医疗场景的工业级RAG框架,在生成回答前进行证据溯源和知识校验,以降低“幻觉” [9] - 开发了“双中台”:大医®Bots智能体开发平台与多模态基础模型应用生产平台,形成“数据-模型-场景-产业”闭环 [10][11][12] 产品与解决方案 - 基于智能体平台研发了“大医智健”、“大医智研”和“大医医助”三款标准化产品 [11] - 打造了由医疗大模型驱动的“SenseCare®智慧医院”综合解决方案,包含智慧诊疗、就医、科研、云四大平台 [12] - 在临床诊疗侧已上线40余款AI模块,针对肺、心脏冠脉、头颈血管等十余个临床方向开放应用 [14] - 患者端产品“大医智健”集成导诊、预问诊、AR导航等全流程服务,并推出健康管理小程序“商汤大医” [17] - 科研支持产品“大医智研”涵盖智能选题、文献解读、论文写作等九大功能,帮助医生解放生产力 [17] 临床效果与落地案例 - SenseCare®智慧病理AI辅助诊断系统帮助科室工作效率提高30%-50%,肿瘤检出敏感性接近100%,良性排阴可达80% [15] - 联合北京清华长庚医院董家鸿院士团队推出全国首个肝脏智能决策多模态智能体“IDEAL” [15] - 与上海瑞金医院联合打造“瑞金医学数字人”,基于此的肝脏智能手术规划系统能在2-5分钟内全自动完成肝脏三维重建,已辅助完成超400例复杂肝切除手术 [26] - 与罗氏制药合作搭建“小罗智多星”平台,已覆盖全国90个城市、700家三甲医院,帮助4000余名医生落地科研项目600余项,累计节约科研工时超2万小时 [28] - 与上海申康医院发展中心共同建设国内规模最大的医疗大数据训练设施,构建“算力-算法-数据”一体化AI模型生产平台 [30] - 全线产品已入驻联想SSG全渠道,并为美的集团旗下和祐医院成功部署SenseCare®智慧诊疗平台,上线15款AI应用 [31] 市场拓展与国际化 - 已获得新加坡卫生科学局颁发的首张人工智能胸部CT辅助诊断医疗器械注册证,并在新加坡医院落地 [33] - 在印尼达成了首单业务,并关注东南亚、中东及日韩等需求迫切的地区市场 [33] 未来发展方向 - 下一步关键跃迁是构建医疗“世界模型”,旨在模拟动态、充满因果关系的真实医疗世界,从“回答问题”进化到“模拟结果、辅助决策” [35] - 以“医学数字人”为例,目标是在数字临床环境中模拟人体的动态过程,如血流变化、生理指标变化等,建立“数字实验室” [36] 集团战略与相关布局 - 商汤集团2025年持续深化“1+X”战略,以生成式AI与视觉AI为核心业务“1”,智慧医疗是“X”创新业务板块之一 [37] - 在空间智能领域,商汤团队联合新加坡南洋理工大学等提出模型Puffin,首次将相机几何无缝融入统一多模态模型 [41] - 商汤医疗CEO张少霆与本文作者将共同担任CVPR 2026的Program Chair,预计将推动生成模型、医疗影像及空间智能等前沿议题 [42]
五一视界获证监会备案并更新招股书,进入港股IPO冲刺阶段|最前线
36氪· 2025-12-02 12:14
公司上市进展 - 中国证监会已向北京五一视界数字孪生科技股份有限公司出具境外发行上市备案通知书 公司拟发行不超过77,600,840股境外上市普通股并在香港联合交易所上市 [1] - 公司38名股东拟将所持合计363,299,144股境内未上市股份转为境外上市股份 并在香港联交所流通 这意味着公司已获得进入港交所聆讯阶段的前置条件 [1] - 若成功登陆港股 公司有望成为18C章节下的重要AI与数字孪生标的 [3] 公司基本情况 - 五一视界成立于2015年2月 并在2017年提出“地球克隆计划” 旨在通过在虚拟世界中复刻地球 打造一个超大型仿真模拟器 [1] - 公司长期聚焦3D图形、模拟仿真及人工智能领域的技术创新与应用 [1] - 公司已推出三大核心业务 分别为51Aes数字孪生平台、51Sim合成数据与仿真平台及51Earth数字地球平台 [1] - 公司的产品及解决方案已被全球超千家大中型企业广泛应用 业务遍及全球19个国家及地区 [1] 公司财务表现 - 2022年、2023年、2024年和2025年前六个月 公司营收分别为人民币1.70亿元、2.56亿元、2.87亿元和0.54亿元 [2] - 2025年上半年营收同比增长62% [2] - 相应期间净亏损分别为人民币1.90亿元、0.87亿元、0.79亿元和0.94亿元 [2] - 经调整后对应净亏损分别为人民币1.32亿元、0.68亿元、0.43亿元和0.67亿元 [2] 公司技术产品与战略 - 在空间智能方向 公司推出空间智能交互平台Clonova 该平台使用户能够通过自然语言处理技术在沉浸3D空间中进行互动 [3] - Clonova提供基于数字孪生AI的全套产品和能力 应用场景涵盖景区旅游、社交娱乐、企业管理、楼宇管理、城市规划及防洪排涝等 [3] - 在具身智能方向 公司致力于通过仿真与合成数据技术 为各种具身智能提供高效的模拟训练与高质量合成数据 旨在突破Physical AI数据瓶颈 [3] 行业背景与市场 - 数字孪生作为产业数字化核心工具 通过数据与模型的深度融合 在虚拟空间“克隆”物理实体 实现对现实系统全生命周期的模拟、预测与优化 [1] - 随着智能传感、云计算与AI等技术的持续赋能 数字孪生应用正从工业制造延伸至城市管理、智能驾驶、建筑设计等多元场景 [1] - IDC与Gartner联合预测 2025年全球数字孪生市场规模可达到350亿美元 预计到2030年突破1200亿美元 年均复合增长率超28% [2] - 英伟达CEO黄仁勋在Computex 2024会上正式发布“地球2号”项目 目标是创建地球数字孪生体以预测其未来变化 印证了该赛道的行业价值 [2]
聚焦空间智能前沿技术 中国图象图形学学会举办专题研讨会
中国新闻网· 2025-12-01 15:29
行业活动与目标 - 中国图象图形学学会在北京举办空间智能前沿技术研讨会 [1] - 研讨会旨在促进空间智能技术在产业端的规模化、智能化落地 [1] - 活动旨在助力中国空天信息产业高质量发展 [1] 参与方与讨论形式 - 超过40位来自高校、科研院所和企业的专家学者参与探讨交流 [1] - 活动围绕推动空间智能技术从学术研究向产业应用的深度转化展开 [1] - 研讨会包括主旨报告和自由发言两个主要环节 [1] 技术研讨与产业应用方向 - 主旨报告涵盖盐湖资源信息获取与智能处理、三维场景感知与生成、遥感图像超分辨率重建的深度学习方法及其可解释性、多源影像智能感知增强、卫星智能化赋能高效空天信息服务等多个前沿主题 [1] - 讨论为遥感监测、资源管理、空天信息服务等多个产业方向提供前沿思路与创新解决方案 [1] - 自由发言环节围绕空间智能的前沿进展、创新突破与产业化应用等话题展开深入交流 [1] 活动组织方 - 研讨会由中国图象图形学学会主办 [1] - 活动由其遥感图像专委会、企业联络与标准化工委会承办 [1] - 北京图象图形学学会协办,北京市科学技术协会提供支持 [1]
意识产生、符号推理……AI下一站该往哪走?
36氪· 2025-12-01 11:52
平台转移与产业发展阶段 - 科技产业大约每十到十五年经历一次平台转移,生成式人工智能可能是当前十五年周期中的下一个主角,但其具体展开方式仍充满不确定性[6] - 技术部署分为三个层次:吸收(自动化明显用例)、创新(新产品与捆绑拆分)、颠覆(重新定义行业根本问题)[6] - 当前大多数成功用例仍处于“吸收”阶段,聚焦于编程、营销、客户支持和自动化等领域,这些领域的部署可能持续二十年[6] - 在“创新”层面,核心问题在于大型语言模型能拆分什么现有捆绑,以及如何从相关性推荐转向意图理解,从捕获用户数据转向理解用户需求[6] - 在“颠覆”层面,根本问题在于当数百万人力被替代后,将催生何种新的可能性,AI可能像蒸汽机一样重新定义某些行业的根本问题[7] - 当前科技巨头正在进行人类历史上最大规模的资本支出竞赛之一,规模可与成熟的全球资本密集型产业相媲美,但产品形态、商业模式和价值捕获方式仍模糊不清[7] 人工智能的本质与意识 - 现有AI本质是“可计算的模式识别”,仅能基于数据寻找模式和执行规则,无法理解规则的本质[11] - 真正的智能必然涉及意识,而现有设备并不具备意识,除非引入其他要素,否则永远不会拥有意识[11] - 根据哥德尔定理,数学体系中存在不可计算的内容,要突破既定规则限制需要理解规则背后的深层原理,这种理解能力需要意识的参与,而计算机无法实现[11] - “意识”很可能涉及量子世界中不可计算的特殊物理过程,由于现有计算机技术完全基于可计算的数学结构,因此人工智能不可能产生真正的意识[11] - 有意识的思维所涉及的物理学必须是非可计算的物理学,由计算机驱动的人工智能不会因此产生超人类智能[11] 人工智能未来发展的不确定性 - 通用人工智能是否能实现尚不确定,未来可能出现成百上千种在特定领域表现卓越的“弱人工智能”[14] - 未来不会只有一种智能,而会有许多不同形态的人工智能,包括各种潜在的智能形态、不同的“脑结构”和思维方式[14] - 在广阔的“智能空间”中,人类智能只是其中一种形式,未来AI可能出现许多以不同于人类方式思考的“异人智能”[14] - 未来AI计算架构不确定将主要依靠中心化的云端系统,还是更多地依靠边缘与本地设备,目前大多数公司押注在中心化方向[14] - 更大的模型意味着更高的能耗和更庞大的数据中心,也带来了集中化的控制问题,其趋势是否可持续并不确定[15] - 边缘计算趋势正在兴起,其响应更快、隐私保护更强、能耗更低且更具独立性,未来AI计算架构很可能呈现中心化云计算与去中心化边缘计算共存的“混合式”格局[16] - 人工智能究竟会提升人类工作效率还是直接取代人类尚不确定,现有数据显示AI带来的是效率提升而非大规模裁员,它改变了工作结构,让人们从重复任务中解放出来专注于创造性工作[16] 人工智能技术演进方向 - 未来AI的创新将主要体现在四个前沿方向上:符号推理、空间智能、情感智能以及智能体[18] - 这些方向代表技术的延伸,更意味着智能的多维化与专业化,未来AI将是一系列不同类型智能的组合[19] - 符号推理旨在结合自下而上的神经网络学习与自上而下的逻辑推导,以弥补大语言模型在逻辑理解和深层推理能力上的短板[21] - 空间智能旨在让AI具备在真实世界中行动、感知和理解的能力,而不仅仅是通过阅读文本来学习[21] - 情感智能旨在让AI具备理解与回应情感的能力,但这将引发新的伦理问题[21] - 智能体的理想状态是无形的智能,默默工作于后台自动完成任务,未来智能体之间将形成一种新的经济体系——智能体经济[21] 面对变革的视角与态度 - 应对AI发展需保持乐观,以“进托邦”视角看待进步,即相信世界每天都在变得更好一点点[22] - 乐观是推动创新的道德责任,只有相信未来可以更好,才有动力去创造它[22] - “进托邦”不是一个完美的世界,而是一个每天进步1%的世界,持续微小的进步终将带来文明跃迁[22] - 持续进步是人类文明的常态,从长远看世界仍在向前,保持乐观是基于历史的理性判断[23] - 从概率上讲,未来继续改善的可能性远大于全面倒退的可能性,乐观是相信问题可以被解决,并能驱动创造[23] - 面对AI应主动准备而非恐惧,技术变革从来不是简单的替代,而是复杂的重构[9]