高能效计算

搜索文档
AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办
量子位· 2025-07-25 13:38
论坛概况 - 2025基础科学与人工智能论坛在中关村展示中心会议中心举行,由清华大学人工智能研究院常务副院长孙茂松教授主持[1] - 四位顶尖AI专家参与讨论:刘铁岩博士、汪玉教授、顾险峰教授、沈亦晨博士[1] - 论坛吸引500名来自清华大学求真书院、北京高校及科研机构的观众[2] - 该论坛已连续举办3届,由清华大学求真书院主办,中信证券与中关村科学城管委会协办[2] 因果性与AI科学化 - 当前AI技术仍以"相关性"建模为主,缺乏对"因果律"的深刻掌握,限制了在自然科学和数理建模任务中的应用[3][4] - 大模型在高层语义表达中已出现"因果性功能的涌现",能处理逻辑推理、数学解题等任务[5] - 建议从"语义因果性"角度重新评估当前模型的能力边界[5] Token范式与世界模型 - 专家质疑Next Token Prediction范式是否适合处理复杂四维世界认知,提出可能需要转向"世界模型"等新范式[6] - 语言作为人类认知的表达系统,若对象或规律可通过语言准确描述,AI仍可能通过token prediction模型学习[6] - Next Token Prediction在语言理解和创作领域表现优异,但在非语言任务如偏微分方程求解、量子系统建模等方面存在局限[6] AI原创能力探讨 - AI在科学研究中难以实现重大理论突破,因其无法完成"对未知现象的预判与假设"[9][10] - AI可解决90%可类推工程化问题,但在10%原创性突破领域仍力有未逮[11] - AI在已知边界上的全覆盖与组合重构将对科学研究产生深远影响,尤其在"从类比中发现新结构"方面具有潜力[12][13] 算力瓶颈与未来架构 - 最新一代大模型训练耗资约100亿美元,需20万张GPU卡支持,预计2035年可能突破至1亿张卡[14] - 光互联和光计算芯片可提升芯片间通信带宽与效率,解决分布式模型训练问题[16] - 未来需推动低精度(int4/int8)模型优化,并使底层硬件异构对开发者透明[17] - 提出"Experience-driven AI"设想:由100万个机器人在物理世界中实时感知、同步数据和模型权重,实现全域智能协同[18][19] 总结展望 - 大模型的有效性是经验主义的,但其根本性问题需理论与系统两端的突破[21]