AI大家说 | 哈佛&MIT：AI能预测，但它还解释不了“why”

实验核心发现 - 哈佛与MIT的实验表明，当前AI模型在预测行星轨迹时，虽能达到高精度，但并未编码出如牛顿定律般的“世界模型”，而是依赖特定情境的经验法则[3][8] - 模型预测的受力向量与真实的万有引力定律毫无关联，且其错误模式在不同测试样本（如不同银河系）中不一致，说明其无法构建稳定的、可推广的定律体系[10] - 该“预测与解释脱节”的缺陷在“晶格问题”和“黑白棋”等其他测试场景中同样存在，模型仅根据“下一个token可能性”对状态进行分类，而非理解底层规律[11] 实验设计与背景 - 研究选择轨道力学作为测试场景，因其在科学史上具代表性，旨在观察AI是否能重演从开普勒（经验规律）到牛顿（深层原理）的科学发现过程[4][5] - 实验使用1000万个模拟太阳系坐标序列（总计200亿个token）训练一个1.09亿参数的小型Transformer模型，以探究其预测逻辑[3][8] - 研究将AI模型统称为“基础模型”，其核心是数据驱动的“输入-预测输出”映射，与能刻画数据隐含状态结构的“世界模型”存在本质区别[6] 对AI行业发展的启示 - 研究结果并非否定AI价值，但指出以当前形态，大语言模型尚不足以实现真正的科学发现，需探索新路径[12][13] - 行业未来发展的一种思路是结合“晶化智力”（已有知识）与“流动智力”（经验迁移能力），例如通过JEPA框架等新方法进行探索[13] - 行业需共同解答的核心命题是如何让AI从“预测机器”进阶为能理解世界运行逻辑的“思考者”，这决定了AI在科学史上的最终地位[14]