Workflow
通用人工智能(Artificial General Intelligence
icon
搜索文档
我国学者推出“AI-牛顿”,根据实验数据自主发现牛顿第二定律、万有引力定律等基本定律
生物世界· 2025-11-15 18:00
文章核心观点 - 北京大学马滟青团队开发了名为AI-牛顿(AI-Newton)的创新系统,该系统能够完全自主地从原始实验数据中推导出物理定律,而无需任何先验物理知识或监督,这标志着向AI驱动的自主科学发现迈出了重要一步 [2] 突破传统:AI驱动的科学发现新范式 - 当前科学发现面临两大挑战:人类主导的研究周期长且易受预设观念影响;现有AI方法如神经网络难以解释,符号回归方法在处理复杂系统时面临组合爆炸问题 [5] - AI-Newton的设计灵感来源于人类科学家的思考方式,但摒弃了对人类知识的依赖,仅从最基本的时空坐标观测数据出发,通过自主定义物理概念和建立数学关系来重新发现核心物理定律 [6] 核心架构:概念驱动的知识发现引擎 - AI-Newton的核心是其三层知识库架构(符号、概念和定律),模仿了人类物理学家组织知识的方式,系统从简单概念(如位置、时间)开始,逐步构建更复杂的概念(如速度、加速度),最终形成完整的物理定律 [8] - 系统能够自主定义物理概念,例如通过分析弹簧悬挂小球的实验,将弹簧的伸长量定义为“质量”的度量,并能从不同实验中识别出“引力质量”和“惯性质量”的等价性,展现了强大的概念抽象能力 [10] 工作原理:合理推理与符号回归的完美结合 - AI-Newton的工作流程融合了合理推理与符号回归技术,系统通过推荐引擎选择要分析的实验和概念,模仿了人类在探索与利用之间的平衡策略 [12] - 当系统发现某个通用定律在新场景中不成立时,会通过合理推理尝试添加新项来修正定律,例如从动能守恒出发,通过引入弹性势能项,最终发现完整的机械能守恒定律 [12] 实验验证:重新发现牛顿力学定律 - 研究团队在46个牛顿力学实验上测试了AI-Newton,涵盖了从简单自由落体到复杂多体系统的各种场景,所有测试数据都通过求解微分方程并添加高斯分布误差来模拟真实实验条件 [14] - AI-Newton成功重新发现了牛顿第二定律、能量守恒定律和万有引力定律等核心物理规律,系统平均能发现约90个物理概念和50个通用定律,为所有测试实验提供了完整的物理解释 [17] 两大特征:渐进性与多样性并存 - 通过多轮测试分析,发现AI-Newton具有两个核心特征:渐进性进步,系统模仿人类科学家,从简单概念开始逐步构建复杂知识体系,反映了逻辑一致性;发现多样性,在不同测试案例中,系统发现重要概念和定律的顺序和时间存在显著差异,确保了重要定律的发现不依赖于特定实验配置 [19] 未来展望:通往通用人工智能的新路径 - AI-Newton的框架展现出强大的扩展潜力,通过引入更强大的数学工具(如矢量形式体系、逻辑推理)和自然语言集成,系统可以处理更复杂的物理概念,甚至表达难以纯数学表达的概念(如惯性、量子力学原理) [21] - 这项研究不仅推动了AI驱动的科学发现,还为实现通用人工智能(AGI)提供了新思路,AI有望在尖端科学发现中发挥重要作用,成为人类科学家的强大合作伙伴,意味着迎来了科学研究范式转变的关键节点 [21]
深度解析谷歌Genie 3:“一句话,创造一个世界”
虎嗅· 2025-08-18 16:55
核心观点 - Genie 3是谷歌DeepMind发布的生成式交互环境模型 实现从被动观看内容到主动参与世界的范式转移 其核心使命是作为训练AI智能体的虚拟环境 推动通用人工智能发展 [1][2][15] 技术突破 - 实时交互性: 以720p分辨率和24 FPS速率实时生成并渲染整个世界 支持即时反馈和因果关系学习 [5] - 交互视界延长: 维持长达数分钟连贯可交互会话 支持复杂多步骤任务模拟和长远规划 [6][7] - 涌现视觉记忆: 物体和环境变化具有一致性 即使视线离开后变化依然存在 体现物体恒存性规则 [8][9][10] - 可提示世界事件: 通过文本提示实时动态改变环境 注入新元素或事件 支持反事实测试 [11] 模型能力演进 - Genie 1: 核心能力为从视频中学习生成可玩2D平台游戏 分辨率160x90 帧率10 FPS 交互视界约16秒 [14] - Genie 2: 核心能力为生成非实时3D环境 分辨率360p 交互视界约10-60秒(实践中更短) [14] - Genie 3: 核心能力为生成实时交互环境 分辨率720p 帧率24 FPS 交互视界数分钟 [14] 战略定位与行业对比 - 谷歌DeepMind战略路径: 将AI构建为训练其他AI的虚拟子宫 旨在创造自主学习和行动的机器智能 [2] - 与Sora/Runway差异: Genie 3是世界模型 用于模拟交互过程 Sora/Runway是视频模型 用于生成最终结果 [22][23] - 性能对比: Sora生成视频达1080p/20秒 视觉保真度高 Genie 3输出720p/数分钟 侧重物理一致性和逻辑连续性 [25][26][30] 核心应用场景 - AGI智能体训练: 解决机器人学和AGI研究中对海量多样化安全低成本训练数据的渴求 支持具身智能体如机器人和自动驾驶汽车模拟数百万种情景 [15][16] - 游戏产业: 理论上将游戏场景创建时间从数月缩短到几分钟 降低开发成本 但目前存在游戏手感不佳 图形错误和控制不精确等短板 [17][18] - 教育模拟: 创造高度互动沉浸式学习环境 如历史系学生走进AI生成的古罗马城邦 医学院学生练习急诊室突发状况 [19] 当前局限与发展方向 - 交互时长与稳定性: 数分钟交互视界不足 需稳定运行数小时才实用 长时间运行仍会退相干 [31] - 保真度与控制性: 存在图形伪影或扭曲 自然语言提示控制方式粗糙缺乏精确性 [31] - 技术挑战: 需解决实时生成立体图像 支持六自由度姿态追踪 保证低延迟和高刷新率以实现VR/AR结合 [32] 长期意义 - 对元宇宙: 预示动态无限广阔虚拟世界可由世界模型从无到有生成 而非手动搭建 [35] - 对AGI: 代表关键基础设施启动 类似航空时代初期的风洞 用于测试迭代和孕育未来人工智能 [35]