情境智能

搜索文档
复旦大学/上海创智学院邱锡鹏:Context Scaling,通往AGI的下一幕
机器之心· 2025-06-15 12:40
AGI发展路径 - 大模型演进分为三幕:第一幕是模型规模化胜利,通过堆叠数据与参数实现通用任务跃升,代表模型包括ChatGPT、MOSS、Qwen [6] - 第二幕是后训练优化探索,通过强化学习、工具调用、思维链等技术提升复杂问题决策能力,代表成果包括GPT o1/o3、DeepSeek-R1、AnyGPT [6] - 第三幕Context Scaling聚焦情境理解,旨在让AI适应复杂多变情境并捕获"暗知识",实现模糊环境中的合理判断 [7][8] Context Scaling核心价值 - Context是多维动态信息结构,包含时空信息、参与者状态、文化规则等未明示的语境暗示 [9] - 关键能力是捕获"暗知识"(如社交暗示、文化差异判断),解决现有技术对模糊任务描述的局限性 [11] - 对AI安全发展至关重要,通过情境理解使AI做出符合人类价值观的自主判断(如规避回形针悖论) [12] 技术实现支柱 - 强交互性:要求AI具备社交智能、文化适应、动态调整能力,需从多模态协作中理解情绪状态和未说出口的期望 [14][15] - 具身性:智能体需具备虚拟或现实环境中的主体性,通过感知-行动闭环实现情境学习 [16] - 拟人化:需深度理解人类情感模式与文化敏感性,在参数固定情况下通过Context积累实现持续能力提升 [17] 技术协同与挑战 - Context Scaling与Test-Time Scaling形成互补,前者提升输入质量后者优化计算效率 [18] - 为强化学习提供新环境定义,将简单状态-动作循环升级为含丰富情境的交互空间 [20] - 面临三大技术挑战:Transformer架构重构、学习范式向交互式持续学习转变、复杂情境数据的生成方法创新 [23] 行业影响 - 将推理增强、多模态融合等技术统一于"情境理解"目标,可能成为通向AGI的关键路径 [22] - 代表企业包括OpenAI(o系列数学推理)、DeepSeek(GRPO强化学习突破)等探索不同扩展路径的机构 [2] - 复旦大学邱锡鹏教授提出该理论框架,指出行业需突破已有路径微调,解决"意识到但未表达"的核心问题 [22]