Workflow
长时记忆
icon
搜索文档
清华刘嘉:AI时代属于年轻人,不要用过时的经验束缚他们
36氪· 2025-10-16 19:01
AI对人类认知和工作模式的重塑 - 大脑是一个主动预测和生成认知的系统,智力的本质在于主动加工而非被动存储[1][6] - 使用AI工具时,大脑可能将资源重新分配给批判性思维和创造力等高级认知功能,而非维持记忆海量信息的强连接[1][7] - AI将人类从基础脑力劳动中解放出来,类似于工业革命将人口从繁重农业劳动中解放,使大量劳动力投身于教育、科学和艺术等领域[3][10] - 人类可以将时间和精力集中到从80分提升到100分的创造性工作上,这体现了人类独特的思想、情感和创造力[1][4] - AI的终极意义是将人类从所有框架内事务中解放,使其集中全部智力探索知识与文明最前沿的创造性工作[1][11] AI时代人类创造力的新定位 - 人类智能与创造力的核心源于对信息进行动态加工和操作的工作记忆,而非存储静态信息的长时记忆[5] - 创造力的本质是在工作记忆中将不同领域的概念进行前所未有的关联、组合与重构[5] - AI时代人类不再单纯追求知识的标准化和共识化,而是通过创造力拓展“未知的已知”和探索“未知的未知”[5] - AI能在已有的人类认知框架内做到极致,但无法跳出框架进行“从0到1”的颠覆性创新,而这正是人类文明进步的关键驱动力[11] - 人类真正的独特性在于每个人拥有的独特认知与生成式发明能力[19] 人机协作的新分工模式 - AI充当“外部事实记忆库”,人类则专注于高层次的操作和创造性融合[6] - 我们不再需要记住所有事实,但必须学会调用这些事实并在心智工作台上进行创造性操作[6] - 大模型的本质是将人类几千年知识精华压缩进神经网络权重,其优势在于浩瀚无尽的知识库而非单纯的文字或代码撰写能力[3] - AI是理想的批评者,能提供苛刻客观的意见且不会让人感到自尊受损,这种无压力反馈促进个人认知迭代与进步[14] - AI是能够共同成长的伙伴,其反馈深度与使用者的提问水平直接相关,呈现“遇强则强,遇弱则弱”的特性[14] AI对教育行业的变革性影响 - AI以前所未有的力量抹平由地域、家庭和阶层带来的教育不平等,实现教育平权[2][13] - 新的差距是“认知差距”即如何有效使用AI的差距,而非物理资源差距,但这种差距可以通过教育克服[2][13] - 传统教师“授业解惑”的职能被AI超越,未来核心价值在于“传道”即教会学生正确使用AI工具及高效交流协作[14] - 教育的核心任务是激发好奇心和探索欲,给予学生足够空间在AI协助下自由创造,关键在于获取答案后的“追问”[15] - 现代通识教育应训练学生提出正确问题、探寻关系、逻辑推演、理解心理和说服他人五大能力[16][17][18][19] 工作形态与社会结构的未来演变 - AI将我们从繁琐重复性工作中解放,为探索“我要什么”这个人生命题提供时间和空间[10] - 当AI高效满足社会基本物质需求时,人们不再需要为生存而被迫工作,未来社会或可实现“按需分配”[10] - 面对职业被替代风险,需要思维根本转变,引导年轻人将精力投入到更具创造性的领域[12] - AI时代属于年轻人,他们是与AI共生的“原生一代”,应放手让其探索而非用过期经验束缚[12] - 行业应顺应并利用AI潮流,学习成为机器的维护者、改进者甚至新引擎的发明家[19]
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%
量子位· 2025-06-04 08:17
研究背景与挑战 - 具身智能领域面临的核心难题是让AI在复杂3D环境中像人类一样构建、维护和利用长时记忆[3] - 现有大语言模型在文本理解中表现卓越,但在动态3D环境中举步维艰,主要问题包括:依赖稀疏或物体中心的表征,无法捕捉复杂的几何关系;缺乏动态更新机制,难以管理时空动态;在多房间任务中难以关联不同时空的观察,存在长时记忆断层[5][6][8] 3DMEM-BENCH基准 - 研究团队构建了首个3D长时记忆评估基准3DMEM-BENCH,用于系统评估具身智能的记忆能力[10] - 基准具有大规模与多样性特点:包含超过26,000条轨迹和1,860个具身任务,覆盖182个3D场景,平均每个场景18个房间[11] - 任务难度分级明确:分为简单(3房间)、中等(5房间)、困难(10房间),并包含“野外挑战”以考察模型泛化能力[12] - 相较于ALFWorld、Behavior-1K等现有基准,3DMEM-BENCH首次聚焦“长时记忆”与“3D空间理解”的结合[13] - 评估维度包括:要求执行跨房间动作链的具身任务、测试空间关系推理的时空问答、以及总结多房间记忆共性与差异的场景描述[14] 3DLLM-MEM模型架构 - 研究团队提出3DLLM-MEM模型,采用双记忆系统设计,灵感源自人类认知结构[15] - 工作记忆存储当前观察,容量有限但动态更新;情景记忆以密集3D表征存储历史观察与交互,可扩展且包含时空位置信息[22] - 模型包含记忆融合模块,工作记忆作为“查询”从情景记忆中选择性提取任务相关特征,通过注意力机制融合两者,避免记忆过载[16] - 具备动态更新机制,当环境变化时自动更新情景记忆,确保记忆与当前状态一致[17] - 核心优势在于通过“选择性记忆检索+时空特征融合”,在复杂环境中既能聚焦任务关键信息,又能维持记忆效率[19] 模型性能验证 - 在3DMEM-BENCH上的实验表明,3DLLM-MEM显著优于现有方法[20] - 在最具挑战性的“野外困难任务”中,模型成功率达27.8%,远超基线模型(如“最近记忆”仅5%,“检索增强记忆”仅10.6%)[21] - 在“野外任务”整体成功率上,3DLLM-MEM达32.1%,比最强基线高16.5%[23] - 在时空问答任务中,模型在“空间关系”“跨房间对比”等子任务上准确率超过60%,而传统3D-LLM因上下文限制,准确率不足10%[24] - 模型通过“动态融合”机制仅需处理与当前任务相关的记忆片段,计算成本比“全记忆存储”降低,同时保持高推理精度[25]