元认知

搜索文档
6小时复刻AI IMO金牌成果,蚂蚁多智能体新进展已开源
量子位· 2025-08-02 16:33
AWorld项目团队投稿 发自 凹非寺 量子位 | 公众号 QbitAI 2025年的IMO,好戏不断。 7月19日,全世界顶尖大模型在2025年的IMO赛场上几乎全军覆没。时隔1天,OpenAI、DeepMind等顶尖实验室就在IMO 2025赛场斩获5/6 题,震惊数学圈。 有意思的是,7月23日——两位来自Harvard和UCLA的学生,用Gemini 2.5 Pro+自研多轮验证框架,在arXiv扔下一篇论文,首次系统性拆 解了「解题+验证」的IMO解题方法论。48小时后,他们开源了完整代码。 来自蚂蚁的多智能体框架AWorld项目团队也加入了这场卷王之争: 7月24日启动,仅仅6小时,采用AWorld智能体框架,复现并开源了DeepMind的5/6道解题结果,并直接给出了可一键运行的多智能体IMO系 统。 果然,大家好奇的点还是跟传统长思维链LangChain等框架有什么不一样。作者给出的回复,核心就是一个词,自我进化。即,多智能体能够 超越单个智能体,能够用于复杂问题协同,以及强化学习的奖励模型等,最终实现AGI。 IMO 2025,把复杂推理模型推向了一种新的高度(尽管还处在实验室阶段,但Dee ...
ChatGPT大更新推出学习模式!“一夜之间1000个套壳应用又死了”
量子位· 2025-07-30 08:24
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI ChatGPT大更新,正式推出了 学习模式 (Study Mode): 不再只是给你答案,而是要像老师一样引导你一步步思考问题。 这项功能已经对免费版、Plus、Pro和Team用户开放,ChatGPT Edu用户也将在未来几周内用上。 除了简单的辅导一个问题之外,还可以用来准备一场考试。 OpenAI教育副总裁 Leah Belsky 指出:当ChatGPT被用于教学或辅导时,它能显著提升学生的学习效果。但如果仅仅把它当成一个"答案 机器",那反而会阻碍学习。 这话说得没错,数据显示约有三分之一的大学生正在使用ChatGPT来辅助学业,但学校和家长一直担心学生会用它直接抄答案,损害批判性 思维能力。 比如此前MIT一项研究发现,与使用谷歌搜索或完全不使用ChatGPT的人相比, 使用ChatGPT写作文的人在写作过程中的大脑活动较低 。 有网友提出学生可以随时切换到正常模式,继续抄答案。 不过OpenAI透露,目前不会推出让家长或老师把学生锁定在学生模式的工具,但未来可能会探索这个功能。 也有人感慨,一天之内又有1000个GPT套壳项目完蛋了。 Chat ...
虚假相关性:很多看似相关的事情之间根本无关
36氪· 2025-07-25 15:14
"虚假相关性"一词最初是由洛伦·查普曼和简·查普曼提出的,指的是我们倾向于高估两个变量之间的关系,即使这种关系并不存在。那么,我们为什么会这 样做? 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:我们的大脑里经常会想像出一些本不存在的关联和假设,而且我们往往难以意识到自己思维中的这种强大内在机制。质疑这些假设对于揭示那些驱 动我们思维的隐藏模式至关重要。这是一种元认知练习,会让我们更加了解自己的思维模式,并避免思维中的固有偏见。本文来自编译,希望对您有所启 发。 小时候,我总觉得用姐姐送给我的那支铅笔参加考试时成绩会更好。于是每次考试,我都会特意使用这支铅笔。 我有个朋友认为城市人普遍缺乏礼貌,所以当他遇到一个粗鲁的陌生人时,会假设这个人一定是在城市里长大的。这些虚假相关性无处不在,出现的频率比 我们意识到的要高得多。 1. 保护自己免受不可预测性的影响 虚假相关性在决策过程中感觉像是简单的经验法则。尤其是在快节奏的环境中,我们没有足够的精力去仔细思考。例如,匹兹堡儿童医院的戴维·曼德尔博 士发现,研究中有69%的外科护士认为满月会导致当晚住院人 ...