Workflow
马斯克挖不动的清华学霸,一年造出 “反内卷 AI”!0.27B参数硬刚思维链模型,推理完爆o3-mini-high
AI前线·2025-08-04 14:43

文章核心观点 - Sapient Intelligence推出的HRM模型以仅2700万参数规模实现复杂推理能力,超越主流大型语言模型如Claude 3.5和Gemini,且不依赖token生成[2][6][7] - HRM采用"隐性推理"架构,模仿人类大脑分层处理机制,显著提升数据效率和计算经济性,在数独、迷宫等任务中达到接近完美准确率[6][10][14] - 该模型在ARC-AGI基准测试中以40.3%得分超越o3-mini-high(34.5%)和Claude 3.7 Sonnet(21.2%),且训练资源仅需50-200 GPU小时[7][18] 模型技术突破 - 架构创新:采用H/L双递归模块实现"分层收敛",H模块负责抽象规划,L模块执行细节计算,避免梯度消失和过早收敛问题[14][16] - 性能表现:在仅1000个训练样本条件下,"极限数独"和"高难度迷宫"任务准确率接近100%,而主流思维链模型准确率为0%[6] - 资源效率:训练专业级数独能力仅需2 GPU小时,ARC-AGI测试资源消耗仅为大模型的1/100,推理延迟降低100倍[18] 商业应用前景 - 目标领域:聚焦具身AI、机器人、医疗健康和气候预测等数据稀缺领域,特别适合复杂决策和长期规划任务[9][19] - 成本优势:相比API调用大模型,HRM可在边缘设备运行,企业级应用推理成本大幅降低[18][19] - 扩展计划:正在开发通用推理模块和类脑模型,并加入自我修正能力,下一代产品将突破文本型系统局限[19] 团队背景 - 创始人王冠曾开发7B参数开源模型OpenChat,获5.2k GitHub stars和月均20万+下载量,拒绝XAI邀请[3] - 联合创始人郑晓明为连续创业者,团队汇聚来自XAI、DeepMind、Google等机构的顶尖科学家,参与过AlphaGo、Gemini等项目开发[3] - 公司创立于2024年8月,核心成员包括清华大学毕业生和全球AI专家[2][3]