Workflow
Pythia
icon
搜索文档
AI解数学题只靠最后一个token
量子位· 2025-09-14 13:05
研究核心发现 - 大语言模型在心算任务中,几乎所有实际数学计算都集中在序列最后一个token上完成,而非分散在所有token中[1] - 模型内部形成名为“人人为我”的稀疏子图,通过最少的计算层和最有限的信息传递高效完成运算[4][5] - 该过程将任务通用型计算与输入特定型计算分开,表明在特定任务中全局信息访问并非必需[1][10] 研究方法与实验设计 - 研究采用上下文感知平均消融和基于注意力的窥视技术对Llama-3-8B等Transformer模型进行消融实验[2][20] - 实验通过三阶段操作:在初始层抑制token针对特定输入的计算,在少数层限制跨token信息传递,最后强制所有计算在最后一个token上发生[15][18][19] - 在Llama-3-8B的A+B+C任务中,只需前14层做任务通用计算,然后通过2层信息传输让最后token获取全局信息,剩余层仅进行最后token自计算[24] 模型性能表现 - AF1_llama子图在八个算术任务中总体表现出高忠实度,其中A+B+C任务忠实度达0.995,A-B-C任务达0.995[28][29] - 仅少数注意力头对算术计算关键,移除近60个头部后模型仍能保持约95%准确率,表明大部分注意力头冗余[30] - 在Pythia和GPT-J模型中也发现类似AF1子图,但等待期更短、信息传输层更长,且性能边界不如Llama清晰[35] 任务适用性与局限性 - AF1_llama在不含额外语义上下文的直接算术任务中保持高准确率,但在需要语义理解的应用题和Python代码任务上完全失败[33][34] - 该方法聚焦于心算任务,即涉及两个或三个操作数的算术问题,可通过单个token输出解决而无需链式思维推理[11] - 研究方法论具有创新性,可服务于算术任务之外的更广泛应用,为理解大语言模型中的算术推理机制做出贡献[37]
“基因魔剪”携手AI提升DNA编辑精度
科技日报· 2025-08-13 18:00
基因编辑技术创新 - 瑞士苏黎世大学、苏黎世联邦理工学院和比利时根特大学合作开发出结合AI的基因编辑技术,显著提升DNA编辑精确度 [1] - 新技术通过"基因魔剪"与AI结合,为模拟人类疾病机制和精准基因疗法奠定基础 [1] - 关键技术挑战在于避免基因编辑过程中的意外变异并维持基因组稳定性 [1] AI工具Pythia的功能 - Pythia能高精度预测基因编辑结果,尤其是CRISPR/Cas9切割后细胞的DNA修复方式 [1] - 团队基于Pythia设计微型DNA修复模板,可引导细胞完成精确基因修改或插入 [1] - 该工具利用可学习的DNA修复规律,实现非随机化编辑 [2] 技术验证与应用 - 修复模板在人类细胞培养体系中验证,实现高效精准的基因编辑和外源基因整合 [2] - 方法在非洲爪蟾和活体小鼠等生物模型中测试成功,包括大脑等非分裂组织的细胞编辑 [2] - 技术适用于非分裂细胞(如神经元),为神经系统疾病治疗提供新途径 [2] 技术扩展功能 - 除基因修改外,技术可用于蛋白质标记(如荧光标记),观察蛋白质在健康与疾病组织中的动态行为 [2] - 技术具有普适性,适用于各类细胞类型 [2] - AI预测细胞对基因干预的响应,类比气象学中的天气预测 [2]
“基因魔剪”携手AI提升DNA编辑精度 为未来精准基因疗法发展奠定基础
科技日报· 2025-08-13 08:09
技术突破 - 开发出创新基因编辑方法 将先进基因魔剪技术与人工智能相结合 显著提升DNA编辑精确度 [1] - 开发AI工具Pythia 使科学家能以前所未有精度预知基因编辑最终结果 特别是预测细胞在CRISPR/Cas9切割后如何修复DNA断裂 [1] - 设计极小DNA修复模板作为分子胶水 引导细胞以高度精确方式完成基因修改或基因插入 [1] 应用验证 - AI指导设计的修复模板在人类细胞培养体系中验证 实现高效精准的基因编辑和外源基因整合 [2] - 在多种生物模型中测试方法有效性 包括非洲爪蟾和活体小鼠 成功实现大脑等非分裂组织中细胞的DNA编辑 [2] - 技术适用于各种类型细胞 包括不常分裂的神经元细胞 为治疗神经系统疾病带来新希望 [2] 技术优势 - DNA修复过程遵循可识别和学习的规律 Pythia利用这些修复模式进行预测 [2] - 技术不仅可用于修改单个碱基或插入外源基因 还能用于标记特定蛋白质 通过荧光标记实现蛋白质动态行为直接观察 [2] - 预测能力对于实现安全可靠且具有临床应用价值的基因编辑至关重要 [2]