Workflow
刚刚,AI科学家Zochi在ACL「博士毕业」,Beta测试今日上线
机器之心·2025-05-29 12:53

核心观点 - Intology的AI科学家Zochi的论文被顶级会议ACL主会录用,成为首个独立通过A*级别科学会议同行评审的人工智能系统 [1] - Zochi的论文《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》展示了其在多轮越狱攻击方法上的创新,成功率达到GPT-3.5-turbo 100%和GPT-4 97% [8][11] - Zochi的自主性体现在从研究方向确定到论文撰写的全流程,人类仅参与图表和格式修订 [8] 论文与研究成果 - 论文标题为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》,前期版本《Siege》曾被ICLR研讨会接收 [8] - 方法基于树搜索,通过并行探索对抗性提示分支,集成跨分支学习和部分合规跟踪功能 [9] - 评估显示Tempest在较少查询次数下达到更高成功率,提示当前语言模型安全机制的潜在不足 [11] 学术影响力与争议 - ACL等顶级会议主会议录用率仅20%,远低于研讨会60-70%的录用率,Zochi的录用标志着其达到博士级别研究水平 [3][5] - Zochi的论文在自动审稿人评估中平均得分7.67分,远超其他AI系统生成的论文(3-4分) [14] - Intology因未提前向ICLR通报AI生成论文而陷入批评风波,被指滥用同行评审过程 [16][17] Zochi的技术能力 - 提出CS-ReFT方法解决模型微调中的跨技能干扰问题,仅用0.0098%参数实现93.94%的AlpacaEval胜率 [21] - 开发EGNN-Fusion用于计算生物学,参数数量减少95%的同时保持顶尖性能 [21] - 在MLE-Bench评估中,80%任务超过人类表现中位数,50%任务获奖牌 [23] 行业比较 - 与其他AI系统相比,Zochi论文质量显著更高,自动审稿人评分达8、8、7,远超录用门槛6分 [23] - 基线系统专注于受限问题,而Zochi致力于开放式挑战并提出最先进方法 [23]