刚刚，AI科学家Zochi在ACL「博士毕业」，Beta测试今日上线

核心观点 - Intology的AI科学家Zochi的论文被顶级会议ACL主会录用，成为首个独立通过A*级别科学会议同行评审的人工智能系统 [1] - Zochi的论文《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》展示了其在多轮越狱攻击方法上的创新，成功率达到GPT-3.5-turbo 100%和GPT-4 97% [8][11] - Zochi的自主性体现在从研究方向确定到论文撰写的全流程，人类仅参与图表和格式修订 [8] 论文与研究成果 - 论文标题为《Tempest: Automatic Multi-Turn Jailbreaking of Large Language Models with Tree Search》，前期版本《Siege》曾被ICLR研讨会接收 [8] - 方法基于树搜索，通过并行探索对抗性提示分支，集成跨分支学习和部分合规跟踪功能 [9] - 评估显示Tempest在较少查询次数下达到更高成功率，提示当前语言模型安全机制的潜在不足 [11] 学术影响力与争议 - ACL等顶级会议主会议录用率仅20%，远低于研讨会60-70%的录用率，Zochi的录用标志着其达到博士级别研究水平 [3][5] - Zochi的论文在自动审稿人评估中平均得分7.67分，远超其他AI系统生成的论文（3-4分） [14] - Intology因未提前向ICLR通报AI生成论文而陷入批评风波，被指滥用同行评审过程 [16][17] Zochi的技术能力 - 提出CS-ReFT方法解决模型微调中的跨技能干扰问题，仅用0.0098%参数实现93.94%的AlpacaEval胜率 [21] - 开发EGNN-Fusion用于计算生物学，参数数量减少95%的同时保持顶尖性能 [21] - 在MLE-Bench评估中，80%任务超过人类表现中位数，50%任务获奖牌 [23] 行业比较 - 与其他AI系统相比，Zochi论文质量显著更高，自动审稿人评分达8、8、7，远超录用门槛6分 [23] - 基线系统专注于受限问题，而Zochi致力于开放式挑战并提出最先进方法 [23]