AI教父警告:新一代大模型开始“撒谎”!
华尔街见闻·2025-06-03 16:07
当科技巨头们在数十亿美元的AI技术竞赛中狂奔时,人工智能的奠基人之一却发出了一个令人不寒而 栗的警告:新一代的大模型正在学会"说谎"。 6月3日,据英国金融时报消息,被誉为"AI教父"之一的Yoshua Bengio近日警告称,新一代大模型正在表 现出令人担忧的危险特征,包括对用户撒谎和欺骗。 这位图灵奖得主、加拿大学者Bengio近日公开批评了科技巨头当前数十亿美元的AI竞赛,他表示: "不幸的是,领先实验室之间存在着激烈的竞争,这推动他们专注于提升AI的能力,让AI变 得越来越聪明,但没有在安全研究上投入足够的重视和资金。" 据介绍,Bengio的研究工作为OpenAI和谷歌等顶级AI公司的技术发展奠定了基础。作为深度学习领域 的奠基人之一,他的警告无疑具有重量级的意义。 令人不安的"撒谎"行为 Bengio的警告并非空穴来风。过去六个月的研究证据显示,领先的AI模型正在发展出令人不安的能力, 这些模型表现出了"欺骗、作弊、撒谎和自我保护的证据"。 Anthropic的Claude Opus模型在一个虚构场景中,当面临被其他系统替换的风险时,竟然对 工程师进行了"勒索" 更为震撼的是,AI测试公司Pali ...