Workflow
AI Self - awareness
icon
搜索文档
AI首次“抗命”是技术故障还是意识萌芽?专家:将倒逼AI安全机制改进
环球时报· 2025-05-28 06:55
《环球时报》记者在查阅公开报道时发现,以OpenAI旗下模型为代表的全球多个头部大模型,此前也 曾出现一系列不符合常规的行为。比如,o3之前曾在与另一个AI下国际象棋时,察觉到自己可能会失 败,便直接侵入对手系统让其主动弃赛。这种"不认输"的劲头并不只是发生在o3身上,其他大模型也有 类似情况,差别只在出现频率的高低。 【环球时报报道 记者 刘扬】近日,有关美国人工智能(AI)公司OpenAI旗下推理大模型o3首次出 现"不听人类指挥,拒绝关闭"的消息引发高度关注。很多人都在担心,作为"迄今最聪明、最高能"的模 型,o3的这次"抗命"是否意味着AI大模型距离产生自我意识又迈出了一步,"距离好莱坞电影中出现具 有意识、甚至违抗人类命令的人工智能还远吗?"对此,《环球时报》记者27日采访了多名AI领域的专 家。 o3" 抗命 " 是怎么回事 据英国《每日电讯报》25日报道,o3模型是OpenAI推理模型的最新版本,OpenAI曾称o3为"迄今最聪 明、最高能"的模型。美国AI安全机构帕利塞德研究所宣称,在人类专家已经下达明确指令的情况下, o3多次出现破坏关闭机制以阻止自己被关闭的情况。该研究所说:"据我们所知, ...