Anthropic正式开源了Claude的“灵魂”
36氪·2026-01-22 21:22
随着我们离 AGI 越来越近,解决 AI 安全问题,愈发迫在眉睫。Anthropic 今天开源了全新的「AI 宪法」,可以指导全世界的模型,什么是好,什么是 坏。解决 AI 安全问题的一个重要尝试已正式诞生。 今天,Anthropic 试图向世界展示它的灵魂。 这份文件并非通常意义上的技术白皮书或用户协议,而是一份直接面向 AI 模型本身「撰写」的价值观宣言。 Anthropic 正式公布了一份长达 84 页的特殊文档——《Claude 宪法》(Claude's Constitution)。 在人工智能的发展史上,这是一个意味深长的时刻。 如果说以前的模型训练更像是驯兽,通过奖励和惩罚来强化行为,那么《Claude 宪法》的发布则标志着一种「教育学」的转向:Anthropic 试图以此构建 一个具有独立人格、甚至某种程度道德自觉的非人类实体。 从「规则」到「性格」,AI 治理的范式转移 过去,AI 公司的安全策略往往依赖于死板的规则列表——比如「不要回答关于制造炸弹的问题」。 但 Anthropic 的研究团队发现,这种基于规则的方法既脆弱又难以泛化。 规则总有漏洞,而现实世界的复杂性远超预设的清单。 《Cl ...