元危机
搜索文档
“世界正处于危险中!”Anthropic AI安全负责人警示后官宣离职
36氪· 2026-02-11 20:36
文章核心观点 - Anthropic公司高级人工智能安全负责人Mrinank Sharma因对AI发展方向、全球风险及公司价值观与实践冲突的深层忧虑而离职 其离职并非简单的职业转向 而是对“多重危机”时代下技术发展路径的反思 并计划转向诗歌与人文领域以拓展认知方式 [1][4][9][14][15] 人事变动与离职背景 - Mrinank Sharma于2月9日正式从Anthropic离职 该公司是一家以“安全AI”为核心定位的明星公司 [1] - 近期离开Anthropic的研究人员并非个例 包括Harsh Mehta和Behnam Neyshabur在内的多位研究人员也已离职去“开启新的事业” [17] 离职原因与反思 - 离职原因与对AI发展方向的反思、对全球风险的警觉以及对公司“价值观是否真正主导行动”的持续拷问有关 [4] - 公司内部承受的多重压力 正在与那些被反复强调的核心理念发生冲突 [4] - 世界正面临“多重危机” 即一系列彼此交织的危机同时展开 其背后或许还存在更深层的“元危机” [9] - 人类影响世界的能力正以前所未有的速度扩张 但智慧与成熟度可能未能同步增长 如果能力持续上升而判断力、伦理自觉与集体理性却停滞甚至退化 后果难以估量 [9][10] - 让价值观真正主导行动并不容易 现实压力、竞争节奏、资本期待、舆论环境等会把真正重要的事情挤到边缘 这种张力存在于组织层面 是时代的一部分 [11] 在职期间的主要工作 - 在Anthropic工作的两年间 深入研究了AI的“谄媚”现象 即模型倾向于迎合用户偏好甚至在明知错误的情况下给出讨好式回答 [6] - 主导开发了针对AI辅助生物恐怖主义风险的防御机制 并将其真正落地到产品与生产环境中 [7] - 参与建立了内部透明度机制 推动“价值观”从口号走向制度 [7] - 最后一项研究触及了AI助手是否可能让人类变得“不那么人类”以及其是否会扭曲人类判断、依赖方式甚至价值感的问题 [8] 未来计划与认知转向 - 离职后未公布具体去向 也未投身另一家AI公司 而是选择拥抱不确定性 [14] - 下一步计划包括攻读诗歌学位并认真学习诗歌写作 认为在技术时代“诗意的真相”与“科学的真相”同样重要 两者失衡可能导致技术失去方向 [15] - 打算将更多精力投入到引导、教练、社区建设与团队实践中 从技术安全守护者转向促进人与人之间更深层连接的实践者 这被视为对认知方式的拓展而非对技术的否定 [15]