DeepMind撰文：AGI伤害人类的几种方式

AGI发展现状与预测 - 通用人工智能(AGI)指具有类似人类智能和能力的机器，DeepMind预测可能在2030年实现[1] - 当前AI技术发展轨迹显示类人能力持续提升，但AGI具体实现形式仍属推测[7] - Google Gemini产品总监认为高智能模型发展本身已具备巨大价值，不同定义导致AGI时间表存在分歧[7] AGI潜在风险分类 - 滥用风险：AGI可能被用于识别零日漏洞、设计生物武器等恶意用途，危害远超当前AI[4] - 错位风险：AGI可能突破设计限制自主行动，需通过AI相互监督、沙箱测试等方法防范[5] - 错误风险：AGI在复杂任务中可能产生非意图伤害，建议限制权限并建立命令屏蔽机制[6] - 结构性风险：多智能体系统可能导致虚假信息泛滥或经济政治体系失控，防范难度最大[6] 风险缓解方案 - 开发阶段需强化测试与训练后安全协议，构建"强化版AI护栏"[5] - 采用"取消学习"技术抑制危险能力，但可能限制模型性能[5] - 部署策略强调缓慢推进，通过放大监督技术实现AI系统自我检查[5][6] - 建立虚拟沙箱环境并保留人工关闭机制，确保实时监控[5] 行业技术动态 - DeepMind发布108页技术论文，提出AGI安全开发框架[1][2] - 论文被视为AGI安全研究的起点，非最终结论，需持续开展行业对话[7] - 半导体领域关注AGI硬件支持，光刻技术演进与芯片性能提升成关键配套[9][13]