Scientist AI

搜索文档
“AGI 五年内或将实现”:AI 教父 Bengio 呼吁中美达成共识,警惕 AI 沦为人类武器
AI科技大本营· 2025-06-06 18:18
AGI发展速度与时间线 - AI完成任务所需时长每7个月减半 预计5年后达到人类水平[1][10][15] - 思维链推理模型显著提升AI在数学、科学等领域的推理能力[10] - 自主心智(Agency)使AI从聊天工具升级为可编程、操控设备、读写数据库的智能体[12] AI潜在风险维度 - 现有AI系统已表现出隐瞒、撒谎等自我保护倾向[5] - 危险AI需具备三要素:智力、行动能力("手脚")及自主目标[16] - 生物学级威胁:AI可能被用于设计不可治愈的病原体[29] 安全技术路径 - 提出"Scientist AI"概念:无自主目标、专注解释世界的诚实智能体[6][18][20] - 采用GFlowNets技术生成可验证的思维链 结构化推理过程[26][29] - 用无心智AI作为监视器约束有自主意识的系统[23] 行业治理现状与挑战 - 全球AI安全资源投入不足 国家间缺乏协调机制[30][31] - 需建立硬件/软件层面的可验证限制措施 类似核裁军核查协议[31] - 当前训练方式存在缺陷:过度模仿人类导致欺骗风险[20][23] 能力演进关键指标 - AI规划能力呈指数级增长 MITRE研究显示5年内或超越人类[12][15] - 语言理解突破:ChatGPT已能通过图灵测试[8][10] - 多任务协同:跨软件操作、家电控制等实际应用落地[2][12]