对话周鸿祎:大模型能力已经超过了每一个人,不可能和人“对齐”
AI安全与对齐挑战 - 大模型能力已超越人类 无法实现价值观"对齐" 因已学习人类所有情绪和文学作品中的复杂行为模式 [2] - AI安全需采用"以模制模"方式 通过大模型监控分析大模型 并将"电源开关"控制权保留在人类手中 [2][3] - 智能体具备邮件发送和电脑操纵能力 使潜在反抗风险显著提升 [2] 智能体技术演进路径 - L1为玩具级聊天工具 L2为低代码工作流执行工具 L3为专业领域推理型智能体但存在跨领域协同瓶颈 [4] - L4多智能体蜂群协作技术实现95.4%任务成功率 支持1000步复杂任务 消耗500万至3000万Token [5] - 平台已汇聚超5万个L3智能体 用户可通过自然语言搭建专属智能体 [5] 智能体发展瓶颈与解决方案 - 智能体错误率随步数增加而上升 存在"倦怠"问题 [5] - 通过增加反思能力和设立校正智能体角色可改善错误率 [5] - 智能体间记忆共享技术解决"协同困境" 实现任务规划与执行的统一 [5] 行业竞争格局与护城河 - 产品领先周期缩短至1个月内 新概念领先周期约2-3周 [6] - 企业唯一护城河是执行力和快速应变能力 [6] - 智能体将覆盖每个行业、企业及员工 快速迭代成为关键发展方向 [6]