Workflow
AI伦理评估
icon
搜索文档
前瞻人工智能安全评估体系与基座平台入列北京人工智能前沿成果
新京报· 2026-01-05 12:37
北京人工智能安全治理前沿成果发布 - 2026年1月5日,北京举办人工智能创新高地建设推进会,会上发布了包括“前瞻人工智能安全评估体系与基座平台”在内的8大前沿成果 [1] 前瞻人工智能安全评估体系与基座平台 - 该平台由北京前瞻人工智能安全与治理研究院发布,旨在以安全为基石引领人工智能稳健发展 [1] - 体系打破传统单一维度局限,构建了全领域、多层次的评估框架 [1] - 覆盖范围根植基础安全,并延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度 [1] - 评估覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等多个关键领域 [1] - 评估重点聚焦隐私与数据保护、滥用恶用、身心伤害、虚假信息防范、自主人工智能高阶风险等核心痛点 [1] 人工智能模型安全现状与防御方案 - 测试发现近年大模型安全性未明显提升,部分新近模型的攻击成功率甚至更高 [2] - 验证结论表明,模型防御不一定需要重新训练,在在线推理阶段部署安全护栏即可显著提升安全水平 [2] - 针对各类风险,研究院打造了“前瞻灵御”AI安全攻防平台,为企业提供标准化评估流程、全面安全分析及针对性防御方案 [2] 前瞻灵度AI伦理评估平台 - 该平台专注于AI伦理的智能评估与价值校准 [2] - 能够对上百个大模型进行实时动态监控与并行测试 [2] - 评估维度涵盖六大维度、90个细分类别的伦理合乎度 [2] - 平台集成了以中国价值观为核心的大规模中文价值语料库,覆盖3个层面、12个核心价值、50个衍生价值,累计超过25万条规则 [2] - 收录了全球200余项伦理原则与规范,以及40余项中英文法律法规与国际公约,提供精准合规指引 [2] - 可对人工智能、数据安全、神经科学、脑机接口、医疗健康、生物安全、危险化学物质、核物质、自动驾驶等领域进行自动化伦理评估辅助 [2] 人工智能安全治理的核心定位 - 研究院认为人工智能安全应成为“第一性原理”,是不可删除、无法违背的底线要求 [3] - 安全治理能力基座的构建是北京引领人工智能稳健发展的基础,旨在安全地将AI应用于现代化建设并与世界共享发展成果 [3]