AI大模型学习

搜索文档
熊节:防止AI“知识污染”,警惕认知隐性陷阱
环球网资讯· 2025-08-14 06:35
县域AI应用挑战 - 约60%的县域学校设备不满足AI基础需求 [1] - 某县医院AI忽略甲亢、误推心脏检查的概率达68% [1] - AI生成的数据来源多为自媒体,缺乏权威佐证 [1] AI知识污染的系统性风险 - AI训练数据存在源头性污染,互联网信息鱼龙混杂 [2] - 现有训练数据以英文为主,导致西方视角倾向 [2] - 维基百科资料占比0.6%但权重3%,可能植入特定价值框架 [2] 后训练阶段的认知操纵 - 开源数据集中发现精心设计的反华政治诱导内容 [3] - 此类操作可能在其他AI模型中植入负面认知 [3] 实时搜索的信息质量困境 - AI从中文互联网搜索的信息质量堪忧 [4] - 存在“AI生成内容被AI引用”的恶性循环 [4] - 自媒体平台流量导向导致信息垃圾泛滥 [4] 应对污染的措施 - 计划2027年初步建成国家关键语料库 [5] - 互联网平台需承担信息治理责任 [5] - 用户需对AI信息保持审慎并多方核实 [5]