AI新闻可靠性报告亮红灯,45%回答存重大错误,Gemini成重灾区
环球网资讯·2025-10-24 12:01
研究核心发现 - 主流AI聊天机器人在处理新闻内容时存在系统性缺陷,近半数回答存在重大问题,严重威胁公众信息获取质量 [1] - 一项涵盖18国14种语言的大规模研究对ChatGPT、Copilot、Gemini和Perplexity等主流AI平台进行了3000次测试 [4] - 研究结果显示45%的回答存在至少一个重大错误,81%的回答包含轻微问题 [4] 错误类型分析 - 信息来源缺失和准确性不足是两大主要问题,分别影响31%和30%的回答 [4] - AI在处理突发新闻、复杂时间线和需要区分观点的事实类问题时表现尤为薄弱 [4] - 研究负责人指出这些错误具有系统性、跨国界和多语言特性 [4] 平台性能对比 - Google Gemini的错误率高达76%,是其他测试产品的两倍多 [4] - 尽管与半年前相比部分模型有所改进,但错误率依然高企 [4] 市场使用趋势 - 使用AI获取新闻的用户数量在一年内翻倍,在阿根廷、美国及18-24岁年轻人中渗透率最高 [4] - 48%的年轻用户依赖AI来简化新闻理解 [4]