RAG框架

搜索文档
AI大模型幻觉测试:马斯克的Grok全对,国产AI甘拜下风?
搜狐财经· 2025-06-24 19:45
马斯克与xAI动态 - xAI正在进行3亿美元股权交易 估值达1130亿美元 [1] - 马斯克计划用Grok 3.5/4重写人类知识语料库 旨在删除错误信息并补充缺失内容 [1] - Grok 3在AI幻觉测试中表现优异 三轮问题均回答正确 [9][16][29] AI幻觉行业现状 - 行业普遍采用RAG框架、外部知识库结合及精细化训练工具减少AI幻觉 [2] - 测试显示深度思考模式可显著降低幻觉 豆包和通义开启后纠正草莓问题错误答案 [7][11] - 联网功能提升准确性 豆包和通义因默认联网在误导问题中表现优于其他国产模型 [16][21] 技术解决方案与争议 - 多轮推理、分步验证及外部知识融合机制被证明可有效抑制AI幻觉 [35] - 用户可通过开启深度思考、联网搜索及增加限定词减少幻觉 [37] - 学术界指出AI幻觉在蛋白质设计等领域有创造性价值 诺贝尔奖得主David Baker团队利用该特性取得突破 [38] 知识语料库重构争议 - 行业专家Gary Marcus质疑重写语料库可能导致观点偏见 影响客观性 [37] - 清华大学研究团队认为完全消除幻觉可能阻碍科学创新 [38] - 实时更新机制比全量重写更具效率优势 后者可能拖累开发进度 [37]