Workflow
xAI发布Grok 4.1:速度、质量与情感智能全方位升级,幻觉率大幅降低
36氪·2025-11-18 08:23

当地时间11月17日,xAI正式发布Grok 4.1。版本已面向grok.com、X平台以及iOS、Android应用的所有用户开放,包括免费用户,并在 Auto模式中默认启用。 Grok 4.1在最近一轮静默测试(11月1日至14日)中,盲评偏好率达到64.78%,明显高于前代版本。 xAI创始人埃隆·马斯克(Elon Musk)称,用户将"明显感受到速度与质量上的提升"。与以往着重算力或规模的更新不同,Grok 4.1把重 点放在三个直观但极具难度的方向:更快的响应、更高的事实准确性,以及更自然、更具个性的对话体验。 性能提升:更少幻觉、更准事实、更强风格控制 Grok4.1在信息查询的测试中表现突出。官方数据显示:Grok4.1的幻觉率从12.09%降到4.22%,减少近三倍;FActScore从9.89%降至 2.97%,同样呈显著提升。在当前大型模型普遍存在事实不稳定问题的背景下,这是一次真正的结构性升级。 xAI表示,Grok4.1性能提升得益于强化学习基础设施与新的奖励模型体系:Grok 4.1使用"前沿推理模型"作为奖励模型,让模型能自主评 估并快速迭代。这意味着训练不再过度依赖大规模人工标注 ...