正面硬刚谷歌和OpenAI!马斯克旗下xAI突然出手
第一财经·2025-11-18 16:06
文章核心观点 - xAI公司在谷歌发布新模型前夕抢先推出Grok 4 1模型 该模型在大模型竞技场文本排行榜上位居首位并在对话智能和情感理解方面树立新标准[3][5] - 新模型相比前代在用户偏好选择概率上提升至64 78% 并且在情感智能和创意写作能力方面有显著进步[5][7] - 模型性能提升的关键在于幻觉率大幅降低 从12 09%下降到4 22% 减少近三倍[8] 模型性能与排名 - Grok 4 1 Thinking版本以1483的Elo分数位居大模型竞技场文本排行榜首位 非推理模式以1465 Elo分数排名第二[5] - 在EQ-Bench3情感智能测试中 Grok 4 1的推理模式和非推理模式位居榜单前两名[6] 情感智能与交互能力 - 新模型能够更敏锐地感知细微意图 个性更加一致 同时保留前代产品的智能和可靠性[6] - 官方案例显示Grok 4 1对情绪类提示的回应更具同理心和细节 文笔也更丰富[6][7] 创意写作与表达能力 - 在创意写作任务中 Grok 4 1展现出更强的文学表达和戏剧张力 相比前代模型的常规叙述有明显提升[7] 技术优化与基础设施 - 公司沿用Grok 4的大规模强化学习基础设施 并开发新方法利用智能推理模型作为奖励模型 以优化风格和个性等不可直接验证的奖励信号[9]