马斯克悄然发布Grok 4.1,霸榜大模型竞技场所有排行榜
量子位·2025-11-18 08:59
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,马斯克发布Grok 4.1,同时霸榜大模型竞技场的第一和第二。 怎么做到的? Grok 4.1思考模式 以1483的Elo分数稳居榜首,领先非xAI模型中的最高分整整31分。 Grok 4.1非思考模式 以1465分拿下第二名,超越了公开排行榜上所有其他模型的完整推理模式。 | Rank 14 | Rank Spread O (Upper-Lower) | Model 14 | Score ↓ | 95% Cl (±) 11 | Votes 11 | Organization 1J | License 11 | | --- | --- | --- | --- | --- | --- | --- | --- | | 1 | 1 4-12 | X grok-4.1-thinking | 1483 O Preliminary | ±11 | 3,298 | ×AI | Proprietary | | 2 | 1 < > 4 | XI grok-4.1 | 1465 O Preliminary | ±11 | 3,413 | ×AI | Proprietar ...