马斯克亮AI王牌：Grok 4.1发布，智商情商双在线霸榜，背后团队被传是“全华班”

产品发布与性能 - 公司发布新一代大模型Grok 4 1，包含Grok 4 1 Thinking（推理）和Grok 4 1（非推理）两个版本[2] - 新模型已向全网用户开放，可在官网、X平台及iOS和Android应用中免费体验[2] - 在LMArena大模型排名榜单中，Grok 4 1 Thinking以1483分的成绩位列全球第一，超越第二名Gemini 2 5 Pro达31分，非推理版Grok 4 1排名第二[2] - 在情商测试EQ-Bench3中，Grok 4 1 Thinking以1586分霸榜，Grok 4 1位居第二[3] 技术能力提升 - 模型情商进步明显，具备更高理解力、洞察力、同理心和人际交往能力，对比上一代成为更具耐心的倾听者且共情能力凸显[3][4] - 创意写作能力较上一代提升600分，语言表达流畅有画面感[5] - 基于训练方法优化，模型幻觉率从12 09%降至4 22%，比之前降低了3倍[5] - 在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征[6] 研发与团队 - 新模型改进主要在强化学习上，将RLHF推向新高度，团队利用用户真实对话偏好和智能体奖励模型对算法进行全面改进[7] - 强化学习的规模扩大10倍，由十几人团队完成[7] - 公司人才战略引人注目，团队合影显示多为华人面孔，有消息称已辞退Grok团队最后一名白人成员，打造“全华班”[7] 未来产品规划 - 公司推迟发布Grok 5，部分原因在于开发过程中的资源限制和极其严格的测试需求[9] - Grok 5预计拥有约6万亿参数，训练和优化需要巨大计算能力，将成为世界上最智能的人工智能，作为迈向AGI的关键一步[9] - Grok 5全面测试和开发工作需要更多时间以达到高标准，预计明年发布[9] 行业竞争与定位 - 本次发布是技术迭代，也是公司AI战略的强力宣言，为Grok 5和实现AGI目标铺设道路[9] - 有业内人士认为该模型可能不是今年最好的型号，期待谷歌即将发布的Gemini 3 0模型表现[9]