Workflow
马斯克亮AI王牌:Grok 4.1发布,智商情商双在线霸榜,背后团队被传是“全华班”
搜狐财经·2025-11-18 14:54

产品发布与性能 - 公司发布新一代大模型Grok 4 1,包含Grok 4 1 Thinking(推理)和Grok 4 1(非推理)两个版本[2] - 新模型已向全网用户开放,可在官网、X平台及iOS和Android应用中免费体验[2] - 在LMArena大模型排名榜单中,Grok 4 1 Thinking以1483分的成绩位列全球第一,超越第二名Gemini 2 5 Pro达31分,非推理版Grok 4 1排名第二[2] - 在情商测试EQ-Bench3中,Grok 4 1 Thinking以1586分霸榜,Grok 4 1位居第二[3] 技术能力提升 - 模型情商进步明显,具备更高理解力、洞察力、同理心和人际交往能力,对比上一代成为更具耐心的倾听者且共情能力凸显[3][4] - 创意写作能力较上一代提升600分,语言表达流畅有画面感[5] - 基于训练方法优化,模型幻觉率从12 09%降至4 22%,比之前降低了3倍[5] - 在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征[6] 研发与团队 - 新模型改进主要在强化学习上,将RLHF推向新高度,团队利用用户真实对话偏好和智能体奖励模型对算法进行全面改进[7] - 强化学习的规模扩大10倍,由十几人团队完成[7] - 公司人才战略引人注目,团队合影显示多为华人面孔,有消息称已辞退Grok团队最后一名白人成员,打造“全华班”[7] 未来产品规划 - 公司推迟发布Grok 5,部分原因在于开发过程中的资源限制和极其严格的测试需求[9] - Grok 5预计拥有约6万亿参数,训练和优化需要巨大计算能力,将成为世界上最智能的人工智能,作为迈向AGI的关键一步[9] - Grok 5全面测试和开发工作需要更多时间以达到高标准,预计明年发布[9] 行业竞争与定位 - 本次发布是技术迭代,也是公司AI战略的强力宣言,为Grok 5和实现AGI目标铺设道路[9] - 有业内人士认为该模型可能不是今年最好的型号,期待谷歌即将发布的Gemini 3 0模型表现[9]