马斯克xAI新模型上线,通过“50米外洗车店”测试,回答偏好高度贴合老马本人
量子位·2026-02-18 14:56

Grok 4.2模型发布与核心特性 - xAI公司发布了其新模型Grok 4.2的公测Beta版 [2] - 该模型参数规模为500B(5000亿),相较于当前动辄数万亿参数的模型方阵显得较为克制 [3] - 模型底层架构具备每周自我迭代的能力,未来将实现每周更新 [9] - 此次升级首次引入快速学习能力,模型可以基于实时反馈持续优化 [21][22] - 模型支持基于实时反馈的持续优化,能像人类一样在实践中快速进化 [23] - 目前发布的Grok 4.2是500B参数的“小”版本,中、大型版本将在稍后推出 [45] 发布背景与市场反应 - 模型的发布过程多次推迟,曾因xAI联合创始人接连离职,外界一度认为项目可能终止 [12][13][14] - 发布后,市场和用户反馈呈现两极分化,既有盛赞也有质疑 [4] - 部分深度用户和开发者认为其实际体验,尤其是在高难度逻辑推理方面,未达预期,500B参数被认为不够用 [31] - 有观点认为,其低调发布可能是因为模型能力无法与OpenAI和Anthropic的最新模型相媲美,且成本更高 [32][33] - 同时也有用户称赞其代码功能和多模态能力 [36][38] - 有测试显示,Grok 4.2通过了特定的“Caitlyn Jenner”AI测试,而ChatGPT和Gemini在此测试中失败 [40] 公司领导层动态与公关 - 面对质疑,公司创始人马斯克通过社交媒体进行了积极的公关回应 [5][6] - 马斯克亲自发推表示,公测将持续到下个月,结束后Grok 4.2将比Grok 4更快、更聪明,并承认目前仍有bug需要修复 [8] - 马斯克在发布会上曾宣称,Grok 4.2在预测能力上成功击败所有AI,横扫各大榜单 [15] - 有测试指出,Grok 4.2的回答偏好高度贴合马斯克本人,这与马斯克宣称的“无偏见模型”存在出入 [34] 产品细节与可用性 - Grok 4.2公测Beta版并非默认版本,用户需要手动选择才能使用 [19] - 公司同时推出了“Grok imagine”视频生成模版,目前iOS系统可用 [46] - 尽管已发布,但xAI官方尚未提供详尽的技术报告,关于模型底层训练细节、数据构成和具体benchmark表现的信息仍然有限 [24][27] - 目前的讨论更多停留在用户体验层面,而非技术细节层面 [28]