马斯克 xAI 新模型 Grok 4.2 上线:通过“50 米外洗车店”测试,回答偏好高度贴合老马本人
搜狐财经·2026-02-19 13:32

公司动态与产品发布 - xAI公司正式发布了其大型语言模型Grok 4.2的公测Beta版本 [1] - 尽管公司近期经历了联合创始人接连离职等人员动荡,但新产品仍按计划推出 [4] - 马斯克通过社交媒体积极为新产品进行公关,表示公测将持续到下个月,并承诺正式版将比Grok 4“快得多,也聪明得多” [2] - 公司计划在公测结束后推出Grok 4.2的中型和大型版本,当前公测版为5000亿参数的“小”版本 [18] 产品技术规格与性能 - Grok 4.2模型的参数量为5000亿,相较于当前动辄数万亿参数的竞争对手模型显得较为克制 [1] - 模型底层架构具备每周自我迭代的能力,计划实现每周更新 [3] - 此次升级引入了快速学习能力,模型可以基于实时反馈持续优化,与以往版本的静态更新逻辑不同 [8] - 在预测能力上,公司声称Grok 4.2成功击败所有AI,横扫各大榜单 [4] - 模型通过了近期流行的“50米外有个洗车店”等逻辑测试,并在“Caitlyn Jenner”的AI测试中表现优于ChatGPT和Gemini [5][16] - 公司同时推出了“Grok imagine”视频生成功能,目前iOS平台可用 [18] 市场反馈与用户评价 - 市场对Grok 4.2公测版的反馈呈现两极分化,既有盛赞也有批评 [1] - 批评者认为实际体验未达预期,特别是在处理高难度逻辑推理时,5000亿参数可能不够用,且使用成本较高 [12] - 有用户和开发者质疑其“横扫榜单”的表现可能是在特定的实验室优化环境下取得 [12] - 尽管马斯克宣称模型无偏见,但测试显示其许多回答偏好高度贴合马斯克本人 [13] - 支持者则称赞其代码功能和多模态能力,并对部分测试中的表现表示满意 [13] 产品发布背景与策略 - Grok 4.2的发布过程多次推迟,自去年12月起马斯克便开始频繁预热,但发布时间一再延后 [4] - 在联合创始人离职引发舆论担忧产品可能“胎死腹中”时,马斯克紧急召开发布会稳定市场预期 [4] - 目前发布的公测Beta版并非默认版本,用户需要手动选择才能使用 [8] - 公司尚未发布详尽的技术报告,关于模型底层训练细节、数据构成和具体基准测试表现的信息有限,导致讨论更多停留在体验层面 [10]

马斯克 xAI 新模型 Grok 4.2 上线:通过“50 米外洗车店”测试,回答偏好高度贴合老马本人 - Reportify