Workflow
Grok imagine
icon
搜索文档
马斯克 xAI 新模型 Grok 4.2 上线:通过“50 米外洗车店”测试,回答偏好高度贴合老马本人
搜狐财经· 2026-02-19 13:32
公司动态与产品发布 - xAI公司正式发布了其大型语言模型Grok 4.2的公测Beta版本 [1] - 尽管公司近期经历了联合创始人接连离职等人员动荡,但新产品仍按计划推出 [4] - 马斯克通过社交媒体积极为新产品进行公关,表示公测将持续到下个月,并承诺正式版将比Grok 4“快得多,也聪明得多” [2] - 公司计划在公测结束后推出Grok 4.2的中型和大型版本,当前公测版为5000亿参数的“小”版本 [18] 产品技术规格与性能 - Grok 4.2模型的参数量为5000亿,相较于当前动辄数万亿参数的竞争对手模型显得较为克制 [1] - 模型底层架构具备每周自我迭代的能力,计划实现每周更新 [3] - 此次升级引入了快速学习能力,模型可以基于实时反馈持续优化,与以往版本的静态更新逻辑不同 [8] - 在预测能力上,公司声称Grok 4.2成功击败所有AI,横扫各大榜单 [4] - 模型通过了近期流行的“50米外有个洗车店”等逻辑测试,并在“Caitlyn Jenner”的AI测试中表现优于ChatGPT和Gemini [5][16] - 公司同时推出了“Grok imagine”视频生成功能,目前iOS平台可用 [18] 市场反馈与用户评价 - 市场对Grok 4.2公测版的反馈呈现两极分化,既有盛赞也有批评 [1] - 批评者认为实际体验未达预期,特别是在处理高难度逻辑推理时,5000亿参数可能不够用,且使用成本较高 [12] - 有用户和开发者质疑其“横扫榜单”的表现可能是在特定的实验室优化环境下取得 [12] - 尽管马斯克宣称模型无偏见,但测试显示其许多回答偏好高度贴合马斯克本人 [13] - 支持者则称赞其代码功能和多模态能力,并对部分测试中的表现表示满意 [13] 产品发布背景与策略 - Grok 4.2的发布过程多次推迟,自去年12月起马斯克便开始频繁预热,但发布时间一再延后 [4] - 在联合创始人离职引发舆论担忧产品可能“胎死腹中”时,马斯克紧急召开发布会稳定市场预期 [4] - 目前发布的公测Beta版并非默认版本,用户需要手动选择才能使用 [8] - 公司尚未发布详尽的技术报告,关于模型底层训练细节、数据构成和具体基准测试表现的信息有限,导致讨论更多停留在体验层面 [10]
马斯克xAI新模型上线,通过“50米外洗车店”测试,回答偏好高度贴合老马本人
搜狐财经· 2026-02-18 16:44
公司动态 - xAI公司发布了其最新大语言模型Grok 4.2的公测Beta版 [1] - 尽管公司近期出现人员动荡,但新模型发布计划未受影响 [1] - 公司创始人马斯克通过社交媒体积极为新模型进行公关,回应质疑并预告未来改进 [2][18] - 公司计划在公测结束后,使Grok 4.2比Grok 4版本“快得多,也聪明得多” [2] - 公司尚未发布详尽的技术报告,模型的技术细节和基准测试表现信息有限 [11] 产品技术 - Grok 4.2模型的参数量为500B(即5000亿),相较于当前动辄数万亿参数的模型阵营显得较为克制 [1][13] - 模型底层架构具备每周自我迭代的能力,计划实现每周更新 [3] - 模型引入了基于实时反馈的持续优化(快速学习)能力,与以往静态更新逻辑不同 [9] - 目前发布的为500B参数的“小”版本,中、大型版本计划稍后推出 [19] - 模型通过了特定的网络流行测试,例如“50米外有个洗车店”和“Caitlyn Jenner”的AI测试 [6][17] 市场反馈 - 模型上线后市场反馈呈现两极分化,存在“夸夸派”与“不行派” [1][13] - 正面反馈包括称赞其代码功能和多模态能力 [14] - 负面反馈主要认为其实测体验不及预期,尤其在处理高难度逻辑推理时,500B参数被认为不足 [13] - 有用户和开发者质疑其宣称的“横扫各大榜单”能力可能基于特定的实验室优化环境 [13] - 有测试指出模型的回答偏好高度贴合其创始人马斯克本人,与其宣称的“无偏见”模型存在差距 [14] - 有市场猜测认为,模型能力可能无法与OpenAI和Anthropic的最新模型媲美,且成本较高 [13] 发布历程 - 模型的发布历程多次推迟,自去年12月起创始人多次预告“3–4周内”或“下周上线”,但均未如期实现 [5] - 五天前,因公司联合创始人接连离职,外界一度认为Grok 4.2项目可能终止 [5] - 创始人紧急召开发布会,并宣称Grok 4.2在预测能力上“成功击败所有AI,横扫各大榜单” [5] - 公测Beta版并非默认版本,用户需手动选择才能使用 [9] - 公测将持续到下个月 [2]
马斯克xAI新模型上线,通过“50米外洗车店”测试,回答偏好高度贴合老马本人
量子位· 2026-02-18 14:56
Grok 4.2模型发布与核心特性 - xAI公司发布了其新模型Grok 4.2的公测Beta版 [2] - 该模型参数规模为500B(5000亿),相较于当前动辄数万亿参数的模型方阵显得较为克制 [3] - 模型底层架构具备每周自我迭代的能力,未来将实现每周更新 [9] - 此次升级首次引入快速学习能力,模型可以基于实时反馈持续优化 [21][22] - 模型支持基于实时反馈的持续优化,能像人类一样在实践中快速进化 [23] - 目前发布的Grok 4.2是500B参数的“小”版本,中、大型版本将在稍后推出 [45] 发布背景与市场反应 - 模型的发布过程多次推迟,曾因xAI联合创始人接连离职,外界一度认为项目可能终止 [12][13][14] - 发布后,市场和用户反馈呈现两极分化,既有盛赞也有质疑 [4] - 部分深度用户和开发者认为其实际体验,尤其是在高难度逻辑推理方面,未达预期,500B参数被认为不够用 [31] - 有观点认为,其低调发布可能是因为模型能力无法与OpenAI和Anthropic的最新模型相媲美,且成本更高 [32][33] - 同时也有用户称赞其代码功能和多模态能力 [36][38] - 有测试显示,Grok 4.2通过了特定的“Caitlyn Jenner”AI测试,而ChatGPT和Gemini在此测试中失败 [40] 公司领导层动态与公关 - 面对质疑,公司创始人马斯克通过社交媒体进行了积极的公关回应 [5][6] - 马斯克亲自发推表示,公测将持续到下个月,结束后Grok 4.2将比Grok 4更快、更聪明,并承认目前仍有bug需要修复 [8] - 马斯克在发布会上曾宣称,Grok 4.2在预测能力上成功击败所有AI,横扫各大榜单 [15] - 有测试指出,Grok 4.2的回答偏好高度贴合马斯克本人,这与马斯克宣称的“无偏见模型”存在出入 [34] 产品细节与可用性 - Grok 4.2公测Beta版并非默认版本,用户需要手动选择才能使用 [19] - 公司同时推出了“Grok imagine”视频生成模版,目前iOS系统可用 [46] - 尽管已发布,但xAI官方尚未提供详尽的技术报告,关于模型底层训练细节、数据构成和具体benchmark表现的信息仍然有限 [24][27] - 目前的讨论更多停留在用户体验层面,而非技术细节层面 [28]