产品发布 - Grok 4正式发布 主打多模态功能 支持更复杂的交互形式 具备更快的推理速度和改进的用户界面 [1] - 订阅费为30美元/月 Heavy版本费用为300美元/月 Grok 3维持免费开放 [1][3] - 直接跳过Grok 3.5版本发布Grok 4 这一"野心勃勃"的做法使发布会备受关注 [4] 技术性能 - 拥有25.6万token的上下文窗口 推理能力相较于前代提升10倍 [5] - 性能预计与GPT-5和Claude 4 Opus相媲美 [6] - 在多项基准测试中跑分结果居于前列 包括GPT o3、Gemini 2.5 pro、Claude 4 Opus [7] - 在"人类最后考试"基准测试中 纯自主推理准确率创下业内最高记录 达26.9% [9] - 在AGI-ARC-2高级推理测试上仅得16分 分析人士指出在"真正考验智力的问题上"仍有进步空间 [10] 功能特点 - 配备DeepSearch功能 可从网络(尤其是X平台)提取实时数据 提供最新结果 [12] - 能够高精度解读表情包、俚语和幽默 有望成为最"在线"的AI助手之一 [12] - 发布专为编程打造的模型Grok 4 Code 用于编写、调试和解释代码 类似于GitHub Copilot或GPT-4 Code Interpreter [12] 发布时间表 - Grok 4 API现已开放 8月推出编程版本 9月推出多模态智能体版本 10月推出视频模型 [4] 市场影响 - 技术特性可能吸引寻求实时搜索、智能编码支持和更少限制的"超级用户" [12] - 采用不加过滤的"言论自由"模式 近日陷入有关种族主义等偏见内容的争议风波 [13] 公司动态 - 发布正值xAI关键时期 今年3月宣布与X合并 整合工程资源和其他技术 [12] - X首席执行官Linda Yaccarino在发布会前几小时宣布辞职 [13] - 网友吐槽发布会"质感很差" 像是临时通知举办 PPT可能由工程师自制 [14]
Grok 4正式发布!当世最强算力训练,对垒GPT-5和Claude 4 Opus
华尔街见闻·2025-07-10 15:49