马斯克开始疯狂剧透Grok 5了

Grok模型性能突破 - Grok 4模型在ARC-AGI基准测试v1版本获得66.7%准确率，v2版本获得16%准确率，超越GPT-5的65.7%和9.9%以及Claude Opus 4的35.7%和8.6% [11] - 研究人员基于Grok 4采用程序合成技术微调后，在ARC-AGI v1版本准确率提升至79.6%，v2版本提升至29.44% [11] - 通过优化技术方案，单个任务平均成本显著降低，v1版本从8.42美元降至2.56美元，v2版本从30.4美元降至3.97美元 [13] Grok 5发展预期 - Grok 5预计在几周内开始训练，计划于今年年底前推出 [15] - 公司认为Grok 5有10%或更高可能性实现AGI [14] - Grok 5将使用比前代更多的训练数据，Grok 4的训练量已是Grok 2的100倍、Grok 3的10倍 [15] 公司资源投入 - 公司拥有独特的数据收集体系，包括xAI的直接数据、特斯拉FSD摄像头图像数据和擎天柱机器人生成数据 [18] - 计划5年内部署相当于5000万台H100 GPU的算力资源 [18] - 专门为Grok打造的Colossus超级计算集群已部署约23万张GPU，其中包括3万张NVIDIA GB200 [18]