Workflow
Grok-4,马斯克口中地表最强AI
搜狐财经·2025-07-11 20:58

xAI公司及Grok-4发布 - xAI公司成立于2023年7月12日,目标是解决复杂科学和数学问题并理解宇宙 [3] - 2025年1月16日推出网页版Grok AI聊天机器人,2月17日发布Grok-3,7月10日发布Grok-4 [5] - Grok-4系列包含Grok-4和Grok-4 Heavy两个版本,月费分别为30美元和300美元,Grok-3维持免费 [5] Grok-4技术性能 - 在GPQA测试中得分88.9%,AIME25得分100%,LiveCodeBench得分79.4%,HMMT25得分96.7%,USAMO25得分61.9% [8] - 在人文学科终极考试HLE中,Grok-4 Heavy实现最高44.4%准确率,在所有领域达到博士级别 [10] - 在ARC-AGI-2测试中拿到15.8%准确率,是过去三个月唯一突破10%的模型 [12] Grok-4技术进展 - 从Grok-2到Grok-4,训练量提升100倍,强化学习推理投入大量计算资源 [15] - 将工具使用直接纳入训练过程,显著提高模型使用工具能力 [15] - 计划与特斯拉擎天柱机器人结合,实现与现实世界互动能力 [16] 多智能体与商业应用 - Grok-4 Heavy是多智能体版本,可多个智能体协作解决问题 [18] - 在售货机基准测试中创造的美元价值是第二名两倍,预计100万台自动售货机年赚47亿美元 [20][22] - 语音模式改善,端到端延迟降低2倍,提供5种声音,活跃用户增长10倍 [19] 未来发展规划 - 预计未来三到四周开始用超过10万个GB200芯片训练视频模型 [25] - 计划推出AI制作的视频游戏、电视节目和电影 [23] - 最终目标是实现"像素输入,像素输出"的多模态能力 [23] AI发展愿景 - 让AI极致追求真相是安全发展的根本原则 [28] - 计算能力加正确工具将使AI能与物理世界互动 [28] - 未来可能达到卡尔达舍夫Ⅱ型文明等级 [28]