Workflow
Grok 4长流程工作应用潜力初显 带动AI Infra与算力需求
智通财经网·2025-07-12 15:50

Grok 4发布与性能升级 - Grok 4正式发布并开放使用 包括Grok 4和Grok 4 Heavy两个版本 B端API定价输入3美元/百万Tokens 输出15美元/百万Tokens 较o3贵50% C端30美元/月订阅可使用Grok 4 Heavy版本需300美元/月 [2] - 专业学科和复杂任务推理能力大幅提升 在HLE测试集中正确率从不使用工具的26 9%提升至使用工具的41 0% 加大RL算力投入后达50 7% 较此前SOTA模型21 6%翻倍增长 [3] - 在商业环境测试Vending-Bench中得分是第二名Claude Opus 4的两倍 在GPQA等专业测试集中4项夺冠 AIME25与HMMT25分别获100%/96 7%接近满分表现 [3] 技术突破与算力需求 - 训练量较Grok 2提升100倍 较Grok-3后训练强化学习计算量提升10倍 Grok 4 Heavy通过提高RL算力投入验证Test time computing有效性 推理性价比显著高于此前所有模型 [4] - 工程创新包括预训练阶段学习使用工具提升推理表现 以及在后训练强化学习中找到可靠奖励信号方案 为后续模型推理能力升级提供新思路 [4] 多模态与交互升级 - 发布新语音助手Eve 对话延迟降低一半 用户使用时长提升10倍 音色语气与真人高度相似 具备模仿耳语或演唱功能 [5] - 展示游戏开发潜力 设计师4小时内利用AI制作简单第一人称射击游戏 视觉能力仍不足 预计数周至数月内改进 计划8月发布代码模型 9月发布多模态智能体 10月发布视频生成模型 [5] 投资主线梳理 - 建议关注三条投资主线 1)通用管理软件 2)工具软件和其他重点行业软件 3)AI基础设施 [1]