Grok 4 Heavy

搜索文档
年费最高超2万元!20万GPU训出Grok 4 马斯克的“野心”被质疑 木头姐:20万亿美元蛋糕正被xAI和OpenAI等瓜分
每日经济新闻· 2025-07-10 22:37
Grok 4发布 - xAI正式发布下一代大模型Grok 4系列,包括Grok 4和Grok 4 Heavy两个版本,均为推理模型 [1][2] - Grok 4为单智能体模型,Grok 4 Heavy为多智能体版本,支持多个智能体并行思考,能够调用更大规模的计算资源 [2] - 马斯克宣称Grok 4是目前世界上最聪明的AI,在所有学科上都超越了博士水平 [1][2] - 订阅费相当昂贵,Grok 4年费300美元,Grok 4 Heavy年费高达3000美元 [1][9] 性能表现 - 大模型性能评估平台Artificial Analysis测试显示,Grok 4总成绩达到73分,领先于o3、Gemini 2.5 Pro、Claude 4 Opus等模型 [1][2] - 在"人类终极考试"中,Grok 4不使用工具得分为25.4%,使用工具后提升至38.6%,Grok 4 Heavy达到44.4% [6] - 在GPQA测试中得分接近90%,AIME25数学竞赛题上Grok 4 Heavy取得满分 [8] - 在ARC-AGI通用人工智能测试中,Grok 4得分15.9%,几乎是第二名Claude Opus 4得分的两倍 [8] - Grok 4语音能力增强,端到端延迟更低,支持五种音色 [9] 公司战略 - 马斯克计划用Grok 4重写人类知识库,补充缺失内容,纠正错误知识,再基于新的知识库重新训练AI [1][14] - xAI预计还将发布代码模型、多模态智能体以及视频生成模型 [12] - 公司正在田纳西州孟菲斯建设超算集群"巨像",已部署20万块GPU,硬件成本70亿美元,功耗达300兆瓦 [17] - 计划建设一个拥有100万块GPU的新设施 [17] 融资与市场 - xAI累计融资额已超过200亿美元 [1][17] - 凯西·伍德认为xAI有望在AI基础模型及相关市场脱颖而出,借助星链等渠道获得强大的分发优势 [17][18] - 方舟投资认为基础模型的企业市场规模将达到15万亿到20万亿美元 [18] - xAI、OpenAI和Anthropic目前在技术上处于领先地位,具有显著竞争优势 [18]
Grok 4正式发布!性能媲美GPT-5和Claude 4 Opus,史上最有“网感”的大模型?
硬AI· 2025-07-10 16:30
产品发布 - Grok 4正式发布,是最新最强大的旗舰模型[2] - 拥有25 6万token的上下文窗口,主打多模态功能[1][7] - 订阅费为30美元/月,Heavy版本300美元/月[1][5] - 推理能力较前代提升10倍,具备更快速度和改进界面[7] - 支持文本、图像和视频交互,弥补了前代弱点[7] 性能表现 - 在GRE考试中接近满分,超越人类推理水平[4] - 性能与GPT-5和Claude 4 Opus相媲美[6][8] - HLE测试中纯自主推理准确率达26 9%创纪录[10][11] - 但在AGI-ARC-2高级推理测试仅得16分[13] - 基准测试跑分结果居于行业前列[8] 功能特性 - 配备DeepSearch功能可提取X平台实时数据[15] - 能高精度解读表情包、俚语和幽默[16] - 推出专为编程打造的Grok 4 Code模型[17] - 8月推编程版,9月多模态版,10月视频版[5] 公司动态 - 正值xAI与X合并后的关键转型期[18][19] - 采用"言论自由"模式引发争议风波[20] - X首席执行官在发布会前辞职[21] - 网络争议可能掩盖技术成就[22]
Grok 4强势发布!马斯克:它是在所有学科同时达到博士后水平的唯一存在
搜狐财经· 2025-07-10 15:11
产品发布 - xAI正式发布新一代AI模型Grok 4,马斯克宣称其能力在所有学科同时达到博士后水平,并预计今年内实现科学新突破性发现 [2] - Grok 4系列分为两个版本,基础版订阅费30美元/月,Grok 4 Heavy版本300美元/月,年费超2万元人民币 [4] - 该模型已向X Premium+订阅者开放,并在"人类最后测试(HLE)"中霸榜第一 [3] 技术能力 - Grok 4 Heavy在HLE考试中斩获44.4%高分,远超此前排名第一的Gemini 2.5 Pro(26.9%)[5] - 在HMMT、USAMO、GPQA等高质量测试中包揽第一,并在AIME25数学邀请赛中取得满分成绩 [13] - 在ARC-AGI基准测试中达到SOTA顶尖水准,展示出在全新未知情境中的即时推理和学习效率 [14] - 在Artificial Analysis平台总成绩高达73分,领先于o3、Gemini 2.5 Pro等模型 [16] 技术突破 - 从Grok 2到Grok 4计算训练量提升100倍,推理能力较前代提升10倍 [9] - 采用token预测、预训练计算、预训练+RL、RL计算等不同技术范式 [9] - 语音能力较上代快2倍,支持唱歌和低语模式 [11] - 能够通过可视化完整呈现黑洞引力波模拟效果,展示多源数据采集分析能力 [8] 产品规划 - 8月将上线编程模型,9月上线多模型智能体,10月发布视频生成模型 [19] - 未来重点优化视觉能力 [19] 行业影响 - 该模型被认为改变了"大模型只是知识复读机"的刻板印象,目标是通过自主深度思考解决现实复杂问题,重写人类知识库 [8] - 行业普遍认为Grok 4已成为AI大模型能力的新标杆 [8] - 有观点认为该模型的出现标志着AGI(通用人工智能)时代的到来 [19]
马斯克xAI发布Grok 4:训练算力提升100倍,多项测试中领先第二名一倍
凤凰网· 2025-07-10 14:20
技术升级 - xAI发布新一代大语言模型Grok 4及多智能体协作版本Grok 4 Heavy,训练算力投入相比前代提升100倍[1] - Grok 4在HLE基准测试中解决25%博士级难题,Grok 4 Heavy版本提升至超过50%[1] - 模型演进过程中每代产品训练算力实现数量级提升,Grok 4强化推理和自我纠错能力[1] 技术架构 - Grok 4基于第六代基础模型构建,第七代模型将改善视觉理解能力[2] - 支持256K上下文长度的API接口,在商业场景测试中净资产收益率达竞争对手两倍[2] - 在GPQA、AIME等推理测试中领先,Grok 4 Heavy在Live Coding Bench获满分[2] 功能增强 - 工具使用能力整合进训练过程,可完成黑洞可视化、体育预测等复杂任务[2] - 语音交互延迟降低50%,新增高自然度语音选项[3] - 正在开发编程模型,计划启动视频生成模型训练,预计使用超10万张H200显卡[3] 商业化进展 - 推出Super Grok Heavy订阅服务,包含Grok 4和Grok 4 Heavy双版本[3] - API发布加速企业级应用落地,展现复杂商业环境应用潜力[2][3] 行业展望 - 传统考试测试意义减弱,现实应用效果将成为AI智能评判标准[3] - 预计Grok可能在年底或明年初实现有用技术发现,甚至发现新物理学知识[3] - 多智能体协作创新为AI技术实际应用开辟新可能性[1][3]