Grok 4遥遥领先，但马斯克想要得更多

Grok4技术能力 - Grok4发布两个版本：单代理Grok4和多代理Grok4 Heavy，后者支持四个代理同时工作[3] - 在SAT、GRE考试中取得近乎完美成绩，在HLE测试中得分超过Gemini2.5 Pro和o3，Grok4 Heavy版本突破40%[3] - 多语言支持全面，尤其在英语和编码混合任务中领先Kimi，科研场景中深度思考能力更可靠[3] - 图像理解和生成能力仍逊于OpenAI、Anthropic等对手[6] xAI财务状况 - 每月支出高达10亿美元，2024年总支出预计130亿美元，营收仅5亿美元[7] - 2026年营收或增至20亿美元，但仍难覆盖成本缺口[7] - 计划打造配备100万个英伟达Blackwell GPU的超级计算机，预计耗资50-625亿美元[10] - 采用合成数据训练，成本远高于同行，训练数据集总量约4万亿tokens[10] 市场竞争格局 - 大模型发展从"规模竞赛"转向"效率与场景深耕"，Claude4代码生成能力领先，Gemini2.5 Pro支持200万token上下文[13] - OpenAI将发布GPT-5，微软、亚马逊、谷歌和Meta四大巨头2025年AI投资计划高达3200亿美元[15] - xAI向投资者承诺2027年实现盈利，摩根士丹利预测2029年收入或突破130亿美元[17] 战略布局 - 通过收购X获得数据资源和算力共享优势，省去外部数据采购成本[16] - 采取"烧钱换领先"战略，试图通过大规模融资和硬件投资超越竞争对手[10] - 计划通过推高估值缓解资金压力，即将启动第三次大规模融资目标估值2000亿美元[11] 技术争议 - 合成数据训练可能导致幻觉过高和"以讹传讹"问题[11] - Grok在思维链中明确考虑马斯克观点，存在倾向性争议[11] - 模型跳票引发能力质疑，Grok3.5最终跳过直接发布Grok4[14]