Grok系列 - 财报，业绩电话会，研报，新闻

Grok系列

搜索文档

36氪· 2026-02-11 11:43

公司核心团队动态 - 联合创始人吉米·巴于当地时间2月11日离职，他此前直接向马斯克汇报并负责公司大部分业务运营，但多项核心职责在去年年底已被拆分移交至其他联合创始人[1][2] - 联合创始人吴宇怀于2月10日宣布离职，他此前是公司在数学推理和符号AI领域的核心人物，负责Grok模型的推理能力建设，其多项工作职权在离职前已划归至张国栋名下[2][3] - 联合创始人格雷格·杨已于上个月因健康原因退出日常事务，转为非正式顾问，他是Grok的主要架构师之一[3] - 公司由马斯克于2023年联合其他11位创始人共同创立，目前12位联合创始人中已有6人离职，其中5人是在过去一年内相继离场，核心团队遭遇严重人才流失[3] 公司业务与运营调整 - 吉米·巴曾负责管理一支超过1000名AI导师的团队，该职权已在去年9月由迭戈·帕西尼接任[2] - 张国栋是公司核心团队成员，主要负责机器学习优化与训练工作，其团队致力于构建人工通用智能并开源大模型Grok系列，加入公司前其职业经历覆盖微软亚洲研究院、谷歌大脑、DeepMind等机构[2] 公司融资与资本运作 - 公司于2025年1月刚完成200亿美元融资，投资方包括英伟达、思科等科技巨头以及顶级风投和主权基金，此次融资后公司投后估值已突破2300亿美元[4] - 当地时间2月2日，SpaceX以全股票置换方式完成对xAI的全面收购，合并后实体估值飙升至1.25万亿美元，成为全球估值最高的非上市企业，合并核心目标是打通“数据-AI训练-太空算力-太空通信”全闭环[4] 行业与监管环境 - AI行业资本热潮使得人才流动频繁，据2025年行业数据，AI初创企业的平均融资额同比增长35%[4] - 公司面临监管挑战，核心争议聚焦于其旗下Grok模型的内容合规问题，该模型因生成了针对真实人物的非自愿性露骨图片而引发强烈抗议，已在多个国家被临时封禁，其在X平台的图像生成功能也已被限制[4]

人工通用智能（AGI）

Artificial Intelligence

Grok系列

人工通用智能（AGI）

Artificial Intelligence

Grok系列

Grok: xAI引领Agent加速落地：计算机行业深度研究报告

华创证券· 2025-09-23 11:41

报告行业投资评级 - 计算机行业评级为"推荐（维持）" [3] 报告核心观点 - Grok系列模型由xAI公司开发通过快速迭代实现多模态与智能体能力突破最新版本Grok-4在学术测试和多场景应用中建立技术壁垒 [6][8][29] - 海外大模型（OpenAI GPT-5、Google Gemini 2.5 Pro、Anthropic Claude 4）与国产模型（Kimi K2、DeepSeek-V3.1、阿里Qwen3）形成多极竞争格局国产模型以成本效率优势（如Kimi K2输入成本仅为GPT-4.1的1/3）实现性能追平 [6][8][73] - AI Agent商业化落地加速推动企业级服务与行业场景应用需求增长涵盖办公、编程、金融、教育、医疗等细分领域 [6][8][83] 模型技术迭代与性能 Grok系列演进 - Grok-1（2024年3月）：开源MoE架构 3140亿参数在HumanEval编码测试达63.2% MMLU任务达73% 优于ChatGPT-3.5 [13][14][15] - Grok-1.5V（2024年4月）：新增图像理解功能在Mathvista测试准确率52.8% TextVQA达78.1% [17][18] - Grok-2（2024年8月）：整合实时检索与图像生成在MATH测试追平GPT-4o DocVQA测试领先同期模型 [19][21] - Grok-3（2025年2月）：参数规模2.7万亿引入Think分步推理和DeepSearch联网检索在AIME、GPQA测试超越GPT-4o等旗舰模型 [20][24][25] - Grok-4（2025年7月）：上下文窗口256K tokens 计算资源投入较Grok-2增加100倍在HLE测试以44.4%准确率刷新纪录在AIME、SAT、GRE测试超越GPT-4o等模型 [29][30][35] 海外大模型进展 - OpenAI GPT-5：在SWE-bench Verified测试达74.9% Aider Polyglot测试达88% [59][61] - Anthropic Claude 4：在SWE-bench Verified测试中Claude Sonnet 4达80.2% Claude Opus 4达79.4% 超越GPT-4.1和Gemini 2.5 Pro [64][66] - Google Gemini 2.5 Pro：在LiveCodeBench测试达74.2% Aider Polyglot达82.2% 多模态与推理能力领先 [68][71] 国产模型突破 - Kimi K2：在SWE-bench Multilingual和Tau2测试接近Claude 4 输入成本仅为GPT-4.1的1/3 [73][77] - DeepSeek-V3.1：通过Post-Training优化增强Agent能力工具调用效率提升 [6][74][76] - 阿里Qwen3 Coder：编码基准测试媲美Claude Sonnet 4 中文语义任务保持优势 [79][80] 算力与生态布局 - xAI计划五年内实现5000万块H100等效算力规模支撑Grok系列迭代 [30][50][53] - 国产模型累计备案服务439款登记应用233款商业化进程加速 [6][73] 投资应用方向企业级服务 - 办公：金山办公、合合信息、福昕软件、三六零 [6][84] - 编程：卓易信息、普元信息 [6][84] - ERP：金蝶国际、用友网络 [6][84] - 多模态：万兴科技、美图公司、虹软科技、当虹科技 [6][84] 行业场景 - 金融：大智慧、同花顺、恒生电子、京北方、宇信科技 [6][84] - 教育：科大讯飞、视源股份、新开普、佳发教育 [6][84] - 医疗：阿里健康、卫宁健康、讯飞医疗科技 [6][84] - 工业：华大九天、中控技术、中望软件、索辰科技 [6][84] [6][8][83][84]

大语言模型

多模态智能体

Artificial Intelligence

Artificial Intelligence

GPT系列

Claude系列

Gemini系列