通用人工智能（AGI） - 财报，业绩电话会，研报，新闻 - Reportify

通用人工智能（AGI）

搜索文档

谷歌抢跑L3级AI，Gemini连续工作40分钟，Agent自动生成评审百条创意

36氪· 2025-11-19 16:03

核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力，在AI代理自主执行任务方面取得显著进展，向OpenAI定义的L3级代理型AI迈出重要一步[1][15] - 该系统能连续运行40分钟处理同一任务，通过生成—竞争—筛选流程产出结构化结果，提升了任务复杂度和人机协作效率[2][7][10] 技术能力突破 - 单次推理可持续时长达到40分钟，结合对抗式生成产出结构化、有洞见的内容[10] - 多智能体系统整合工作流、长时思考、对抗式生成，用时间换取输出质量[7] - 系统可大规模生成100+条初始创意，并由多个Agent以竞赛方式评分排序，最终提供包含概述、细节、评论及完整评审记录的报告[2][7] 应用场景 - 创意生成：用户提供主题后，系统启动多智能体竞赛流程生成并排序相关创意[9] - 合作科研：用户指定研究主题并提供数据，由智能体生成和评估科研类任务创意[9] - 文档对话智能体：允许用户上传最大30MB的PDF文件，直接与文档内容对话，从长文档中提取高质量结论[12][14] 行业意义与发展前景 - 此次尝试被视为向L3级人工智能产品迈进的重要探索，L3的核心在于代理能力及长时间自主运行[14][15] - 有推测指出，明年可能出现连续工作3小时的Agent，Anthropic给出的时间线是2026年实现连续工作8小时[15][17] - 随着合作科研功能进一步开发，Gemini可能触及L4（创新者）门槛[18]

L3级人工智能

通用人工智能（AGI）

L3级人工智能

通用人工智能（AGI）

新模型“屠榜” 对话谷歌团队：AI“新旗手”如何诞生

第一财经· 2025-11-19 12:41

产品发布与市场定位 - 谷歌正式发布Gemini 3，定位为一次重大升级而非小修小补，旨在开启“智慧新纪元”并实现全面领先 [1] - 公司态度高调，官方博客多次强调“最佳”和“最先进”，CEO桑达尔·皮查伊在社交媒体上连发8条帖子介绍产品 [1] - 新模型被定义为能将“任何想法变为现实”，其强项在于处理多步骤复杂任务 [8][14] 性能表现与基准测试 - Gemini 3 Pro在几乎所有主流基准测试中实现全面领先，业内预言未来六个月内很难有公司能超越此成绩 [1][6] - 在“人类最后一次考试”中，Gemini 3 Pro在不使用工具的情况下得分为37.5%，显著高于GPT-5.1的26.5% [7][8] - 在GPQA Diamond测试中得分达91.9%，高于GPT-5.1的88.1% [7][8] - 在多模态理解测试MMMU-Pro和Video-MMMU中分别取得81.0%和87.6%的成绩，刷新纪录 [7][8] - 在数学竞赛AIME 2025测试中，不使用工具时得分95.0%，使用代码执行时达到100% [7] - 在代理任务Vending-Bench 2中，平均净值达5,478.16美元，远超Claude Sonnet 4.5的3,838.74美元和GPT-5.1的1,473.43美元 [7] 实际应用与用户体验 - 用户实测反馈积极，例如在生成高难度光影质感海报和复刻Mac OS网页等任务上表现超出预期，进步速度惊人 [9] - 产品团队提及的“顿悟时刻”包括其出色的代码生成能力，能根据简单提示生成各类游戏和3D可视化内容 [12] - 智能体模式已应用于实际场景，如帮助谷歌高管整理每日50多封邮件，以及筛选并购买演唱会门票 [12][13] 商业化与生态整合 - 发布首日即将Gemini 3整合进谷歌搜索，为其带来强推理能力并解锁新的生成式UI体验，例如可交互的物理学三体问题模拟界面 [15] - 推出全新的“类IDE”AI编程产品Antigravity，旨在让智能体代表用户自主规划和执行复杂的端到端软件任务 [18] - 官方公布Gemini月活跃用户已超过6.5亿，超过1300万名开发者基于其构建应用，搜索中的AI概览功能月用户超20亿 [20] 技术优势与行业影响 - 公司认为其从追赶到领先的反超得益于差异化的全栈式技术方案，涵盖从硬件（如TPU芯片）、计算集群到前沿研究的各个环节 [4][21] - 公司认为技术进步不仅体现在新能力的诞生，更体现在“模型能赋能的新场景”上，AI在日常工作中的影响力正日益扩大 [4][22][23] - 此次发布被市场视为可能改写AI竞争格局，使公司有机会从追赶者变为领先者，尤其对比被指“噱头大于实际”的OpenAI GPT-5 [19] - 发布引发资本市场积极反应，Loop Capital将谷歌母公司评级上调至“买入”，目标股价调高至320美元，公司市值曾突破3.5万亿美元创历史新高 [20]

谷歌(US:GOOG)

通用人工智能（AGI）

缩放定律（Scaling laws）

通用人工智能（AGI）

缩放定律（Scaling laws）

新模型“屠榜”，对话谷歌团队：AI“新旗手”如何诞生

第一财经· 2025-11-19 12:33

模型性能突破 - 新模型在几乎所有主流基准测试中实现全面领先，大模型竞争格局可能就此改写，甚至有业内人士预言未来六个月内很难有公司能够超越这一成绩 [1] - 在“人类最后一次考试”基准测试中，新模型在不使用工具的情况下取得37.5%的成绩，领先第二名GPT-5.1的26.5%约10个百分点 [6] - 在衡量研究生水平推理的GPQA Diamond测试中，新模型得分达到91.9%，高于GPT-5.1的88.1% [6] - 在多模态理解和推理方面，新模型以81%的MMMU-Pro分数和87.6%的Video-MMMU分数刷新纪录 [6] - 在数学能力测试AIME 2025中，不使用工具时达到95.0%，使用代码执行时达到100% [5] - 在竞技编程LiveCodeBench Pro测试中，新模型Elo评级达到2,439，显著高于GPT-5.1的2,243 [5] 实际应用与用户体验 - 用户测试反馈显示，新模型在图像生成和复杂网页复刻等任务上表现超出预期，有用户表示“亲眼看新模型一口气写完一个web操作系统，脑子里嗡嗡的” [7] - 产品团队在训练过程中发现，新模型在代码生成方面表现惊人，只需简单提示就能生成各类游戏，并能生成可交互的3D可视化内容 [10] - 公司高管透露已使用新模型的智能体功能处理日常任务，如整理邮件收件箱和购买演唱会门票，能自动提炼待办任务、筛选邮件并完成票务组合筛选 [11] - 公司期望用户能用新模型处理生活中遇到的“多步骤复杂的任务”，这是该模型的强项 [12] 商业化与生态整合 - 在发布第一天就将新模型整合进搜索引擎，为其带来很强的推理能力并解锁新的生成UI体验，例如用户询问物理学三体问题可直接得到可交互的模拟界面 [13] - 同步发布全新的“类IDE”AI编程产品Antigravity，押注编程领域，智能体可以代表用户自主地规划和执行复杂的端到端软件任务 [16] - 月活跃用户已超过6.5亿，有超过1300万名开发者正基于该模型构建应用，而由该模型支持的搜索AI概览功能每月用户量超过20亿 [18] - 公司母公司的股价被机构上调目标至每股320美元，市值一度突破3.5万亿美元创历史新高，目前维持在3.43万亿美元的历史高位 [18] 技术优势与发展战略 - 公司能在三年间完成从追赶到领先的反超，核心原因之一是团队保持极快的发展节奏，并拥有差异化的全栈式技术方案，从硬件基础设施、自研TPU芯片到大规模训练和前沿研究环环相扣 [19] - 公司认为技术进步不一定体现在全新能力的诞生，更体现在“模型能赋能的新场景”上，从预训练到后训练的整个开发流程中都看到了全方位的积极进展 [20] - 此次模型被视为公司迈向通用人工智能的下一步，目前这一步比同类竞争对手更快 [21]

谷歌(US:GOOG)

通用人工智能（AGI）

通用人工智能（AGI）

Gemini3发布后哈萨比斯首发声：谷歌重回第一阵营，但AI确实有泡沫

36氪· 2025-11-19 11:06

产品发布与定位 - 公司发布旗舰AI模型Gemini 3 Pro，被业界视为其在经历Bard失败和追赶阶段后，重新夺回技术与产品领先地位的里程碑[1] - 新模型的核心定位是“超级工具”而非情感伴侣，旨在帮助用户高效完成日常任务，提升生产力，其价值更接近初代谷歌搜索的核心价值——效率[11] - 公司正将Gemini 3快速推向搜索、Gmail、Workspace、Maps、YouTube、Android等拥有数十亿用户的产品中，以重塑竞争壁垒[1][13] 技术能力与突破 - 在多步推理能力上实现突破，新模型能可靠地完成10到15步的连贯推理任务，例如复杂税务规划或对拥有数百万行代码的系统进行全面调试，而前代模型常在5、6步时出现错误[6] - 新模型具备大规模生成全新交互界面的能力，可根据用户自然语言提示实时生成可操作的定制化软件组件，如投资组合仪表盘，标志着从“回答问题”向“构建体验”的跃迁[4][7] - 在编码能力上投入巨大，尤其在前端与“氛围编码”方面，能根据自然语言提示生成功能完整、设计优美的用户界面代码[7] - 在被称为“人类终极考试”的跨学科博士级难题集上，Gemini 3得分从Gemini 2.5 Pro的21.6%提升至37.5%，在所有公开基准测试中均大幅超越前代[5] 市场竞争与战略优势 - 公司认为其在AI竞赛中的全栈优势是关键，包括在定制化TPU芯片上的效率优势、规模化分发能力以及将AI模型深度整合进数十亿用户产品的网络效应，这些构成了无法逾越的护城河[13] - 公司对当前进步速度表示满意，并强调从未失去研究领先地位，当前是产品落地终于跟上研究步伐[13] - 针对规模定律与回报递减的争论，公司认为虽然性能提升的边际效益不如早期呈指数级增长，但新模型带来的实用性增量和可靠性提升仍远高于边际成本，规模定律依然有效[13] 行业发展与公司前景 - 公司判断通用人工智能仍需5至10年及1至2次重大研究突破，Gemini 3的发布完全符合预期发展轨迹，并未改变这一时间表[2][8] - 要实现通用人工智能，仍需在一致性、推理深度、记忆机制以及物理世界建模上取得关键突破，特别是需要从“系统1思维”解锁“系统2思维”[9] - 对于AI泡沫，公司认为部分领域（如无实际产品的高估值初创公司）确实存在泡沫，但公司同时拥有搜索、Workspace、云TPU等短期变现能力，以及在机器人、游戏、药物发现等长期万亿级新赛道上的布局，使其在任何市场环境下都将胜出[2][14]

通用人工智能（AGI）

通用人工智能（AGI）

无需代码30秒手搓应用，蚂蚁灵光成了C端AI应用黑马？

观察者网· 2025-11-19 10:52

产品发布与定位 - 蚂蚁集团于11月18日正式发布全模态通用AI助手“灵光”，这是一款面向C端的独立AI应用 [1] - 该产品是蚂蚁集团AGI（通用人工智能）战略的产品级探索，已同步登陆安卓与苹果应用商店 [20] - 与豆包、元宝、千问、Kimi等C端AI应用形成竞争，但主打全模态特性和无代码编程功能 [1] 核心功能特点 - 灵光是业内首个全代码生成多模态内容的AI助手，支持3D、音视频、图表、动画、地图等全模态信息输出 [1][20] - 首批上线三大功能：“灵光对话”、“灵光闪应用”、“灵光开眼” [1][20] - 开创性地在移动端实现“自然语言30秒生成小应用”，并且可编辑、可交互、可分享 [1][20] 交互与内容生成能力 - 对话功能突破传统文字问答模式，通过结构化思维和生成可视化内容（如动态3D模型、可交互地图）让内容呈现更生动 [1] - 具备“闪应用”功能，可通过文字对话在几十秒内生成具有交互UI的小应用（如人生目标生成器、像素画板） [13][17] - 生成的应用可根据用户后续要求自动实现功能拓展，例如将像素画板面积从基础尺寸拓展至64*64 [17][18] 应用场景展示 - 在金融话题场景下，能详细解释概念（如ETF）并图文并茂地进行叙述 [2] - 在教育场景下，能洞察并提炼知识点，有逻辑有层次地展示，并生成3D实物动图、可互动表格 [13] - 在生活助手场景下，能顺利产出详细步骤并配图展示（如糖醋小排的做法） [9]

通用人工智能（AGI）

通用人工智能（AGI）

具身机器人的大脑和小脑分别负责哪个任务？

具身智能之心· 2025-11-19 08:34

具身智能行业概述 - 具身智能是通用人工智能（AGI）的关键方向，强调智能体与物理环境的交互与适应，使其具备感知环境、理解任务、执行动作并反馈学习的能力 [1] - 具身智能的核心模块包括大脑（负责思考感知和任务规划）和小脑（负责高精度运动执行） [1] 国内外产业布局 - 近2年，星海图、银河通用、逐际动力等明星团队从实验室走向商业和工业界，推动具身本体和大小脑技术进步 [3] - 华为于2024年底启动"全球具身智能产业创新中心"，与乐聚机器人、大族机器人等企业合作建设具身智能大脑、小脑等关键技术 [5] - 京东自2025年5月以来连续投资智元机器人、千寻智能、逐际动力等公司，以强化物流科技与家庭服务场景的效率与服务能力 [5] - 腾讯、蚂蚁集团、小米等科技巨头也积极通过战略投资与合作布局，加快构建具身智能产业生态 [5] - 国外方面，Tesla/Figure AI在工业与物流机器人应用上持续推进，美国投资机构积极支持Wayve、Apptronik等公司落地自动驾驶与仓储机器人 [5] - 国内企业以产业链投资与综合平台驱动具身智能落地，国外科技巨头侧重基础模型、模拟环境与类人机器人原型研发，双方加速进入关键竞赛阶段 [5] 技术演进路径 - 第一阶段技术研究聚焦抓取位姿检测，通过点云或图像预测末端执行器姿态实现静态物体抓取，但缺乏对任务上下文和动作序列的建模 [6] - 第二阶段进入行为克隆阶段，机器人借助专家演示数据学习从感知到控制的端到端映射，具备模仿人类完成复杂任务的能力，但泛化能力弱、误差累积 [6] - 第三阶段兴起Diffusion Policy方法，通过扩散模型生成整个动作轨迹，提升策略稳定性与泛化能力 [6] - 2024年进入Vision-Language-Action模型阶段，融合视觉感知、语言理解与动作生成模块，支持零样本或小样本快速泛化，体现从"感知+控制"向"感知+推理+行动"的范式跃迁 [7] - 2025年业界探索VLA模型与强化学习、世界模型、触觉感知等模块融合，提升长时任务试错能力、环境动态预测能力和多模态融合感知能力 [9][11][12] - 技术演进从低层感知到高层理解，逐步迈向通用任务和开放环境的智能体时代，推动人形机器人、机械臂、四足机器人等产品在工业、家居、餐饮、医疗康复等领域落地 [14] 工程与系统能力需求 - 随着产业界重视，具身智能从"论文"走向"部署"，对工程能力提出更高要求 [19] - 工程能力需求包括在Mujoco/IsaacGym/Pybullet等平台完成策略训练与仿真测试，训练并部署Diffusion Policy/VLA/力触融合的VLA模型，实现强化学习在VLA后训练上的应用，以及实现从世界建模预测到策略学习再到物理执行的一体化具身智能架构 [19]

通用人工智能（AGI）

人形机器人

四足机器人

通用人工智能（AGI）

人形机器人

四足机器人

烧掉700亿，他为谷歌赢得诺奖，却将ChatGPT拱手让人

36氪· 2025-11-19 08:02

公司战略与领导力 - 德米斯·哈萨比斯作为Google DeepMind CEO，是谷歌AI战略的核心人物，在谷歌收购DeepMind后的11年中获得了诺贝尔奖并赚取数百万美元财富 [1][2][3] - 哈萨比斯拒绝了OpenAI在2019年前后提出的AGI合作提议，选择让DeepMind单独前进 [4] - 谷歌发布Transformer论文后未将其商业化，而是免费提供给其他研究人员，OpenAI于2022年在此基础上率先推出ChatGPT [4][5] - 为追赶OpenAI，谷歌首席执行官Sundar Pichai将谷歌大脑与DeepMind合并，由哈萨比斯统领所有AI部门 [10] 研发投入与商业回报 - 在哈萨比斯追求通用人工智能过程中，动用了超过96亿美元的谷歌资本作为运营支出 [4][44] - 在截至2024年的五年内，DeepMind累计收入超过78亿美元，但所有营业额均来自其他谷歌平台使用其技术的内部结算 [42][43] - AlphaFold项目为谷歌赢得诺奖声誉，但尚未成为Alphabet的重要收入来源 [4][45] - Isomorphic Labs是Alphabet成立的由哈萨比斯领导的DeepMind姐妹公司，致力于利用AI快速开发药物，但由于制药研发漫长周期，该企业尚处早期，未取得商业成功 [18][19] 技术愿景与项目重点 - 哈萨比斯长期关注通过AI解决科学难题，其目标是破解智能，然后破解其他一切，将DeepMind描述为一项阿波罗计划 [11] - 哈萨比斯心中一直有诺奖梦，蛋白质折叠自1990年代起就排在其科学难题清单最前面，AlphaFold被视为五六年周期的大工程，而非追求短期商业回报 [7] - 2024年，哈萨比斯与同事John Jumper因领导开发AlphaFold2获得诺贝尔化学奖 [7][9] - 哈萨比斯目前重点领域包括构想不会在复杂任务上出错的通用助理AlphaAssist，以及Isomorphic Labs计划于2025年底前将AI设计的药物推向临床试验，肿瘤学是研究重点之一 [25][26][27] 市场评价与内部文化 - 部分投资人质疑谷歌在AI领域的先发优势未能转化为领导地位，Deepwater Asset Management今年出售了约1400万美元的Alphabet股票 [13] - 有投资人将AlphaGo视为精美玩具，并评价谷歌像一支拥有全部天才球员却拿不到冠军的全明星球队 [13] - 哈萨比斯被一些同事认为是科学家第一、企业家第二，其主张更多将DeepMind描述为科学项目而非商业企业 [38][40][41] - 哈萨比斯追求DeepMind的独立性，认为脱离谷歌利润动机才能确保AI负责任发展，这与埃隆·马斯克等人的信念相似 [14][15]

通用人工智能（AGI）

科学研究与商业成功的平衡

Artificial Intelligence

通用人工智能（AGI）

科学研究与商业成功的平衡

Artificial Intelligence

4万亿刀，仅3.6万人，英伟达揭残酷真相：劳动正与财富大脱钩

36氪· 2025-11-18 15:30

核心观点 - 文章核心观点为“劳动力与资本的大脱钩”现象，即大型科技公司的营收和市值增长与员工数量增长日益脱钩，这一趋势在AGI时代将加速 [1][4][30] 英伟达的案例 - 英伟达市值突破4万亿美元，仅凭3.6万名员工创造历史第一，其“每位员工对应市值”达到前所未有的高度 [1] - 4万亿美元市值相当于15亿印度人一年的GDP，比例惊人 [1] 历史趋势与背景 - 2007年惠普成为首家年收入突破千亿美元的科技公司，拥有17.2万名员工；次年IBM达到此目标时员工规模接近40万人 [4][5] - 经济学家Erik Brynjolfsson在10年前就指出机器学习带来的悖论：生产率持续攀升，但就业率未必同步增长 [8] - 净生产力到2018年增长252.9%，而小时薪酬仅增长115.6%，显示出脱钩 [6] 主要科技公司分析 - 苹果在2011年用6万员工实现首个千亿营收，而最近一次千亿营收增长仅增加约1.7万名员工，所需新增员工数下降一半 [12][15] - 谷歌母公司达到首个千亿营收用了7.6万员工，而最近一个千亿营收增长预计仅需1.1万人，符合员工需求递减规律 [16] - 微软达到首个千亿和两千亿营收分别增聘12.4万和9.7万名员工，但最近一个千亿营收增长仅需七千人 [19] - Meta首个千亿营收耗时6.3万员工，而最新千亿增长仅需当初三分之一人手 [22] - 亚马逊历史上每增千亿营收需20-40万员工，但最近2000亿美元营收增长仅新增3.6万人，公司预计未来几年通过AI应用总员工数将缩减 [25][27] 非科技公司案例与宏观影响 - 沃尔玛在过去十年全职员工数量保持稳定，营收却增长2000亿美元，未来三年员工规模预计维持不变，意味着可能在零人员增长下实现3000亿美元营收增长 [30] - 将苹果、微软、谷歌、Meta、英伟达的增量营收与亚马逊、沃尔玛的增量累计，约万亿美元营收增长仅伴随约10万人员增长，且这一趋势发生在GenAI崛起之前 [30] - AI将加速迈向AGI的进程，AGI更可能是一个渐进的过程而非突发事件 [30][31] 未来经济格局启示 - 未来经济格局或将呈现“微笑曲线”特征：一端是无需大幅增员就能主导经济的大型科技公司，另一端是被赋能的“小个体”，中间环节群体持续承受挤压 [37] - 投资者常陷入“非此即彼”的二元思维，低估新动能扩张市场总量的潜力和科技公司预留的消费者剩余价值 [37] - 这一趋势将持续演进，AI将进一步加速进程 [38]

英伟达(US:NVDA)

劳动与资本大脱钩

通用人工智能（AGI）

劳动与资本大脱钩

通用人工智能（AGI）

钱塘对话 AI热里的冷思考

中国青年报· 2025-11-18 14:57

AI投资热度与性质 - 美国经济学家预测美国今年经济增长超过90%来自人工智能投资 [1] - 超过30%的标普500指数市值集中在全球前七大科技公司 [2] - AI投资热难以避免，历史上所有颠覆性技术周期都伴随巨大投资泡沫 [3] AI投资泡沫特征 - 当前AI投资热被视为一场"理性泡沫"，投资不足的代价远高于投资过度的成本 [2] - 泡沫分布不均衡，大模型等领域泡沫低于具身智能等方向 [7] - 存在技术消化泡沫可能，技术飞速发展可能兑现过高预期实现软着陆 [7] AI发展目标与应用前景 - 中国明确目标到2027年新一代智能终端、智能体等应用普及率超70%，到2030年普及率超90% [6] - 国务院发布《关于深入实施"人工智能+"行动的意见》，要求全方位赋能千行百业 [6] - 中国有100万前臂截肢和大腿截肢者，计划十年内帮助他们重新行走、拥有双手 [7] AI对生产率的影响 - 需要让人工智能服务于提高生产率，使劳动生产率、全要素生产率成为经济增长新驱动力 [4] - 存在"索洛悖论"现象，新技术提高生产率但现实中生产率提高不明显 [4] - 发展人工智能目的是用生产率提高打破供给侧增长制约 [3] AI应用发展趋势 - 从2022年到2024年，大量AI应用停留在内容生成层面，2025年开始向产业深耕转变 [5] - 初创企业应寻找垂直应用方向产生实际价值而非研发基础模型 [7] - 芯片企业若未用好AI赋能产品研发提升迭代速度，将难以在行业竞争 [6] AI发展路径与制度建设 - 人工智能发展需要对标智能向善，需要制度环境通过改革实现 [3][4] - 应对AI泡沫需依靠AI思维方法，从解决具体问题出发拓展至产业链与生态层面 [7] - 通过制度建设平衡新技术破坏性与创造性，释放户籍制度改革需求侧红利 [4]

通用人工智能（AGI）

通用人工智能（AGI）

马斯克亮AI王牌：Grok 4.1发布，智商情商双在线霸榜，背后团队被传是“全华班”

搜狐财经· 2025-11-18 14:54

产品发布与性能 - 公司发布新一代大模型Grok 4 1，包含Grok 4 1 Thinking（推理）和Grok 4 1（非推理）两个版本[2] - 新模型已向全网用户开放，可在官网、X平台及iOS和Android应用中免费体验[2] - 在LMArena大模型排名榜单中，Grok 4 1 Thinking以1483分的成绩位列全球第一，超越第二名Gemini 2 5 Pro达31分，非推理版Grok 4 1排名第二[2] - 在情商测试EQ-Bench3中，Grok 4 1 Thinking以1586分霸榜，Grok 4 1位居第二[3] 技术能力提升 - 模型情商进步明显，具备更高理解力、洞察力、同理心和人际交往能力，对比上一代成为更具耐心的倾听者且共情能力凸显[3][4] - 创意写作能力较上一代提升600分，语言表达流畅有画面感[5] - 基于训练方法优化，模型幻觉率从12 09%降至4 22%，比之前降低了3倍[5] - 在支撑Grok 4的同一套大规模强化学习基础设施上进一步优化了模型风格、个性等特征[6] 研发与团队 - 新模型改进主要在强化学习上，将RLHF推向新高度，团队利用用户真实对话偏好和智能体奖励模型对算法进行全面改进[7] - 强化学习的规模扩大10倍，由十几人团队完成[7] - 公司人才战略引人注目，团队合影显示多为华人面孔，有消息称已辞退Grok团队最后一名白人成员，打造“全华班”[7] 未来产品规划 - 公司推迟发布Grok 5，部分原因在于开发过程中的资源限制和极其严格的测试需求[9] - Grok 5预计拥有约6万亿参数，训练和优化需要巨大计算能力，将成为世界上最智能的人工智能，作为迈向AGI的关键一步[9] - Grok 5全面测试和开发工作需要更多时间以达到高标准，预计明年发布[9] 行业竞争与定位 - 本次发布是技术迭代，也是公司AI战略的强力宣言，为Grok 5和实现AGI目标铺设道路[9] - 有业内人士认为该模型可能不是今年最好的型号，期待谷歌即将发布的Gemini 3 0模型表现[9]

通用人工智能（AGI）

Artificial Intelligence

通用人工智能（AGI）

Artificial Intelligence