硅谷“钱太多”毁了AI ?!前OpenAI o1负责人炮轰:别吹谷歌,Q-Star 被炒成肥皂剧,7年高压被“逼疯”!
AI前线·2026-01-24 13:33

文章核心观点 - 文章通过OpenAI前核心研究员Jerry Tworek的离职访谈,揭示了当前大模型行业在激烈竞争下出现的创新瓶颈、研究商业化压力以及行业叙事娱乐化等问题,并探讨了未来AI研究的潜在突破方向 [3][4][6] OpenAI内部变化与Jerry Tworek的离职 - Jerry Tworek于2019年加入OpenAI,当时公司仅有约30名员工,他是现代AI浪潮背后最有影响力却最少露面的关键人物之一,参与了包括Q-Star、Strawberry(最终发展为o1推理模型)在内的许多最重要项目 [3] - 其离职在内部引起巨大震动,多位员工在社交媒体上表示“崩溃”和“难受” [3] - 离职主要原因是想从事有风险的基础研究,而这在OpenAI已不可能,因为公司优先考虑用户增长等商业指标,研究与产品开发之间存在日益加剧的分歧 [3] - 他认为在OpenAI的七年,每一年都像在一家完全不同的公司,经历了从30人小团队到全球数千人员工规模的巨大变化 [17][18][19] 大模型行业面临的挑战与问题 - 创新不足与同质化竞争:所有主要AI公司都在开发几乎相同的技术,产品几乎没有区别,迫使研究人员追求短期利益而非实验性突破 [4] - 组织架构僵化:团队各自为政,职责分明,跨团队研究难以开展,组织结构决定了哪些研究是可能的,最终导致公司“交付其组织架构图”,只做组织结构最容易支持的项目 [4][22][23] - 风险偏好降低:公司需要不断展示最强模型以留住用户并证明高昂的GPU成本(未给出具体数字)的合理性,这影响了承担风险的“胃口” [4][22] - 行业叙事娱乐化:整个行业被持续围观,技术进展被赋予额外意义,内部变化被解读成信号,研究现场被包裹进一层娱乐业式的叙事,像在聚光灯下跑一场没有终点的马拉松 [6][7][58] 对主要AI公司的评价与比较 - OpenAI的失误:谷歌之所以能在AI竞赛中成功追赶,本质上是OpenAI自身的失误,公司犯了一些错误,行动过于缓慢,没能充分利用原本拥有的巨大领先优势,导致一些关键推进“慢得不该那么慢” [4][5][67][68][72] - Anthropic的清晰感:在过去一年里展现出罕见的“清晰感”,算力更少、团队更小,却异常专注、执行力极强,特别是在代码模型与代码Agent方向上取得了不是靠简单堆规模取得的成果 [5][75][76] - 谷歌的追赶:谷歌做出了许多正确决策,并凭借其在硬件、算力和人才储备上的巨大优势成功追赶,但OpenAI的领先最初靠的是对特定技术路线的强烈信念而非资源优势 [4][68][69] - Meta的战略:可能选择使用已熟悉的AI技术(如Transformer)来构建全新的产品体验,而非在模型层面追求完全不同的路线,这对其作为社交巨头而言是合理的策略 [74][75] 未来AI研究的潜在方向 - 超越Transformer的架构创新:Transformer不可能是机器学习的最终架构,存在其他训练大模型的方法值得探索 [45][46] - 持续学习(Continual Learning):如何把测试时与训练时真正打通、融合,让模型能像人类一样从看到的数据中持续学习,这是实现AGI的关键能力要素之一 [47] - 世界模型与强化学习的结合:在高质量世界模型之上大规模运行强化学习,是“毫无疑问正确”的方向,能教会模型仅靠预训练永远学不会的技能 [26][43][44] - 探索与利用的权衡:行业需要像设计智能体一样,思考如何在研究中进行“探索与利用”的取舍,鼓励更多冒险和大胆的赌注,因为真正的进步正是这样发生的 [36][40] 对AGI(通用人工智能)的展望 - 对AGI时间线的判断有所更新,一年半前认为规模化强化学习即是AGI,但现在认为还需整合持续学习、多模态感知等能力 [49][50] - 不认为谈论AGI是离谱的,但按其定义当前模型仍不是AGI,实现“文明级里程碑”还有很多必要步骤 [49][50] - 预计AGI可能的时间点在2026至2029年之间,不会更久太多,因为投资在年复一年累积增长,人才池和探索的想法数量都在变多 [50] 对AI行业生态与文化的观察 - 高压环境:在OpenAI工作甚至被描述为比创业压力更大,研究者需要像“做俯卧撑”一样锻炼心理韧性以应对持续高压 [7][61][92] - 人才流动与“明星驱动”:湾区像一个巨大的转会市场,研究者在几家前沿实验室之间流动,但公司的结构、文化和协作方式比某个特定研究者的去留更重要 [6][96][97][98] - 资源分配问题:许多有潜力的研究方向缺乏关注、算力和资源,且行业更擅长“从0到1”提出想法,而将不成熟的想法做到大规模可靠落地(从1到100)同样关键但资源往往分散 [84][85][92][93]