硅谷“钱太多”毁了AI ？！前OpenAI o1负责人炮轰：别吹谷歌，Q-Star 被炒成肥皂剧，7年高压被“逼疯”！

文章核心观点 - 文章通过OpenAI前核心研究员Jerry Tworek的离职访谈，揭示了当前大模型行业在激烈竞争下出现的创新瓶颈、研究商业化压力以及行业叙事娱乐化等问题，并探讨了未来AI研究的潜在突破方向 [3][4][6] OpenAI内部变化与Jerry Tworek的离职 - Jerry Tworek于2019年加入OpenAI，当时公司仅有约30名员工，他是现代AI浪潮背后最有影响力却最少露面的关键人物之一，参与了包括Q-Star、Strawberry（最终发展为o1推理模型）在内的许多最重要项目 [3] - 其离职在内部引起巨大震动，多位员工在社交媒体上表示“崩溃”和“难受” [3] - 离职主要原因是想从事有风险的基础研究，而这在OpenAI已不可能，因为公司优先考虑用户增长等商业指标，研究与产品开发之间存在日益加剧的分歧 [3] - 他认为在OpenAI的七年，每一年都像在一家完全不同的公司，经历了从30人小团队到全球数千人员工规模的巨大变化 [17][18][19] 大模型行业面临的挑战与问题 - 创新不足与同质化竞争：所有主要AI公司都在开发几乎相同的技术，产品几乎没有区别，迫使研究人员追求短期利益而非实验性突破 [4] - 组织架构僵化：团队各自为政，职责分明，跨团队研究难以开展，组织结构决定了哪些研究是可能的，最终导致公司“交付其组织架构图”，只做组织结构最容易支持的项目 [4][22][23] - 风险偏好降低：公司需要不断展示最强模型以留住用户并证明高昂的GPU成本（未给出具体数字）的合理性，这影响了承担风险的“胃口” [4][22] - 行业叙事娱乐化：整个行业被持续围观，技术进展被赋予额外意义，内部变化被解读成信号，研究现场被包裹进一层娱乐业式的叙事，像在聚光灯下跑一场没有终点的马拉松 [6][7][58] 对主要AI公司的评价与比较 - OpenAI的失误：谷歌之所以能在AI竞赛中成功追赶，本质上是OpenAI自身的失误，公司犯了一些错误，行动过于缓慢，没能充分利用原本拥有的巨大领先优势，导致一些关键推进“慢得不该那么慢” [4][5][67][68][72] - Anthropic的清晰感：在过去一年里展现出罕见的“清晰感”，算力更少、团队更小，却异常专注、执行力极强，特别是在代码模型与代码Agent方向上取得了不是靠简单堆规模取得的成果 [5][75][76] - 谷歌的追赶：谷歌做出了许多正确决策，并凭借其在硬件、算力和人才储备上的巨大优势成功追赶，但OpenAI的领先最初靠的是对特定技术路线的强烈信念而非资源优势 [4][68][69] - Meta的战略：可能选择使用已熟悉的AI技术（如Transformer）来构建全新的产品体验，而非在模型层面追求完全不同的路线，这对其作为社交巨头而言是合理的策略 [74][75] 未来AI研究的潜在方向 - 超越Transformer的架构创新：Transformer不可能是机器学习的最终架构，存在其他训练大模型的方法值得探索 [45][46] - 持续学习（Continual Learning）：如何把测试时与训练时真正打通、融合，让模型能像人类一样从看到的数据中持续学习，这是实现AGI的关键能力要素之一 [47] - 世界模型与强化学习的结合：在高质量世界模型之上大规模运行强化学习，是“毫无疑问正确”的方向，能教会模型仅靠预训练永远学不会的技能 [26][43][44] - 探索与利用的权衡：行业需要像设计智能体一样，思考如何在研究中进行“探索与利用”的取舍，鼓励更多冒险和大胆的赌注，因为真正的进步正是这样发生的 [36][40] 对AGI（通用人工智能）的展望 - 对AGI时间线的判断有所更新，一年半前认为规模化强化学习即是AGI，但现在认为还需整合持续学习、多模态感知等能力 [49][50] - 不认为谈论AGI是离谱的，但按其定义当前模型仍不是AGI，实现“文明级里程碑”还有很多必要步骤 [49][50] - 预计AGI可能的时间点在2026至2029年之间，不会更久太多，因为投资在年复一年累积增长，人才池和探索的想法数量都在变多 [50] 对AI行业生态与文化的观察 - 高压环境：在OpenAI工作甚至被描述为比创业压力更大，研究者需要像“做俯卧撑”一样锻炼心理韧性以应对持续高压 [7][61][92] - 人才流动与“明星驱动”：湾区像一个巨大的转会市场，研究者在几家前沿实验室之间流动，但公司的结构、文化和协作方式比某个特定研究者的去留更重要 [6][96][97][98] - 资源分配问题：许多有潜力的研究方向缺乏关注、算力和资源，且行业更擅长“从0到1”提出想法，而将不成熟的想法做到大规模可靠落地（从1到100）同样关键但资源往往分散 [84][85][92][93]