Workflow
7 周一款新产品,OpenAI 到底有多卷?离职员工长文复盘内部真实情况
Founder Park·2025-07-16 15:07

公司文化 - OpenAI采用高度分散的集群式工作模式,由多个小团队并行推进项目,缺乏统一路线图,研究方向多为自下而上推动[2] - 研究人员被视作"迷你CEO",拥有极高自主权,项目推进依赖个人兴趣驱动的"技术激将法"[2][12] - 公司扩张速度极快,员工规模从1000人增至3000人仅用1年,导致资历满1年者即进入公司前30%元老行列[9] - 内部沟通几乎全部通过Slack完成,邮件使用量极少(约10封/任职期),形成独特的即时通讯协作文化[9] 研发机制 - 采用"行动优先"原则,允许相似项目并行开发(如曾同时存在3-4个Codex原型),后期再集中优势资源[12][27] - 研究推进呈现"渐进式探索"特征,季度计划常不存在,优秀想法可来自任何层级员工[11] - 决策链条极短,从Codex项目首行代码到产品上线仅用7周,包含容器运行时、Git操作处理等复杂功能开发[2][34] - 技术架构呈现Meta系风格,核心基础设施团队多来自Meta/Instagram,自建TAO类系统和边缘认证方案[24][25] 产品特性 - 消费级产品思维主导,Codex等开发者工具仍优先考虑个人用户体验而非团队协作[2][29] - ChatGPT的对话体系深度嵌入技术架构,新功能开发需适配现有会话消息结构[27] - 采用"限时掉落"商品分发模式,首次开放导致Shopify商店因抢购崩溃,引发内部技术破解热潮[19] - 模型训练形成连续谱工作流,从小规模实验逐步扩展至分布式系统级调试[29] 行业竞争 - 公司视AGI为终极目标,同时面临Meta、Google和Anthropic的三方技术竞赛[15][40] - 资源投入向GPU计算严重倾斜,小众功能的GPU成本即超过Segment全部基础设施支出[19] - Twitter舆情直接影响内部决策,产品团队高度关注社交媒体声量[20] - 当前形成OpenAI(消费产品)、Anthropic(企业服务)、Google(基础设施)的三足鼎立格局[40] 技术架构 - 采用Python主导的单体代码库(monorepo),包含FastAPI+Pydantic技术栈,但缺乏统一代码规范[22] - 全部服务部署于Azure,主要依赖AKS、CosmosDB和BlobStore三核心服务[24] - 工程实践呈现"重行动轻规划"特点,存在至少6套重复的队列管理/代理循环实现方案[27] - 持续集成流程面临挑战,主分支测试在GPU环境需30分钟,反映快速扩张带来的技术债[28] 人才管理 - 高管团队保持高度可见性,包括Sam Altman(sama)等多位领导者在Slack直接参与技术讨论[21] - 招聘呈现Meta人才流入趋势,基础架构团队多来自Meta/Instagram系[24][25] - 组织处于"相变期",大量引入外部高级管理者以补充管理基因[42] - 核心团队组建灵活,Codex发布时8名工程师+4名研究员+2设计师的精英组合实现高强度冲刺(日均工作16小时)[36]