Workflow
Agents SDK
icon
搜索文档
深度|OpenAI API华人工程负责人:模型会把你的脚手架当早餐吃掉,为模型的未来而构建,而非为模型的当下而构建
Z Potentials· 2026-02-24 11:21
文章核心观点 - OpenAI内部AI工具(Codex)的使用已极为广泛和深入,正在从根本上重塑软件工程的工作范式,工程师角色正从代码编写者转变为管理AI智能体的“技术负责人”或“巫师” [5] - AI技术的发展遵循“苦涩的教训”,即当前为弥补模型缺陷而构建的复杂“脚手架”(如特定框架、工具)终将被更强大的模型能力所取代,因此产品开发应为模型的未来而构建,而非基于其当下状态 [5][48] - AI带来的生产力杠杆效应将催生创业生态的繁荣,可能出现“一人十亿美元”级别的初创公司,并引发B2B SaaS领域的黄金时代 [5][30] - 企业AI部署面临负ROI的普遍困境,其核心在于缺乏自下而上的员工认同与赋能,成功的关键在于组建内部“虎队”进行探索和布道 [43][45] - OpenAI坚定其平台与生态战略,致力于通过开放的API和工具赋能开发者,认为当前是科技与创业领域前所未有的机遇期 [60][70] OpenAI内部AI工具使用现状与影响 - **使用普及率极高**:OpenAI内部95%的工程师每天都在使用Codex,且100%的代码合并请求(PR)都由Codex进行审核 [5][7] - **代码生成主导**:绝大多数代码首先由AI生成,工程经理等管理者的代码也全部由Codex编写,工程师的工作重心已转向审核和引导AI生成的代码 [5][6] - **显著提升生产效率**:频繁使用Codex的工程师提交的PR数量比使用较少的工程师高出70%,并且这一效率差距还在持续扩大 [7] - **自动化代码审查**:Codex(特别是5.2版本)非常擅长代码审查,能将原本需10-15分钟的审查任务缩短至2-3分钟,对于小型PR,有时甚至无需人工二次审查 [21] - **开发流程自动化**:公司内部利用Codex高度自动化了持续集成(CI)、Lint错误修复等部署前流程,进一步释放了工程师的产能 [22] 软件工程师角色的演变 - **从编码者到管理者/巫师**:工程师的角色正在演变为“技术负责人”,管理着成群的AI智能体,工作内容从编写代码转变为施展“咒语”(指令)来引导AI完成任务,并同时管理10到20个并行线程 [5][13][15] - **需要更高阶技能**:有效使用AI工具需要资历、技能和大量思考,以确保模型不会“脱轨”,类似于《魔法师的学徒》中掌控魔法的比喻 [15] - **工具赋能顶尖表现者**:AI工具让高能动性、擅长使用工具的工程师变得“超级充能”,极大地拉开了团队内部的生产力分布,顶尖表现者变得更加多产 [24][25] AI技术发展趋势与产品构建启示 - **“模型吃掉脚手架”**:AI发展史表明,许多为弥补早期模型缺陷而构建的复杂框架(如向量存储、智能体框架)最终都会被更智能的模型本身所取代 [5][48][49] - **为未来而构建**:开发者应瞄准模型未来1-2年的能力方向(即使当前只实现80%)来构建产品,这样当模型能力提升时,产品体验将迎来爆发式改善,而非被困在基于当前能力的“局部最优解”中 [50][52] - **任务时长大幅延伸**:当前AI产品主要优化几分钟的短任务,但在未来12-18个月内,将出现能够连贯执行数小时甚至长达六小时任务的模型,这将催生全新的产品形态 [5][53] - **音频/语音成为关键赛道**:多模态能力持续升级,未来6-12个月音频和语音到语音模型的能力将有质的飞跃,商业世界的音频沟通场景存在巨大且被低估的AI应用潜力 [54] - **商业流程自动化是巨大机会**:与硅谷的开放式知识工作不同,传统行业中大量可重复的标准商业流程(SOP)是AI自动化潜力巨大但被严重低估的领域 [55][56][58] 创业生态与市场展望 - **“一人十亿美元”公司与二阶效应**:个人生产力的极高杠杆可能催生“一人十亿美元”级别的初创公司,而这将进一步引发创业生态繁荣,为支持这些公司,可能会出现数以百计的其他小型初创公司提供定制化软件,从而进入B2B SaaS的黄金时代 [5][30][31] - **风险投资格局可能变化**:如果未来出现大量价值1000万至5000万美元的小型成功企业,它们可能不适合追求百倍回报的传统风险投资模式,但对创业者个人而言价值巨大 [33] - **市场足够容纳创新者**:AI领域机会空前广阔,初创公司失败的主因是产品未打动市场,而非被大厂挤压,专注打造用户真正热爱的产品是关键 [59] - **当前是历史性机遇期**:未来2-3年将是科技和初创领域有史以来最具机遇的时期,AI正在重构世界运行和工作方式 [70] 企业AI部署的成功之道 - **普遍面临负ROI困境**:许多企业AI部署项目投资回报率为负,部分源于硅谷与外部世界在AI认知和应用上的巨大“信息泡沫” [43] - **成功需要双向结合**:成功的AI部署必须同时具备自上而下的战略支持(管理层推动、资源投入)和自下而上的员工认同(一线员工主动学习、分享最佳实践) [44] - **组建内部“虎队”**:企业应在内部组建全职的AI“虎队”,由对技术充满热情、具备技术相邻技能(如客服运营、Excel高手)的员工组成,负责深度探索AI应用、开展内部知识分享和布道,这是打破僵局的关键 [45][46][47] - **避免错误模式**:最大的反模式是仅有自上而下的强制推动,将AI使用与绩效挂钩,却不培育自下而上的学习文化和支持体系 [47] OpenAI的平台战略与开发者支持 - **定位为生态平台公司**:OpenAI从根本上将自己定位为生态系统平台公司,培育健康的AI生态、支持开发者是其核心目标 [60] - **坚持开放与中立**:公司坚持“吃自己的狗粮”,在自有产品中使用的模型都会同步开放给API用户,不保留核心能力,不屏蔽竞争对手,保持平台中立 [60] - **提供多层次开发者工具**:平台提供从底层原语到高层抽象的多种工具选择,包括:1) 底层的Responses API,用于构建长时间运行的智能体;2) 基于此的Agents SDK,提供智能体开发框架;3) Agent Kit,提供现成的UI组件;4) Evals API等测评工具 [67][68][69] - **生态繁荣驱动增长**:坚信“水涨船高”,整个AI生态的繁荣将使所有参与者受益,这也是OpenAI API实现爆发式增长的原因 [61] - **使命驱动开放**:让AGI福祉惠及全人类的使命,决定了必须通过开放平台赋能全球开发者去覆盖OpenAI自身无法触及的细分场景和应用 [62] - **ChatGPT应用商店扩展生态**:拥有8亿周活跃用户的ChatGPT推出应用商店,旨在吸引更多开发者为海量用户构建专属产品,实现生态共赢 [63][65]
OpenAI高管:工程师变成“魔法师”,AI将开启新一轮创业狂潮
华尔街见闻· 2026-02-15 16:01
OpenAI内部AI应用现状 - 公司内部95%的工程师在日常工作中使用Codex编程模型,100%的代码拉取请求(PR)每天由Codex审查 [2][4][9] - 深度使用Codex的工程师开启的PR数量比不常使用的工程师多出70%,并且这个生产力差距还在随着时间的推移而扩大 [4][18] - 公司内部有一个实验团队正在维护一个100%由Codex编写的代码库,这代表了开发模式的根本性转变 [4][12][29] 软件工程职业重塑 - 独立贡献者角色的工程师正在转变为“技术负责人”或管理者,其工作内容从逐行写代码转变为同时管理10到20个并行的AI线程(智能体) [6][24] - 工程师的角色被比喻为“巫师”,通过“咒语”(指令)引导AI智能体完成任务,高绩效人才的杠杆率被极度放大 [6][25][26] - 代码审查工作已高度自动化,Codex审查所有PR,将审查时间从10-15分钟缩短至2-3分钟,甚至无需人工介入 [31][32] AI技术演进路径与能力预测 - 目前前沿模型能处理不到一小时的任务,预计在未来12到24个月内,将出现能够非常连贯地执行数小时复杂任务的模型 [2][7][84] - 音频和语音等多模态能力将在未来6到12个月内变得更重要,尤其是在企业业务流程自动化领域,其潜力被严重低估 [7][85] - 模型能力的快速进步会“吞噬”掉为弥补其当前缺陷而建立的工具链和中间层(脚手架),开发者应为模型未来的发展方向而构建 [4][14][73][77] 对SaaS行业与创业生态的影响 - 为赋能“一人十亿美元创业公司”这类超级个体,市场将需要大量定制化软件工具,这可能标志着B2B SaaS黄金时代的到来 [7][10][43] - 更确定的机会在于出现成百上千个服务于超级个体的“千万美元级”小微SaaS公司,这将改变风险投资生态系统并大幅降低创业门槛 [7][43][44] - 构建者应专注于为模型将要发展的方向开发产品,而非其当前形态,这样能创造出随着模型能力提升而自然解锁的卓越体验 [15][80][81] OpenAI的平台战略与市场定位 - 公司明确将自身定位为生态系统平台,致力于“提高水位”以支持整个生态发展,而非通过发布竞品扼杀初创公司 [8][93] - 公司认为当前市场机会巨大,创业公司应专注于构建用户真正喜爱的产品,而非过度担忧被平台方复制 [91][92] - 公司的使命是让人工智能惠及全人类,通过提供API、ChatGPT免费版等产品推动技术民主化,并将持续投资于医疗、教育等领域 [94][95][100][101] AI在企业中的部署与采纳 - 许多企业的AI部署可能呈现负投资回报率,部分原因在于缺乏自下而上的员工采纳,而只有自上而下的强制指令 [63][66] - 成功的AI部署需要结合自上而下的管理层支持与自下而上的员工认同,建议企业建立内部攻坚团队探索最佳实践并进行知识传播 [66][69] - 在非科技公司中,大量工作是重复性的业务流程自动化,这是一个被硅谷视野低估但潜力巨大的AI应用领域 [87][88][90]
OpenAI教你做Agent:2025年,评估标准和如何产品化是Agent的重点
Founder Park· 2025-04-25 21:29
AI Agent技术演进 - 2024年至2025年AI agent的行动能力和交互方式发生质变,头部模型厂商将agentic能力融入模型,成为模型竞赛重点之一 [2] - agent获取信息方式从单次搜索决策模式转变为完全自主的Deep Research模式,能同时打开多个网页节省时间 [3] - OpenAI判断agent可调用的工具数量将在几个月内从10个量级扩展到100个量级 [4] - multi agent系统具备更高可控性和优化潜力,通过任务分拆提升整体工作效率 [5] - vertical agent将直接受益于multi-agent系统发展 [6] 开发者工具与评估 - 开发者需要构建agent评估微调飞轮,通过强化微调能力让模型找到正确tool use路径 [7] - 评估器需能将模型输出与权威资料对比或执行代码验证数学正确性,而非简单字符串比对 [8] - 强化微调方法可推动模型在特定行业深入应用,实现专业化能力提升 [20] - 目前AI领域核心问题是评分机制,如何构建高质量任务和评分器成为重要课题 [21] Computer Use创新 - Computer Use处于早期阶段,VM(虚拟机)需要开发者填补空白,可能出现专门做iPhone VM的公司 [10] - computer use应用场景包括无API的传统软件系统自动化,如医疗行业手工操作和Google Maps街景分析 [22] - BrowserBase和Scrapybara等公司提供computer use模型托管服务,开发者可便捷访问底层控制 [25][26] - Arc浏览器开发的Dia项目将agent深度集成到浏览器中,成为浏览器本身的一部分 [29] 开发者实践与API设计 - multi agent系统通过任务分拆使调试更独立,降低修改风险 [31][33] - OpenAI采用"阶梯式API"设计理念,平衡易用性与可定制性,如向量搜索默认配置可逐步调整 [34] - Assistants API的tool use功能(如文件搜索)找到市场契合点,但使用门槛过高需优化 [36] - Responses API优化多轮交互体验,与MCP生态互补,需深入思考如何更好整合 [37] 行业应用与前景 - AI infra公司垂直化发展仍有市场需求,如Runloop AI为AI coding初创企业提供测试虚拟机 [38] - computer use在网络安全领域应用,如探测网站系统漏洞 [42] - 模型在科学研究领域应用被低估,可能加速科研进程 [53] - 旅游行业存在创新机会,期待AI agent打破传统格局 [56]
Agents和Workflows孰好孰坏,LangChain创始人和OpenAI杠上了
Founder Park· 2025-04-21 20:23
行业观点分歧 - OpenAI发布构建AI Agents的实用指南,主张通过LLMs主导Agent设计[2] - LangChain创始人反对严格区分Agent类型,认为理想框架应允许结构化工作流向模型驱动灵活过渡[2] - Anthropic提出"Agentic系统"概念,将Workflows和Agents视为同一系统的不同表现形式[2][12] - 大模型派(Big Model)强调通用型智能体系统,工作流派(Big Workflow)主张模块化工作流构建[2] Agent定义差异 - OpenAI定义Agent为"能代表用户独立完成任务"的宏观系统[10] - Anthropic将Agent明确区分为预设规则的Workflows和动态决策的Agents[12][13] - 实际生产环境中大多数系统采用Workflows和Agents混合模式[16][20] - 建议采用"Agentic程度"的连续光谱概念替代二元分类[21] 技术实现挑战 - 构建可靠Agent的核心难点在于确保LLM每步获取精准上下文[26][27] - 上下文传递问题常源于系统提示不完整、工具描述不当或响应格式错误[28] - 声明式框架可视化清晰但动态性不足,代码优先方案更灵活但控制复杂[6][41] - 多Agent系统需解决通信机制问题,可采用交接或工作流混合模式[45][46] 框架设计维度 - 成熟框架需同时支持Workflows和Agents两种模式[32] - 需平衡可预测性与自主性,不同应用场景需求各异[33] - 理想框架应兼具低门槛(易用性)与高上限(扩展性)[37][40] - LangGraph采用声明式与命令式混合API,支持持久化与流式传输[30][31] 生产环境考量 - Agentic系统通常需牺牲延迟和成本换取任务表现[20][63] - 企业级应用需特殊功能如人工监督、容错机制和长期记忆存储[53][57] - 垂直领域需定制化方案,通用模型难以满足独特业务需求[67] - 框架价值体现在标准化构建方式、调试工具和生产级功能集成[49]
微信上线就近找零工服务;蜜雪冰城利润增加、利润率提高;OpenAI估值奔着3000亿美元而去丨百亿美元公司动向
晚点LatePost· 2025-03-28 20:12
微信零工市场服务 - 微信上线"附近的工作"小程序,覆盖广东江门、河北唐山、江西九江、广东深圳、北京朝阳等地,提供超过2万个政府审核发布的零工岗位 [1] - 微信搜一搜推出"附近的工作"专区,覆盖全国超200个地市,通过智能梳理本地中介机构发布的零工招聘信息 [1] - 微信零工市场服务接入"微工卡"数字化解决方案,提供微信零钱及银行卡结算、合同签约、实时定位打卡、日结保险等服务 [1] 蜜雪冰城业绩表现 - 蜜雪冰城2023年营业收入248.3亿元,同比增长22.3%,净利润44.5亿元,同比增长39.8% [2] - 全球门店总数达46479家,上市20多天股价涨幅超60% [2] - 商品销售毛利率从28.8%提升至31.6%,主要得益于供应链效率提升和原材料采购成本下降 [2] OpenAI融资与技术进展 - OpenAI即将完成400亿美元融资,估值达3000亿美元,软银将投资75亿美元 [3] - 发布GPT-4o图片生成更新,对Agents SDK进行重大更新,支持MCP服务协议 [3] - 新功能可集成文件处理、数据查询和网络信息收集等工具,提高任务效率 [3] 英伟达收购动态 - 英伟达拟以数亿美元收购AI创业公司Lepton AI,该公司专注于AI基础设施和GPU服务器租赁 [5] - Lepton AI由阿里云前副总裁贾扬清创办,2023年完成1100万美元天使轮融资 [5] - 收购可能助力英伟达进军云和企业软件市场,与AWS和谷歌竞争 [5] TikTok交易进展 - TikTok美国业务面临"不卖就禁"最后期限,特朗普表示愿意延长期限并以关税作为谈判筹码 [6] - 美国政府考虑让字节最大的非中国投资者收购TikTok美国业务 [6] 科技行业动态 - Google将停止维护Android开源项目(AOSP),未来所有开发工作将仅在内部分支进行 [7] - 理想汽车宣布开源自研整车操作系统"理想星环OS",投入超十亿元研发费用 [12] - 蔚来拟增发1.1879亿股A类普通股,融资约35亿港元,用于智能电动汽车研发 [11] 汽车行业动态 - 特朗普宣布对所有进口汽车征收25%关税,包括整车和关键零部件 [13] - 奇瑞拟在土耳其投资10亿美元建电动车工厂,年产能20万辆 [14] - 比亚迪发布仰望U7,起售价62.8万元,搭载云辇-Z电悬架和L2+智驾系统 [15] 食品饮料行业 - 雀巢水业务或被多家私募竞购,估值约50亿欧元,包括巴黎水、圣培露等品牌 [8] - 国家发布50项食品安全新标准,要求标示糖和饱和脂肪含量,禁止"零添加"等宣传用语 [10]
OpenAI开放工具包,智能体落地加速
国泰君安· 2025-03-14 19:29
行业投资评级 - 行业评级为“增持” [2] 报告核心观点 - OpenAI于2025年3月12日向公众开放4款AI agent工具包,包括新Responses API、开源Agents SDK、若干内置工具和可观察性工具 [4] - 新工具降低了AI agent应用开发的难度,简化了开发逻辑、编辑方式和交互流程,为AI agent产品开发全面赋能,加速了agent多样化应用的快速落地 [4][9] - OpenAI此举是对谷歌、微软和阿里等竞争者迅速扩大AI agent行业版图的回应,旨在巩固和加强其凭借首个AI agent产品Operator所建立的竞争力和影响力 [9] 工具包具体内容与影响 - **Responses API**:具有网络搜索和文件搜索两项内置工具,其网络搜索工具准确度得分超过同类产品,文件搜索工具在多文件种类、元数据过滤和自定义排序等方面实现升级,能覆盖企业文档管理、市场研究等广泛应用场景,可以显著降低人工检索成本 [9] - **Responses API的计算机操作工具**:由CUA模型支持,可根据代码循环执行点击、输入和滚动等任务,从而促进浏览器或操作系统流程的自动化,提高了agent与外部世界交互的能力,使agent独立执行任务成为可能 [9] - **开源Agents SDK**:可设置agent所采用的LLM模型、内置工具和指令,促进agent智能转换控制权,提供可修改安检机制和可视化跟踪监督流程,适用于自动化客户服务、分步骤研究和潜在客户跟进等场景,令多模型协作趋于简洁,让多线程任务并发处理成为可能,借助极简的操作方式减轻了开发者的代码负担,有助于提高用户留存度 [9] 商业模式分析 - OpenAI采取“免费API+付费工具”的商业模式,不针对Responses API单独收费,而是依照token和其他工具使用情况计费 [9] - 该模式通过“免费API”扩张市场,又借助“付费工具”收回研发费用、增加盈利、实现商业价值,既提供了复杂任务的低成本解决方案以赢得用户和市场,又为公司后续发展提供资金保证 [9] 投资建议与标的 - 报告推荐标的:鼎捷数智、福昕软件、科大讯飞 [9] - 报告受益标的:泛微网络、迈富时、润达医疗 [9] - **科大讯飞**:股价51.8元,预测2024年EPS为0.39元/股,对应PE为132.82倍,评级为“增持” [6] - **福昕软件**:股价69.64元,预测2025年EPS为0.30元/股,对应PE为232.13倍,评级为“增持” [6] - **鼎捷数智**:股价39.57元,预测2024年EPS为0.68元/股,对应PE为58.19倍,评级为“增持” [6]