Workflow
Codex
icon
搜索文档
深度|Andrej Karpathy:行业对Agent的发展过于乐观,一个能真正帮你工作的Agent还需要十年发展时间
Z Potentials· 2025-11-05 10:57
图片来源: Dwarkesh Patel Z Highlights Andrej Karpathy 是 OpenAI 联合创始人之一,前特斯拉 AI 与自动驾驶视觉部门负责人,离开特斯拉后创立 AI 教育公司 Eureka Labs 。他于 2015 年在斯坦福大学 获得博士学位,师从被誉为 AI 教母的李飞飞,主要研究领域为自然语言处理与计算机视觉的交叉领域,以及适用于这一任务的深度学习模型。他在 2024 年 被时代杂志评选为在 AI 领域最有影响力的百名人物之一。本期节目发布于 2025 年 10 月, Andrej Karpathy 接受了科技自媒体人 Dwarkesh Patel 的播客访谈,主 要讨论了大语言模型的工作机制与未来方向、 AI 强化学习与人类学习的差异、 Agent 系统的演化潜力,以及他对模型坍缩、数据质量和未来的教育的长期思 考。 Dwarkesh Patel: 你认为哪些问题需要十年才能真正解决?瓶颈在哪里? Andrej Karpathy: 我觉得,关键在于要让Agent真正"能用"。当我们谈论Agent时,无论是实验室的想法还是我个人的理解,都应该把它想象成一个你雇 来一起 ...
说话像ChatGPT,统统拉黑,「AI腔」正毁掉社交,奥特曼都受不了
36氪· 2025-11-03 17:49
新智元报道 【导读】当你发现自己刷到的视频、帖子是「AI制造」时,当身边的人用一种「AI腔调」和你说话时,你是不是想要迅速滑走,或者直接拉黑?加州大 学伯克利分校等机构的权威研究证实,AI正在改变我们的说话、写作等交流方式,让我们的交际「塑料感」十足。 遇到AI,直接拉黑。 不是AI,说话像AI的也拉黑! 就连奥特曼,这位亲手让ChatGPT风靡全球的「AI之父」,最近也被铺天盖地的「程序味儿」吓到了。 他忍不住吐槽Reddit上的AI腔调(LLM-speak),认为人们开始像AI一样说话,这让人际互动「感觉很假」。 他也担心过于依赖和模仿AI,可能会让我们失去人性最宝贵的东西。 AI会让我们丢失人性吗? 小心!充满「塑料感」的AI腔 故事,还要从奥特曼最近的一次「网上奇遇」说起。 自ChatGPT发布以来,「AI腔」就一直颇受网友诟病。 他在浏览一个关于Codex的论坛帖子时,发现这些帖子的讨论,对于Codex的评价都过度正面,甚至还提到了竞品Claude Code。 内容基本属实,但总让人有一种怪怪的感觉。 忽然,第六感告诉他:这该不会是AI写的吧! 让他觉得不对劲的,不是这些讨论内容的真实性,而是,这些 ...
OpenAI CEO:算力总有一天会过剩
搜狐财经· 2025-11-03 12:20
近日的一期播客节目引发了业界的关注,在其中OpenAI CEO奥尔特曼(Sam Altman)与微软CEO纳德拉(Satya Nadella)进行了联合访谈,奥尔特曼在其 中否认了明年上市的消息,并透露目前的收入远不止130亿美元,他们还聊到目前是否算力过剩、AI的未来等业界关注的问题。 提及当前的算力问题,奥尔特曼直言,总有一天算力一定会过剩,至于是两三年后,还是五六年后说不准,但这肯定会发生,且可能会多次发生。这背后有 人类心理因素,也涉及"泡沫循环"。他坦诚表示,供应链极其复杂,各种奇怪的事都会发生,技术格局也会不断剧烈变化。 近期OpenAI在算力基建上万亿美元的豪赌备受讨论,也被质疑存在泡沫。主持人也问及:一家收入130亿美元的公司,如何能签下1.4万亿美元的支出承诺? 针对这一点奥尔特曼展开了反驳,他称,"我们的实际收入远不止130亿美元",并表示现在有很多人都非常想买OpenAI的股票,"那些在网络上对我们算力 支出大惊小怪、担忧不已的人,要是能买到OpenAI的股份,肯定会抢着入场。"他表示如果有股东想卖股份,他完全可以很快地把它们卖给那些在社交媒体 上喊得最厉害的人。 奥尔特曼进一步解释,公 ...
OpenAI CEO最新回应:收入远不止130亿美元
第一财经· 2025-11-03 12:11
2025.11. 03 本文字数:1437,阅读时长大约2分钟 作者 | 第一财经 刘晓洁 提及当前的算力问题,奥尔特曼直言,总有一天算力一定会过剩,至于是两三年后,还是五六年后说 不准,但这肯定会发生,且可能会多次发生。这背后有人类心理因素,也涉及"泡沫循环"。他坦诚 表示,供应链极其复杂,各种奇怪的事都会发生,技术格局也会不断剧烈变化。 纳德拉指出,现在面临的最大问题并不是"算力过剩",而是电力和基础设施建设速度的问题。"如果 没法足够快地在靠近电源的地方完成数据中心建设,那么即使手里有一堆芯片,也可能插不上 电。"但是,OpenAI的赌注是,随着智能变便宜,需求会持续爆发式增长。 在一小时的访谈中,主持人也聊到了近期OpenAI的上市传闻,奥尔特曼直接否认了OpenAI 计划明 年上市的信息,他表示:"我们没有任何具体的计划或时间表,董事会也没有就此作出任何决定。"他 提到,从长远来看,那可能是公司自然会走到的一步,仅此而已。 就 在 近 期 OpenAI 完 成 了 资 本 重 组 , 其 非 营 利 实 体 现 更 名 为 OpenAI 基 金 会 ( OpenAI Foundation),并持有约 ...
奥特曼回应一切:重组后仍需微软支持,不相信OpenAI的欢迎做空
36氪· 2025-11-03 09:47
近期 OpenAI 完成了资本重组,其非营利实体现更名为 OpenAI 基金会(OpenAI Foundation),并持有约 1300 亿美元的营利部门股权,营利部门则改制为 一家公益性公司,名为 OpenAI Group PBC。 这意味着,OpenAI 与微软的合作关系也迎来了新篇章。 2018 年,还是非营利性组织的 OpenAI 迫于生存压力与微软达成合作并调整组织结构,成立营利性子公司 OpenAI LP。获得资金和资源的 OpenAI 迅速崛 起,并于微软深度捆绑。如今,双方走向开放合作。 这两天一个播客非常火,主角正是山姆·奥特曼和微软 CEO Satya Nadella。 奥特曼称与微软的合作为「有史以来最伟大的技术合作之一」。Satya 也透露,当年微软从 10 亿美元投资加注到 100 亿,正是在看到早期 Codex(代码生 成模型)演示后做出的关键决定。 两人深入讨论了投资结构、产品分销、算力基建等未来战略。此次访谈也澄清了外界关注的几个核心问题: 「开放」的分销协议:OpenAI 的前沿模型(如未来的 GPT-6)将通过「无状态 API」在 Azure 上独家托管至 2032 年(或 ...
美国编程产品输出「中国话」
36氪· 2025-11-02 16:02
行业趋势反转:美国科技公司采用中国大模型 - 美国编程工具Cursor和Windsurf推出自有模型Composer和SWE-1 5,并被证实采用中国大模型技术,Windsurf明确表示其模型由中国智谱AI提供[1] - 估值93亿美元的美国平台Vercel宣布将智谱GLM-4 6纳入其官方API服务,云服务平台Together AI部署阿里巴巴的Qwen-3-Coder,AI推理平台Featherless支持Kimi K2[5] - 趋势从一年前中国公司接入美国模型,反转为美国AI公司纷纷采用中国大模型,主要原因是中国的开源模型在性能、速度和成本上具备优势[5] 中国大模型的竞争力与市场表现 - 自今年7月以来,国产大模型如DeepSeek、Qwen、Kimi-K2等频繁霸榜各大模型榜单,证明其已具备全球竞争力,尤其在编程领域得到核心玩家认可[6] - 在OpenRouter全球大模型超市的调用量排名中,2025年9月Top10产品前5名有4家是编程工具,国产模型从无存在感到迅速霸榜[7][8] - 智谱GLM和月之暗面Kimi在OpenRouter上最受欢迎,Kimi占据约2%-5%市场份额,GLM的使用量一度超过10%[8] 商业化策略与市场竞争 - 国产大模型通过高性价比策略抢占市场,Social Capital创始人表示已在Groq上使用Kimi-K2,因OpenAI和Anthropic模型价格过高[6] - 智谱第一家推出支持Claude Code的包月套餐,定价20-200元,相当于Claude价格的1/10,预计年收入过亿[11] - Kimi在程序员节推出类似优惠包月套餐,MiniMax M2发布即限时免费并预告推出Coding套餐,竞争日趋白热化[11] AI编程赛道的战略重要性 - AI编程是近两年AI领域最先跑通产品市场契合的赛道,也是全球化竞争最激烈的领域,海外Anthropic领先,OpenAI发布GPT-5及Codex作为回应[7] - 国内仍在牌桌上的大模型厂商均瞄准编程这一确定性战场,OpenRouter调用量成为重要的市场验证过滤器[7] - 大模型竞争破局的关键在于选对并被广泛验证的场景,这场竞争是坚韧性、智力与判断力的综合考验[12]
奥特曼回应一切:重组后仍需微软支持,不相信OpenAI的欢迎做空
机器之心· 2025-11-02 16:01
公司资本重组与治理结构 - OpenAI完成资本重组,其非营利实体更名为OpenAI基金会,并持有约1300亿美元的营利部门股权[2] - 营利部门改制为一家公益性公司,名为OpenAI Group PBC[2] - 此次重组创建了最大的非营利组织之一,该组织已拥有1300亿美元的OpenAI股票,并将首批250亿美元用于健康和AI安全等计划[11] 与微软的合作关系 - 双方合作关系被描述为“有史以来最伟大的技术合作之一”[7][10] - 微软早期信念至关重要,其投资从10亿美元加注到100亿美元的关键决定是在看到早期Codex演示后做出的[7][29] - 合作关系允许OpenAI的非营利组织发展,同时公益公司能获得必要资本[11] 产品分销协议 - OpenAI的前沿模型(如未来的GPT-6)将通过“无状态API”在Azure上独家托管至2032年(或AGI被验证实现时)[12][14] - 其他产品如Sora、智能体、开源模型和可穿戴设备则可以在其他平台分销[12][14] - OpenAI需要就其所有收入向微软支付收入分成,该安排将持续到2032年或AGI实现时,若收入为200亿,分成可能达30亿[13] 财务状况与增长前景 - OpenAI收入不止报道的130亿美元,且正在急剧增长[14][19] - 公司计划收入会急剧增长,押注于成为“重要的AI云之一”、消费设备业务以及“能够自动化科学的AI”[19] - 针对1.4万亿美元支出承诺的质疑,公司表示正在做一个前瞻性的押注,赌收入会继续增长[18][19] 算力需求与瓶颈 - 过去一年公司算力扩大了约10倍,并认为若算力增加10倍,收入增长可能不会差太远[21] - 当前最大瓶颈已不是芯片供应,而是电力,即无法足够快地在靠近电源的地方完成建设[23][24] - 供应过剩肯定会出现,但公司押注随着算力变得更便宜,需求会大大增加[22] 人工智能发展愿景 - 预计智能体将从执行多小时任务发展到多天任务,这将在明年发生,使人们能“以前所未有的速度开发软件”[25] - 对“AI自动化科学发现”充满期待,认为即使是非常小的科学发现也极其重要[26] - 对开发新形态的计算设备感到兴奋,该设备能总是和用户在一起,并对用户整个生活和流程有非常好的上下文感知[27] 行业影响与商业模式演变 - SaaS应用程序的架构正在改变,旧的“业务逻辑层”正被“智能体层”取代[30] - 未来价值将体现在“Token工厂”(高效运行算力的诀窍)和“智能体工厂”(知道如何最有效地使用token创造业务价值)[31] - 企业领域的智能体商业化路径清晰,智能体被视为新的“席位”,而消费者领域的商业化则相对模糊[32][33] - AI将带来生产力曲线的弯曲,未来增加的员工将比AI之前的员工人数带有更大的杠杆作用[34]
奥特曼纳德拉同台回应一切:合作细节、OpenAI未来路线曝光
量子位· 2025-11-02 15:00
微软与OpenAI的合作关系 - 微软自2019年起已向OpenAI投资约130-140亿美元,获得完全摊薄后约27%的股权 [4] - 双方均认为此次合作是科技史上最伟大的合作关系之一,微软的早期坚定信念对OpenAI的成功至关重要 [5][6] - 合作建立了独特的全球最大规模非营利组织之一OpenAI基金会,其架构允许非营利机构价值增长,同时让旗下公益性公司获得扩张所需资本 [4][7] OpenAI的组织结构与基金会使命 - OpenAI重组后形成上层非营利组织、下层公益性公司的架构,非营利部分目前持有价值1300亿美元的OpenAI股票 [11][12] - 基金会首批250亿美元将投向医疗健康和AI安全与韧性领域,旨在确保AGI惠及全人类 [12] - 选择医疗健康是因为AI能帮助治愈疾病并共享知识,选择韧性则是为了资助网络安全防御、AI安全研究等,帮助社会平稳度过技术变革 [14][16] 合作细节与商业模式 - 在2032年前的7年内,OpenAI的前沿模型不能在其他主要云平台上分发,但开源模型、Sora、Agent等技术可在其他平台发布 [19] - OpenAI需就全部收入向微软支付分成,协议持续至2032年或AGI被验证,例如若收入200亿美元,按15%比例需支付30亿美元 [20] - 微软获得GPT系列模型7年独占权,并可免版税使用前沿模型知识产权,将其嵌入GitHub、Microsoft 365等产品 [57] OpenAI的财务与增长前景 - OpenAI 2025年营收预计为130亿美元,但公司声称实际收入远高于此,并计划未来4-5年投入1.4万亿美元于算力 [24][25] - 公司规划营收快速增长,业务将涵盖AI云服务、消费设备及自动化科学研究,未来可能考虑上市,但尚无具体计划或时间表 [25][40] - 若以1000亿美元营收和10倍收入倍数上市,公司估值可能达到1万亿美元 [42] 算力需求与行业挑战 - 算力需求受单位智能成本影响,若成本下降100倍,使用量增长将远超100倍,当前最大限制并非GPU供应,而是电力与基础设施建设速度 [29][33] - 算力过剩未来必然会发生,但具体时间不确定,可能在未来2-6年内,供需周期受技术格局和人类心理因素影响 [33] - 微软Azure本季度增长39%,年化收入达930亿美元,但因算力供给受限,增长潜力未完全释放,公司有4000亿美元的剩余履约义务需清理 [63] AI技术发展与应用前景 - 到2026年,AI有望在科学研究领域实现原创性发现,Codex模型能力可能从处理"几小时任务"跃升至"几天级别任务" [45] - 智能代理与新型用户界面结合将产生新的人机交互形态,其影响力可能超过ChatGPT,推动工作流程重构 [46][47] - AI将显著提升生产力,改变工作方式,企业员工增长可能慢于收入增长,但员工杠杆率将远高于以前 [80][82] 微软的战略布局与价值创造 - 与OpenAI的合作不仅带来股权收益,还通过Azure的分成、独家API分发及吸引新客户迁移至Azure创造战略价值 [56] - 微软通过AI产品组合创造价值,GitHub Copilot、ChatGPT、Microsoft 365 Copilot及消费级Copilot构成全球最大AI产品体系 [53] - 公司业务多元化有助于平衡利润与风险,云计算投资回报通过5-6个不同业务的协同放大,而非仅依赖Azure增长 [62][68]
微软和OpenAI CEO罕见同场对话:OpenAI重组、AI泡沫质疑、算力需求......
硬AI· 2025-11-02 11:59
OpenAI与微软合作关系 - 只有"无状态API"独家保留在Azure平台至2030年 其他产品将在多平台分发 [2][3][20] - 微软对OpenAI投资约135亿美元 获得完全稀释后27%所有权 投资全部用于训练 不计入收入 [4][16][65] - 收入分成协议将持续至2032年或AGI实现 若OpenAI年收入200亿美元 微软可分得30亿美元 [21][24] - 合作关系被评价为"科技史上最伟大的合作之一" 微软早期坚定信念是关键支持因素 [8][16][17] 算力需求与收入增长 - OpenAI算力过去一年扩大约10倍 若再增10倍算力 收入增长将接近10倍 [2][24][27] - 当前最大制约因素是电力供应和基础设施建设速度 而非算力过剩 [3][32][61] - 算力过剩终将出现 时间可能在2-6年内 且周期会反复出现 [3][31][33] - Azure本季度增长39% 年化收入达930亿美元 若不分配算力给研发 增长率可达41%-42% [61] 商业模式与市场前景 - OpenAI计划成为重要AI云服务提供商 发展消费者设备业务和自动化科学研究 [24][25] - 高利润业务来自Copilot系列产品(安全Copilot、Github Copilot、医疗健康Copilot等) [7][61] - 微软剩余履约义务达4000亿美元 合同平均期限2年 需要大规模资本支出来消化订单 [62] - 新型SaaS应用架构正在形成 AI代理层将取代传统业务逻辑层 低ARPU高使用率模式更具优势 [66][67][68] 技术发展与产品规划 - Codex预计明年能完成需要数天的编程任务 将改变软件开发方式 [6][44] - 未来将推出可在低功耗设备本地运行GPT-5或GPT-6级别模型的消费设备 [6][35] - 2026年可能实现小型科学发现 若成功将为更大突破奠定基础 [6][44] - 软件优化速度远超硬件改进 推理堆栈优化呈指数级增长 [34] 公司架构与资本规划 - OpenAI重组创建史上最大非营利组织之一 初始资本包含价值1300亿美元OpenAI股票 [16][18] - 非营利组织将首先投资250亿美元于医疗健康、AI安全和韧性建设领域 [18][19] - OpenAI上市计划尚未确定具体时间表 但未来有可能进行IPO [36][37][38] - 公司平均年龄约30岁 婴儿潮趋势积极 员工规模保持稳定 [14][15][76] 行业监管与竞争环境 - 担忧美国各州AI监管法律拼凑局面 科罗拉多州AI法案将于2月生效 [39][40] - 呼吁联邦层面统一监管框架 避免50个不同州法律造成合规困境 [39][40][42] - 超大规模云服务商竞争激烈 规模化运营和成本结构优化是关键优势 [63] - 美国再工业化进程加速 科技公司未来4-5年资本支出达4万亿美元 [79][80]
OpenAI发布安全研究智能体:能像人类专家一样挖漏洞、写补丁
36氪· 2025-10-31 13:17
产品发布与核心功能 - OpenAI于10月31日发布名为Aardvark的安全研究智能体,由GPT-5模型驱动,能够自主完成从代码分析到补丁生成的全流程漏洞狩猎与修复 [1] - Aardvark作为智能体系统,通过大语言模型的推理能力与工具调用功能,深入理解代码行为并识别潜在漏洞,完整复现了安全研究员的系统化工作流程 [2] - 该系统采用四阶段防御流程:威胁建模、代码级扫描、验证沙盒和自动修补,深度集成GitHub、Codex及主流开发流程,提供持续且非侵入式的安全扫描服务 [4] 技术性能与实战表现 - 在植入已知漏洞和合成漏洞的基准测试中,Aardvark成功识别出92%的问题 [5] - 该智能体在真实开源项目中发现了多个关键问题,其中包括十个获得CVE编号的高危安全漏洞 [5] - Aardvark还发现了超越传统安全缺陷范畴的复杂错误,包括逻辑错误、不完整修复问题和隐私风险 [5] 公司战略与行业定位 - Aardvark是OpenAI智能体产品矩阵的关键一环,此前公司已于2025年5月发布Codex智能体,7月发布ChatGPT智能体,表明公司正从通用大模型向垂直领域智能体全面转型 [6] - 选择网络安全作为突破口精准契合市场痛点,2024年全球有超过4万个CVE漏洞被曝光,OpenAI内部数据显示1.2%的代码提交会引入错误 [6] - Aardvark定位为深度集成到开发流程中的主动防御体系,而非传统的事后扫描工具 [6] 市场影响与应用前景 - Aardvark将GPT-5的语言理解能力、Codex驱动的补丁生成机制与验证沙箱环境深度融合,为现代软件开发团队提供完整解决方案 [7] - 该平台有望引领企业在持续集成/持续部署环境中安全防护模式的重大变革,成为网络安全团队的能力放大器,缓解安全团队的警报疲劳问题 [7] - 对于AI工程师和部署分布式AI系统的团队,Aardvark展现出独特价值,其沙箱验证机制与持续反馈循环与基于CI/CD的机器学习运维体系高度契合 [7]