Workflow
AGI(通用人工智能)
icon
搜索文档
Andrej Karpathy 开炮:智能体都在装样子,强化学习很糟糕,AGI 十年也出不来
机器之心· 2025-10-18 13:44
AGI发展时间框架与当前局限 - AGI的实现仍需约十年时间,当前AI代理存在认知缺陷,包括缺乏多模态能力、无法进行计算机操作、缺乏持续学习能力等[10][11] - AI行业存在过于乐观的预测,将当前阶段称为"智能体的十年"更为准确,而非"智能体之年"[10] - 实现真正可工作的AI代理需要解决智能程度不足、持续学习、记忆能力等关键技术瓶颈[11] LLM认知缺陷与技术挑战 - 大语言模型存在严重认知缺陷,无法胜任复杂编程任务,特别是在处理非模板化、智力密集型代码时表现不佳[35][36] - 当前编码模型在理解自定义实现和代码风格方面存在局限,经常误解开发者的编程意图[36][37] - 模型倾向于过度依赖训练数据中的常见模式,难以适应创新性的代码架构和实现方式[38] 强化学习范式的问题 - 强化学习存在根本性缺陷,其通过最终结果反向加权整个过程的机制效率低下[45][46] - 人类并不使用类似强化学习的方式解决问题,而是通过更复杂的反思和回顾过程[45][46] - 基于过程的监督比基于结果的奖励更合理,但实现自动化信用分配面临技术挑战[48][49] 人类学习与AI学习的差异 - 人类学习通过信息操纵和思考实现知识获取,而LLM仅通过预测下一个token学习,缺乏深度思考机制[56] - 人类记忆能力有限反而有利于泛化学习,而LLM过度记忆训练数据可能阻碍认知能力发展[62][63] - 模型崩溃问题源于合成数据训练的局限性,需要保持足够的熵值来维持输出多样性[57][64] AI对经济增长的影响 - AGI将逐步融入经济增长,预计每年带来约2%的GDP增量,但不会以爆发式方式实现[75][76] - AI自动化将首先应用于适合数字化的领域,如呼叫中心等结构化任务,而非复杂的知识工作[78][79] - 编程是AI应用的理想起点,因为代码本质上是结构化的文本,与LLM的技术特性高度匹配[82][83] 技术发展趋势预测 - Transformer架构可能继续演进,但梯度下降训练大型神经网络的基本范式将保持不变[29][30] - 未来技术进步需要算法、数据、硬件等多方面协同改进,而非单一领域的突破[30][74] - 认知核心参数规模可能优化至十亿级别,通过知识蒸馏去除过度记忆,保留核心推理能力[67][70] 实际应用部署路径 - AI部署将采用渐进式自动化策略,人类作为监督者管理多个AI代理,而非完全取代人工[79][80] - 当前AI在经济价值创造上主要集中在编程领域,其他知识工作的自动化进展相对缓慢[82][84] - 超级智能应被视为社会自动化的自然延伸,是计算趋势发展的结果,而非突变式突破[86]
字节跳动大模型架构再调整:朱文佳由直接向CEO梁汝波汇报转为向吴永辉汇报
搜狐财经· 2025-10-17 20:56
核心人事调整 - 原Seed大模型负责人朱文佳的汇报关系由直接向CEO梁汝波汇报变更为向吴永辉汇报 [3] - 伴随多名核心技术负责人的管理线调整与团队人事更替 [3] - 此次汇报线变动进一步明确了朱文佳在当前团队架构中专注于模型应用相关领域的职责定位 [4] 组织架构演变 - 字节跳动为强化AGI长期竞争力设立Seed部门 [4] - 自2025年2月起团队架构已现调整迹象,当时公司从谷歌挖来DeepMind研究副总裁吴永辉,任命其担任Seed基础研究负责人 [3] - 吴永辉的研究团队与朱文佳主导的应用团队形成研究与实践双轨并行的互补架构,前者侧重基础理论与中长期技术布局,后者专注产品场景落地与短期商业需求 [3][4] 近期密集人事变动 - 在吴永辉负责的管理体系内,近期核心岗位人事调整密集 [3] - 大语言模型负责人乔木因个人不当行为被公司辞退 [3] - 视觉大模型负责人杨建朝官宣休息,其岗位由周畅接任 [3] - AiLab主任李航退休后以返聘形式继续参与工作 [3] - 目前仅有AML和豆包大模型Foundation团队负责人项亮的岗位暂时未发生调整 [3] 关键人物背景 - 朱文佳曾担任百度搜索部主任架构师,于2015年加入字节跳动,2019年担任今日头条App负责人并直接向张一鸣汇报,后担任Tik Tok产品技术负责人 [4] - 朱文佳于2023年牵头组建字节跳动大模型团队,核心聚焦语言和图像模态技术研发及其与搜索、广告等核心业务的融合 [4] - 吴永辉的加入被视为战略级人才引进,其职责聚焦于大模型理论基础研究、AI for science探索等 [3][4]
OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作
36氪· 2025-10-13 18:06
ChatGPT平台与开发者生态 - ChatGPT每周活跃用户已达8亿人,成为新的应用分发平台[2] - 公司推出Apps SDK,允许开发者在ChatGPT上构建应用,但具体分发机制仍需迭代探索[2] - Agent Builder工具实现重大突破,用户可通过可视化界面、上传文件、授权数据源,在几分钟内部署复杂系统[3] - Agent Builder几乎实现零代码构建agent,普通知识工作者也可参与开发,被形容为一场"零代码革命"[4][5] - 模型能力在过去22-23个月内取得惊人进步,是Agent Builder功能提升的核心驱动力[3] AI模型进展与产品战略 - GPT-6的整体开发策略不会因GDPval基准排名结果而改变,但会影响部分后训练方式[10][11] - 公司在GDPval基准中排名第二,仅次于Claude的Opus模型,但认为建立持续进步文化需要坦然承认在某些方面别人做得更好[10] - Sora视频生成应用上线六天使用量很大,但商业模式尚未确定,可能探索按生成次数收费、广告或订阅等模式[19][20][21] - 公司认为高质量视频生成对实现AGI至关重要,涉及空间推理和世界模型学习[18] - 语音交互被认为是重要但非唯一的最终交互形式,公司正在探索全新的设备以实现超高质量的语音交互体验[25][26] AI对工作与创业的影响 - AI工具将导致世界上被编写的软件数量大幅增加,测试和改进创意所需时间大幅下降[6] - 预计第一家由Agent运营的十亿美元级公司将在几年内出现,实现"零人公司"或"单人十亿美元公司"已成为可信的讨论话题[7] - Codex目前已经能够完成整天任务,预计实现连续一周无需人工反馈的工作能力不会太远[7] - 公司观察到AI工具集成到企业工作流后,整个公司的采用和高效使用只需几天或几周时间[16] - 公司认为未来工作形式将发生根本变化,许多当前的知识工作可能不被视为"真正的工作"[22][23] AGI发展路径与行业展望 - 公司将AGI定义为AI能够在大多数经济价值最高的工作上超越人类,但目前更关注AI能否进行新颖发现并扩展人类知识总量[12][13] - 公司注意到AI已在多个学科做出小发现、提出新方法或解决问题,认为这正是AGI开端的重要标志[13] - 实现更强大Agent的技术瓶颈包括更智能的模型、更长的上下文窗口和更好的记忆能力[8] - 公司不打算将ChatGPT打造成美国版微信,而是专注于开发真正优秀的AI超级助手,认为社交功能与ChatGPT的个人化账号定位不协调[24] - 公司对AI监管持开放态度,认为当模型非常强大时应有全球性框架来降低灾难性风险,尤其是针对最前沿的安全问题[23]
OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作
量子位· 2025-10-13 16:47
文章核心观点 - 公司认为当前许多知识型工作可能并非传统意义上的“真正工作”,AI将深刻重塑工作本质并催生全新工作形式 [1][31] - 公司正通过增强模型能力、简化开发工具(如Agent Builder)和探索新交互模式,积极推动AI技术普及和商业化应用 [5][7][39] - 公司对AGI的定义侧重于AI扩展人类知识总和的能力,并认为当前已处于科学发现的开端,对未来进展持乐观态度 [19][20] DevDay产品进展与平台战略 - ChatGPT周活跃用户已达8亿人,公司将其定位为新的应用分发平台,正通过Apps SDK吸引开发者构建应用 [5] - Agent Builder实现近乎零代码构建复杂agent的能力,模型能力的显著提升(对比22-23个月前)是核心驱动因素 [7][8] - 公司预期软件创建数量将大幅增加,创意测试和改进周期将急剧缩短,但具体影响仍在探索中 [9] GPT-6与模型发展策略 - GPT-6的整体构建策略不会因在GDPval基准中排名第二(仅次于Claude的Opus模型)而改变,但会影响部分后训练方式 [16][17] - 公司认为建立竞争优势的基本因素(如网络效应、品牌、数据)未因AI改变,但实现这些优势的具体战术可能需要创新 [16] AGI定义与科学发现前景 - 公司最关心的AGI指标是AI能否进行新颖发现以扩展人类知识总量,认为当前已处于这一进程的开端 [19] - 公司观察到AI在各学科已开始做出小发现、提出新方法或解决问题的事例,对此趋势持乐观态度 [19][20] - 社会对AI能力的适应速度很快,例如图灵测试被通过后,公众兴奋期短暂,随即要求更高性能 [20] AI对社会与工作的影响 - 针对“workslop”(AI生成内容需人工返工)现象,公司认为此现象人类亦存在,经济系统会自然淘汰低效使用工具的组织 [21][22] - 公司提供教育内容和培训以帮助工作流集成AI,在Codex等场景中,企业全面集成和高效使用仅需数天或数周 [23] - 未来工作形式可能更轻松,但人类内在驱动力将促使寻找新事务,其性质可能与当前对工作的认知不同 [31] 产品战略与商业模式探索 - 公司明确表示ChatGPT的目标非打造美国版微信,而是专注于成为优秀的AI超级助手 [35] - Sora与ChatGPT功能分离源于用户对两款产品认知的差异(个人化账号 vs 娱乐应用),但部分功能仍会整合进ChatGPT [36] - Sora的商业模式(如按生成次数收费、广告、收入分成)将取决于产品最终形态,预计在未来几个季度明确 [27][28][29] 未来交互模式与技术愿景 - 公司不认为语音是交互的最终形式,其适用性取决于场景,理想中的计算机应能通过语音准确执行指令且几乎不打扰用户 [39] - 公司正探索打造一种需要全新设备支持的全新计算机使用方式,但目前相关想法仍处于保密阶段 [40][41] - 高质量视频生成被视为实现AGI的重要路径,因其涉及空间推理和世界模型学习,对未来机器人领域进展也至关重要 [26]
他在 10 天内拼出 ChatGPT,如今影响 7 亿人:ChatGPT 负责人的第一次讲述
AI前线· 2025-10-12 13:32
产品愿景与定位 - 公司的长期愿景是打造一个能理解用户背景、伴随成长并解决实际问题的“超级助手”,而非仅仅是一个聊天工具 [7][8] - 目前的产品形态被类比为“MS-DOS”阶段,其终极目标是开发出像“Windows”一样直观易用的界面 [3][41] - 产品定位为帮助用户实现目标(如提升健康、创业、获取第二意见)的通用工具,而非替代人类 [8][9][47] 产品增长与市场表现 - 产品每周活跃用户超过7亿,相当于全球10%的人口,月留存率高达90%,六个月留存率约为80% [2][22][23] - 企业用户数量已达500万,并在90%的财富500强公司中实现自然渗透 [7][36] - 产品为新闻通讯带来的流量已超过Twitter,显示出极强的用户粘性和留存能力 [3][23] 技术演进与模型能力 - 最新模型GPT-5在数学、推理、编程(如SWE-bench测试)和写作方面表现出色,被描述为“质的飞跃”和最具“生命力”的模型 [4] - 模型改进聚焦于三个关键领域:针对核心用例的系统性优化、模型行为与“气质”的提升、以及传统产品功能的完善,各贡献约三分之一留存提升 [25][26] - 技术开发强调实证主义,通过快速发布和真实用户反馈来指导模型迭代,而非仅依赖实验室测试 [28][51][56] 产品开发与迭代文化 - 产品起源于一次内部黑客马拉松,从决定发布到实际上线仅用时10天,体现了“最大化加速”的文化 [11][12][20] - 团队运作强调高节奏和紧迫感,通过每日发布同步会等方式快速决策和调整,以加速学习 [20][21] - 开发哲学结合了从模型能力倒推产品化(艺术)和倾听用户反馈(科学)两种路径 [38][39] 商业模式与定价策略 - 采用免费增值模式,基础功能免费以降低使用门槛,同时通过订阅服务(如20美元/月的Plus套餐和200美元/月的高阶套餐)实现商业化 [4][34][35] - 订阅模式的初衷是筛选高需求用户,后自然发展为重要收入来源,并定期将付费功能下放至免费版 [34] - 企业版的推出源于实际需求(如隐私合规),而非预先规划,体现了对市场机会的快速响应 [36] 用户交互与界面未来 - 当前聊天界面被视为最简单的交付方式,但长期看自然语言是核心,交互形式可能超越现有问答模式 [30][31] - 希望看到更多用户交互创新,认为将所有软件交互代理化是“反乌托邦”的 [31] - 产品成功部分归因于名称(ChatGPT)、免费策略和易用界面等看似偶然但关键的决定 [32] 新兴用例与产品影响 - 除生产力工具外,产品在人际关系建议(如挽救婚姻)、情感支持和日常决策等消费领域涌现出重要用例 [45] - 通过TikTok等平台用户自发分享用例,形成了产品外的学习生态系统,帮助团队发现新方向 [40][45] - 公司选择积极应对高风险用例(如医疗、情感建议),而非回避,认为这是技术民主化的重要体现 [48][49] 团队建设与领导哲学 - 招聘注重好奇心和高潜力,而非特定经验,倾向于招募能独立交付的“弹药桶”式人才 [52][71] - 团队建设强调跨学科融合(研究、工程、设计、产品)和高度信任,通过白板头脑风暴等方式激发创造力 [51][53] - 领导力哲学基于“跟随最聪明的人”和“追求真正好奇的事物”,认为在AI时代提出正确问题比答案更重要 [68][70][72]
OpenAI奥特曼认错:我天生不适合管理公司
量子位· 2025-10-09 15:03
公司核心战略 - OpenAI确立三大核心目标:成为个人AI订阅服务、构建大规模基础设施、最终实现对人类真正有用的AGI [4] - 公司战略已转变为垂直整合模式,认为为实现AGI使命必须比原先想象中做更多事情,并引用iPhone作为成功垂直整合案例 [8][9] - 在资源分配上,当存在资源限制时,GPU将优先分配给研究而非产品支持,基于构建AGI的终极目标研究享有最高优先权 [33][34] 技术发展路径与AGI展望 - Sora项目表面与AGI不直接相关,但公司认为构建真正出色的世界模型对AGI的重要性将超出人们想象 [11] - 推出Sora的理由包括:制作优秀产品获得用户喜爱、让社会提前适应视频模型、视频比文本有更多情感共鸣、帮助推进AGI研究以及增加乐趣和喜悦 [16] - 未来人机交互界面将包括实时渲染视频的世界模型和新型环境感知硬件设备 [19] - 个人认为图灵测试的等价物是AI能够进行科学研究,并预测两年内模型将承担更多科学工作并做出重要发现 [21][22] 基础设施与行业合作 - 公司决定进行非常激进的基础设施押注,因对研究路线图和经济价值从未如此自信,需要整个行业佼佼者的支持 [29] - 公司将与众多伙伴合作,涉及从电子级别到模型分发的所有环节,未来几个月预计有更多动作 [30] - 若对模型能力发展的预测正确,规模扩展的上限离当前位置还非常遥远,但若只有今天模型则不会如此激进 [31][32] 行业宏观观点 - 能源是AI最大的瓶颈之一,历史上更便宜充足的能源是提高人类生活质量最有影响力的事情 [44] - 批评西方长期排斥核能是令人难以置信的愚蠢决定,其推广速度取决于是否具有完全压倒性的经济优势 [44] - 认为AGI的到来是连续性的过程,而非奇点大爆炸 [44] - 深度学习是一个持续给予奇迹的技术,公司能够用当前技术制造出能够找出下一个突破的东西 [24][27]
GPU疯狂抢购背后:一场价值万亿的AI豪赌正在上演!
搜狐财经· 2025-10-08 22:41
行业资本投入规模 - 英伟达H100芯片单价已炒至4.5万美元,相当于一辆特斯拉Model 3的价格 [1] - OpenAI今年已签署约1万亿美元的合同用于购买计算能力,其收入可能不及此数额的1% [3] - 英伟达计划未来十年向OpenAI投资1000亿美元,专门用于购买其自家芯片 [5] - 马斯克的xAI在孟菲斯建造的数据中心项目需耗资数百亿美元,仅购买芯片就可能花费180亿美元,并探索租赁方式囤积价值120亿美元的芯片 [8] - Meta预测到2028年将在人工智能基础设施上投入6000亿美元,该数字高于芬兰的GDP [10] - 微软去年购买了48.5万块英伟达“Hopper”芯片,并与NeoCloud公司达成194亿美元协议以获得超10万块最新GB300芯片的使用权 [10] 行业竞争格局与战略动向 - 行业巨头正通过大规模采购GPU进行战略囤货,以应对未来潜在的芯片短缺或供应链中断风险 [19] - 顶级人才在领域内流动,例如清华物理系传奇姚顺宇从Anthropic离职加入Google DeepMind [17] - OpenAI尝试进军电商领域,推出即时结账功能“Instant checkout”,为中小电商平台带来借助其流量红利低成本获客的机遇 [17] 行业前景与潜在风险 - 有分析指出,英伟达对OpenAI的投资可能是人工智能泡沫破裂的早期迹象,类比1999年的互联网泡沫 [12] - 宏观战略合伙公司分析认为,当前人工智能引发的“美国资本错配”规模比互联网泡沫严重17倍,比2008年房地产泡沫严重4倍 [13] - 行业未来可能出现的三种结局包括:赢家通吃(一家公司实现AGI)、百花齐放(多家公司共存)或泡沫破裂(投资无法收回) [21] - 从历史经验看,技术革命很少被单一公司垄断,因此百花齐放的局面可能性较高 [21]
微软CEO预警:美国AI可能已经形成了巨大泡沫!
搜狐财经· 2025-10-05 18:52
微软CEO对AI行业的观点 - 微软CEO萨蒂亚·纳德拉预警美国AI领域可能已形成巨大泡沫 [1] - 微软等科技巨头已被AI技术绑定,不得不持续投入巨资建设世界级AI数据中心 [1] - 若AI未来的投资想象空间耗竭,当前的巨额投入可能转变为巨型负资产 [1][5] 对大型语言模型的评估 - 微软CEO多次表示并不十分看好大型语言模型,认为其尚未产生巨大的实际客户价值 [5] - 大型语言模型目前也未对GDP增长产生明显的推动作用 [5] 科技巨头的市场地位与潜在风险 - 美国科技七巨头的总市值在2025年9月达到20万亿美元,超过中国GDP [2] - 英伟达单家公司市值达4.5万亿美元,与全球第三大经济体德国的GDP规模相近 [2] - 当前股市表现与公司能否讲述更多AI故事高度相关,泡沫迹象明显 [2] - 科技巨头陷入攀比式投资竞赛,竞相建设超大规模AI数据中心 [5]
3000亿天价算力协议背后:OpenAI的“资本大戏”与AGI的泡沫边界
钛媒体APP· 2025-09-28 22:36
核心观点 - OpenAI与甲骨文签署为期五年总价值3000亿美元的算力合作协议 引发资本市场剧烈波动但实际可兑现性存疑 [1] - OpenAI通过一系列高额长期合作协议构建资本叙事 但其财务现实与承诺存在严重脱节 年均支出远超当前收入 [2][3] - 资本市场形成对OpenAI的"信仰共识" 使其成为撬动资本的杠杆 合作条款缺乏透明度但仍推动相关企业股价上涨 [5][6] - 行业竞争格局因高额承诺陷入被动追逐 中国AI企业迎来战略窗口期 可能通过技术应用结合实现弯道超车 [12][13] 合作协议与市场反应 - OpenAI与甲骨文签署五年3000亿美元算力合作 单日推动甲骨文股价最高涨43% 市值突破9200亿美元 [1] - 创始人拉里·埃里森个人财富单日暴涨超1000亿美元 短暂成为全球首富 [1] - 股价次日回吐6% 市场对天价协议实际可兑现性产生质疑 [1] - 与CoreWeave签署累计上限超220亿美元算力合约 接受软银百亿美元阶段性投资 [2] - 与NVIDIA达成战略合作 后者承诺分阶段注资最高1000亿美元 [2][7] 财务现实与支出承诺 - 3000亿美元合同分摊五年年均支出600亿美元 相当于OpenAI当前年收入的六倍 [3] - 2025年公司年化收入达120亿美元 同比增长200% 月收入突破10亿美元 [3] - 2025年预期现金消耗上调至80亿美元 服务器租赁成本或超140亿美元 [3] - 计划投入近2000亿美元布局算力基础设施 包含千亿级自建服务器计划 [3] - 2025年预计净亏损约50亿美元 尚未实现稳定盈利 [3] 资本运作模式 - 合作协议多采用"长期承诺"、"合同上限"、"分期部署"形式 强调"长期主义"理念 [2] - 战略通过先铺量叫价承诺 再靠未来规模压低单位成本扭转现金流 [2] - 资本市场形成OpenAI不会倒下的共识 理性财务分析被狂热情绪取代 [5] - 媒体推动合作消息形成舆论磁场 吸引资本注意并推高相关企业股价 [6] - 合作条款以"容量""扩展"表述为主 具体付款条款与风险分担机制未公开透明 [6] 行业竞争影响 - 高额合同产生"锁价效应" 迫使竞争者要么追高跟进要么被边缘化 [7] - NVIDIA宣布对OpenAI分阶段注资1000亿美元 行业陷入加杠杆投入竞争 [7] - 若环节出现兑现困难或宏观环境逆转 整个体系可能面临连锁风险 [7] - OpenAI的AGI光环因GPT-5多次延期及表现未达预期而削弱 [12] - 中国AI企业如百度文心、阿里通义千问、腾讯混元在技术评测与商业化落地取得进展 [12] 发展模式对比 - OpenAI资本运作模式与罗辑思维投资papi酱案例高度相似 均通过高调承诺获取声量 [10][11] - 罗辑思维实际未支付投资款但获得巨大品牌曝光 被指透支公众信任 [10] - OpenAI若承诺多兑现少 可能赢得短期资本热度但失去长远行业信任 [11] - 中国AI企业更专注于技术与应用实际结合 凭借快速迭代和务实商业模式可能实现超越 [13]
奥特曼和量子计算奠基人讨论GPT-8
量子位· 2025-09-28 11:39
核心观点 - 萨姆·奥特曼与戴维·多伊奇就“AI能否发展为具备意识的超级智能”展开对话,奥特曼以未来GPT-8可能解决量子引力问题并解释其思考过程为例,论证AI具备超级智能的可能性 [1][8][22] - 戴维·多伊奇最初认为AI无法发展为具备意识的超级智能,但被奥特曼的GPT-8假设说服,认为如果AI能提供解决复杂问题(如量子引力)的“过程故事”,则可被视为具备解释性创造力 [1][11][12][22] 奥特曼的观点 - 奥特曼极度乐观地认为,即使在AI世界里,人类依然永远不会缺少可以做的事、可以发挥价值的方式、可以解决的问题和可以探索的未知 [6] - 奥特曼认为AI有可能发展成具备意识的超级智能,并以GPT-8为例,假设其能搞懂量子引力并讲述如何做到,以此论证AI的超级智能潜力 [1][8][22] 戴维·多伊奇的观点 - 戴维·多伊奇最初认为AI不会发展成为具备意识的超级智能,并指出现有系统(如ChatGPT)的能力是知识的副产物,而非真正的AGI [11][12][13] - 多伊奇强调“解释性创造力”和“过程故事”是判断智能的关键,认为真正通用的智能需具备主动选择动机的能力,而非机械输出 [18][19][21] - 多伊奇被奥特曼的GPT-8假设说服,认为如果AI能提供类似爱因斯坦发现相对论那样的“过程故事”,则可被视为具备超级智能 [22] 对话背景与影响 - 对话围绕AGI定义标准模糊、目标不断变化展开,引发网友讨论,有人认为AGI无法衡量,目标已转向ASI(超级人工智能) [3] - 多伊奇是量子计算奠基人,曾提出量子图灵机理论框架和Deutsch-Jozsa算法,为量子计算机发展奠定数学基础 [23][24][26]