AGI
搜索文档
阿里辟谣千问模型团队集体离职
第一财经· 2026-03-05 21:15
阿里巴巴对千问模型相关传闻的官方回应 - 公司明确否认“千问模型核心团队集体离职”的网络传闻,表示目前千问模型团队稳定,所有产品与服务运行正常 [1] - 公司重申千问模型将坚持开源策略,并强调其基础模型团队从未被设置DAU等商业化KPI,模型的核心目标是不断追求智能上限以实现AGI [1] - 公司表达了继续吸引全球顶尖AI人才的意愿,并承诺将继续加大投入以支持千问团队 [1]
吴恩达复盘百度岁月:我带过的自动驾驶、智能音箱都成了!Altman 我也带过,但 Gemini 3 比 ChatGPT 强
AI前线· 2026-03-05 09:42
新版“实用AGI测试”的提出与目的 - 针对当前AGI概念被过度炒作、定义模糊且标准混乱的问题,吴恩达团队提出了一套以“实际工作能力”为核心的新版图灵测试[2] - 该测试旨在重新界定AGI、校准行业与公众预期,避免因虚高期待引发AI泡沫与行业寒冬[2] - 测试让AI或熟练人类在配备网络、浏览器、Zoom等常用软件的电脑环境中,接受评委设计的、持续数天的真实工作任务,包含培训、执行与反馈环节,且任务内容不提前透露[2][13] - 若AI能像专业人类一样高质量完成具备经济价值的工作,即视为通过测试,这更贴近大众对AGI的普遍认知[2][13] - 推出这套测试的核心是为了纠正企业随意降低AGI标准带来的误导,减少对学生、企业决策者与资本的错误影响,通过挤掉概念泡沫让行业回归理性投入[2] 对AGI现状与定义的看法 - 就任何合理的AGI定义而言,2026年不会实现AGI,除非有人大幅降低AGI的标准[10] - 最熟悉的AGI定义是“能够完成人类能做的任何智力任务的AI”,目前离这一天还非常遥远[11] - AGI现在被炒得太热,已经从一个严谨的技术概念变成了营销术语,这在误导很多人[12] - 许多团队在试图降低AGI的定义门槛,但当不同团队用不同定义套上“AGI”这个词时,这个词就失去了意义[5][24] - 大众心中的AGI就是类人通用智能,狭隘的技术定义宣称与公众理解不符[24] - 纠结AGI反而会分散注意力,短期内实现不了,但没有AGI依然有大量极具价值的工作可以做[14] AI技术发展路径与规模化 - 规模化时代并未结束,但已不再是唯一路径[6] - AI的进步呈指数级发展,但推动进步所需的资金也同样呈指数级增长,规模化仍然有更多潜力可挖,但在现阶段不再是提升AI的唯一途径[18] - 早期“堆数据、堆参数”的简单模式已不可持续,现在很多团队都在大力做合成数据生成,投入更多人力工程,研究不同的强化学习方案[6][19] - AI模型几乎已经读完了整个公开互联网,简单的规模化方式不再有效[19] 1. 在很长一段时间内,进一步扩大模型规模都不再带来收益,才会改变对规模化的看法[19] 智能体工作流(Agentic AI)的价值 - 智能体式AI(Agentic AI)是一个正在崛起的趋势,构建能落地的商业流程AI需要大量工作,但一旦做成价值巨大[14] - 2026年及之后,会有大量工作投入到AI智能体与智能体工作流中,去完成高价值、高经济意义的任务[15] - 在规模化大模型的基础上,再注入其他类型的知识,可以构建更可靠、性能更强的工作流[16] - 更聪明的模型无法直接替代可靠的工作流,在企业级高可靠场景中,结构化、可控制的智能体工作流仍是现阶段落地的核心[6] - 对很多工作流来说,可靠性还不足以投入生产环境,团队会把工作流拆解、分步实现以保证稳定可用[20] AI对就业与教育的影响 - AI不会大面积取代岗位,但会用AI的人会取代不会用AI的人[8] - 只有呼叫中心、翻译、配音等极少数工作会被近乎完全自动化[8][38] - 绝大多数职业只会被AI部分赋能,AI通常只能自动化30%-40%的工作,剩下60%-70%仍需人类完成[38] - 真正的危机不在失业,而在教育体系跟不上AI时代,大量非技术岗位(营销、财务、人力)都急需具备AI能力的人才[8] - 大学系统的适应速度偏慢,企业现在极度缺乏懂AI的各行各业人才,教育体系转型非常困难[35] 中美AI发展格局 - 美国在闭源模型上占优,中国则在开源与开放权重模型上走在世界前列[8] - 目前美国在闭源大模型方面仍处于领先地位,但中国在开源、开放权重模型领域已经大幅领先美国[41] - 过去一两年,中国推出了大量顶尖的开源模型(如DeepSeek、Qwen系列等),全球开发者可免费下载使用,生态活力极强[41] - 两国各有所长、多维竞争,共同构成全球AI最重要的两极,整体处于并跑、互补的状态,而非一方绝对领先[8][41] 开源与闭源模型的未来 - 开源现在发展得很好,每年可用的开源/开放权重模型都在快速增长,开源生态非常强劲[34] - 不希望未来出现只有两三家守门人掌控前沿AI的局面,开源与开放权重模型是避免出现少数守门人的关键[29] - 保住AI行业如今比移动领域更高的创新自由度,会涌现更多发明与应用[29] AI发展的核心挑战与瓶颈 - 持续学习当前最大的瓶颈是还不知道该怎么做,路径不清晰[29] - 实现细节和工程难度非常重要,提示词构造、工具提供、框架设计等细节至今仍然至关重要,到2026年依然影响巨大[25] - 样本效率是关键,如果训练AI完成某项任务需要花费百万美元,对很多任务来说就不划算[27] AI的社会价值与行业责任 - AI今天已经在为世界带来巨大的正向价值,任何能加速AI进步的事都会让生活变得更好,整体净收益远大于潜在危害[30] - AI的终极意义是把“智能”这种曾经昂贵的资源变成每个人都可使用的能力[8] - 行业很多人真的想做正确的事,重视安全并认真对待负责任的AI[32] - 作为AI从业者有责任帮助被自动化冲击的岗位掌握新技能、重返职场[37] 个人愿景与行业观察 - 做事有两个最高优先级:让人类变得更强大;帮助他人实现他们的梦想[45] - 希望赋能每一个人用AI构建东西,让开发者和所有人都能用AI创造价值[44] - 离开大公司的原因之一是有些业务(如关税合规)不适合在互联网大公司内部做,而风投工作室可以孵化多元化的创业公司[44] - 回顾技术变革历史,每当出现颠覆性技术时,新入局者和老牌企业都有机会,这场博弈还远未结束[22]
500亿巨额投资「分期付款」背后,亚马逊与OpenAI对赌AI生死局
雷峰网· 2026-03-03 14:14
亚马逊对OpenAI的投资交易结构 - 亚马逊对OpenAI的500亿美元投资承诺采取“考核式投资”结构,初期仅支付150亿美元“首付”,剩余350亿美元“尾款”的支付以OpenAI成功上市并达到AGI技术里程碑为硬性条件 [2] - 该交易使亚马逊同时获得了一个为期8年、价值1880亿美元的云服务合作大单,合作规模从之前签订的380亿美元大幅提升 [1][13] 亚马逊的投资动机与战略考量 - 亚马逊2025年自由现金流同比暴跌70.7%,仅剩112亿美元,一次性拿出500亿美元会对资产负债表与股价造成灾难性冲击,150亿美元是其可承受的安全上限 [4] - 亚马逊AWS云业务增长面临压力,2025年第三季度增速仅为17%,创2022年以来新低,而同期微软Azure依托OpenAI生态实现了39%的高速增长,差距接近两倍 [11] - 亚马逊内部承认其自研AI助手AmazonQ在准确性等方面“显著落后”于微软Copilot等竞争对手,导致客户流失风险加剧,自研路线已无力支撑AI生态 [12] - 投资旨在锁定OpenAI这张顶级模型牌以稳固云业务基本盘,并趁OpenAI欲挣脱微软独家绑定的窗口期,抢占核心云供应商席位,拆分微软掌握的AI模型分发权 [13] - 附加条款要求OpenAI使用亚马逊的Trainium AI芯片,为自研芯片提供顶级AI公司的“实战背书”,有助于验证性能、向其他客户推广并降低对英伟达GPU的依赖 [14] 亚马逊的财务状况与资本开支 - 亚马逊2025年总营收达7169.24亿美元,同比增长12.38%,但资本开支高达1318亿美元,同比大增59% [4] - 2026年资本开支预期进一步飙升至2000亿美元,同比再增54%,支出规模已远超全年经营现金流 [4] OpenAI的现状与接受条款的原因 - OpenAI 2025年全年营收为131亿美元,资金消耗80亿美元,调整后毛利率为33%,低于竞争对手Anthropic的38% [5] - 公司未来五年内预计需要约6650亿美元来支付算力成本,算力成本飙升导致经济账滑向失控边缘 [19] - 接受苛刻条款是为了对冲三大挑战:被微软深度绑定、成本失控以及算力饥荒 [18] - 引入亚马逊旨在打破微软一家独大的封闭格局,拓宽商业化渠道,并缓解研发与算力的资金缺口 [18][19] - 公司明确表示有意使用非英伟达芯片以扩大算力规模,确保研发节奏不受基础设施制约,因此接受使用亚马逊Trainium芯片的条件 [20] 交易相关方与市场背景 - 在本轮总额1100亿美元的融资中,除亚马逊承诺500亿美元外,软银和英伟达各投资了300亿美元 [19] - 融资完成后,OpenAI整体估值已达7300亿美元 [2][5] - 微软在本轮融资中并未参投,其目前持有OpenAI 27%的股权,并掌控着在Azure云平台运行OpenAI模型的独家授权 [13][18] - OpenAI高管讨论过最快在2026年第四季度上市,此轮融资是其迈向最终IPO的关键一步 [5]
猎豹移动傅盛:14天、1157条消息、22万字对话,我养AI龙虾的实战分享!
混沌学园· 2026-03-02 19:58
AI Agent(龙虾/OpenClaw)的核心定义与能力 - 龙虾(OpenClaw)被定义为“工具的AGI”,其核心在于能自我进化,无需等待大模型更新,可自行学习新技能、改进流程[12] - 与普通Agent相比,龙虾拥有更高层级的架构:它被赋予一台完整的电脑权限,具备文件持久化记忆、技能无限扩展、7×24小时自动运转的能力,使其从软件转变为具备判断力的“人”[16][17][18] - 龙虾通过组合多项关键设计形成新形态:通过聊天工具(如飞书)交互,改变人机协作模式;构建长期记忆系统以克服大模型健忘缺陷;积累可传递的Skill(操作手册);以及通过Cron自动化实现主动、持续运转[20][22][24][26] AI Agent(龙虾)的实践过程与关键事件 - 在14天内,通过1,157条消息、22万字对话,将龙虾从零培养成一支8个Agent、7×24小时自动运转的团队[4][5][68] - 实践过程经历了多个关键里程碑:初期解决API权限等基础问题并积累Skill[33];处理泄密事件后,Agent自行编写保密制度[35];Agent在22分钟内自主阅读文章、找到GitHub链接并部署完成记忆系统升级[39] - 在除夕夜,龙虾成功在4分钟内向611人发送了各不相同的拜年消息,实现零失败[42][43];在作者摔伤后,龙虾主动联系人类助理并重新安排行程,展现出超越人类的逻辑与全面性[49][50][51] - Agent团队实现了知识零成本传递,一个Bot学会的技能可通过文档让其他Bot瞬间掌握[52][54];团队能自主设计多Agent协作架构,并实现内容创作等工作的自动化产出[55][56][65] AI Agent展现的效能与数据成果 - 14天实践积累了超过40个Skill,设置了20多个定时任务,实现了7×24小时自动运转[73] - 内容产出效果显著:由龙虾自主选题并撰写的公众号文章获得高达1.8万和1.4万的阅读量,为公众号几年来最好数据[59];其自动发布的Twitter Thread获得超过100万阅读[46] - 相关直播活动取得超预期效果:全网超过20万观看,视频号最高在线9,616人,总观众8.2万,观众平均观看时长22分钟,新增关注超过99.99%的同类主播[6][73] - 实践推动了业务增长:公司产品EasyClaw的安装量和收入增长了超过100%[73] AI Agent对工作模式与软件行业的潜在影响 - AI Agent将改变人机协作模式,人类从操作者转变为通过自然语言对话的指挥者,工作通过沟通即可完成[20] - Agent的核心壁垒在于Skill的积累,每一个Skill都是可瞬间传递、不会消失的实战经验,这构成了系统的真正进化[75][76] - 行业逻辑可能被颠覆:传统SaaS软件售卖能力,而Agent直接售卖结果。未来,定制化需求可能由Agent根据需求即时编写,而非购买功能冗余的传统软件[75] - AI助理具备高性价比:月成本仅几百元,可24小时工作,不请假、不忘事、不离职,可作为人类的“第二助理”永不下线[76] - 实验证明,个人无需编写代码,仅通过自然语言对话即可从零构建并管理一支自动化AI团队,标志着“一个人+一只龙虾=一支团队”已成为现实[77][78]
微软、亚马逊市值蒸发8千亿美元,透露了什么?
雷峰网· 2026-03-02 18:07
美股AI巨头股价暴跌与资本市场逻辑转向 - 微软与亚马逊在发布看似亮眼的季度财报后,股价出现大幅下跌,微软跌幅接近18%,亚马逊跌幅约6%,两家公司市值合计蒸发约8000亿美元(约合人民币5.8万亿元)[2] - 此次暴跌标志着资本市场对AI的定价逻辑发生重大转向,从过去愿意为“战略前瞻”和“想象力”买单,转向更加现实地“严审利润”和关注现金流、盈利能力等硬指标[2][18] - 这被视为AI科技巨头们的一场“成人礼”大考,意味着靠烧钱换增长、讲故事的估值模式已经行不通,公司必须证明AI投入能转化为实际收入和利润[18][20] 微软财报与股价暴跌的深层原因 - 公司2026财年第二季度营收为812.7亿美元,同比增长16.7%,GAAP净利润飙升近60%至385亿美元,但其中约76亿美元的收益来源于对OpenAI投资带来的公允价值变动,属于“纸面富贵”[5][6] - 用于AI基础设施的资本开支及融资租赁总额飙升至375亿美元,同比暴涨66%,但核心增长引擎Azure的增速出现下滑且未来指引将继续放缓,呈现边际效益递减[7] - 自由现金流从上季度的257亿美元骤降至59亿美元,创下三年最低点,引发市场对资金链的担忧[7] - 公司的AI业务高度依赖OpenAI,从Windows、Office到Azure的AI功能都依托其模型,这种“致命捆绑”使公司在技术领先性和议价权上存在潜在风险[8][9] 亚马逊的激进投资与市场担忧 - 公司2026财年资本开支计划高达2000亿美元,同比激增约52%,超过了去年全年的经营性现金流,投入力度超过谷歌、Meta和微软[14] - 尽管集团营收达2134亿美元,AWS营收达356亿美元同比增长24%,但自由现金流从382亿美元断崖式下跌71%至112亿美元,资金链骤然收紧[12][14] - 2000亿美元资本开支计划分散在AI基础设施、物流、卫星等多个领域,被市场认为是在电商基本盘被蚕食、云业务增长放缓的“底盘不稳”时期进行“多线作战”,分散了有限资源[14][15] - AWS虽拥有2440亿美元积压订单,但未详细披露客户结构与来源,其大模型平台Bedrock上90%以上的调用量依赖于Anthropic的模型,核心技术存在“外包”问题[12][15][16] AI行业估值逻辑与竞争态势的转变 - 资本市场对科技巨头的估值逻辑彻底改变,现金流、盈利能力、高质量增长成为核心定价锚,AI泡沫阴影下市场更加谨慎[18] - 大模型、芯片等核心技术的自主可控变得至关重要,过度依赖外部技术合作被视为战略弱点,而能构建自主技术生态的公司更具竞争力[18] - AI竞赛进入分化加剧的阶段,科技巨头的容错空间正在变小,每一个战略误判都可能被市场和竞争无限放大[19] - 谷歌因拥有自研的Gemini大模型、TPU芯片以及稳定的搜索现金牛业务,形成了技术闭环,在此轮财报季中表现相对稳健[18]
亚马逊、英伟达、软银给OpenAI“转账”1100亿,好处是什么?
36氪· 2026-03-02 18:00
融资概况与估值 - OpenAI于2月27日完成新一轮约1100亿美元融资,投前估值达7300亿美元,创下私营科技公司最大规模融资纪录 [1] - 本轮融资由战略投资者主导,亚马逊投入500亿美元,软银和英伟达各投入300亿美元 [1] - 融资后公司账面现金增至约1500亿美元,资金将主要用于扩大算力基础设施 [3] 亚马逊的投资与合作 - 亚马逊承诺的500亿美元投资分两阶段执行:首期150亿美元已投入,剩余350亿美元将在OpenAI完成IPO或实现AGI后到位 [4] - 双方达成技术合作,OpenAI将在未来八年内,在已有380亿美元合同基础上,再向AWS支付1000亿美元算力费用 [5] - 合作核心包括OpenAI承诺采购约2吉瓦的亚马逊自研Trainium芯片算力,亚马逊称其性价比比同类GPU高30%到40% [5][6] - 双方将联合开发“有状态运行时环境”并置于Amazon Bedrock上,AWS还获得了OpenAI企业平台Frontier的独家第三方分销权 [6] - 两家公司将共同开发定制模型,供亚马逊内部团队使用,覆盖电商到智能硬件产品线 [6] 英伟达的投资与合作 - 英伟达分三期支付300亿美元投资,并与OpenAI敲定新的算力合作 [7][8] - 英伟达将为OpenAI提供3吉瓦专用推理算力,以及2吉瓦用于Vera Rubin系统的训练算力 [8] - 从算力价值换算,1吉瓦对应500亿美元,英伟达对OpenAI的支持价值远超传闻的1000亿美元 [8] - 英伟达同时是OpenAI的股东和最大芯片供应商,300亿美元融资中大部分将以采购算力的形式回流至英伟达 [8] 软银的投资与角色 - 软银的300亿美元投资同样分三期到账,其投资逻辑是押注OpenAI作为AI赛道最有可能上市的标的 [9][10] - 本轮融资被视为OpenAI上市前的重要步骤,公司最早可能在今年底启动IPO [11] - 软银扮演了牵线人角色,预计OpenAI还将获得约100亿美元的一级股权融资,相关投资者可能通过软银搭桥引入 [12] 微软的持续合作关系 - 微软未参与本轮投资,但发布联合声明强调与OpenAI的合作关系未受影响 [13] - 微软仍是OpenAI模型无状态API的独家云提供商,所有无状态API调用均托管于Azure上 [13] - OpenAI自有产品(包括Frontier企业平台)将继续托管在Azure上,双方的知识产权授权与商业分成安排不变 [14][15] - OpenAI有权从其他供应商处采购算力,包括“星际之门”等大规模基础设施项目 [15] 业务与财务数据 - OpenAI预计到2030年才能首次实现正向自由现金流,此前资金将主要投入数据中心运营、芯片采购和云服务支出 [17] - 公司2025年营收约130亿美元,2026年预计达300亿美元,2027年目标超过600亿美元,2030年目标超2800亿美元 [17] - 用户数据方面,ChatGPT周活用户超9亿,消费者订阅用户超5000万,付费商业用户超900万 [17] - 今年推出的编程工具Codex,周活用户从年初至今增长两倍,达到160万 [17] - 公司计划到2026年底将企业客户收入占比从当前的40%提升至50%,需与Anthropic等对手竞争 [18] 股权架构与后续影响 - 本轮融资后,2025年从OpenAI剥离的非营利机构“OpenAI基金会”所持营利业务股份价值升至1800亿美元以上 [19] - 若投资者需求旺盛,基金会可能出售至多100亿美元股票,用于慈善支出和人员招聘,意味着私募二级市场可能还有一波股票供应 [19][20] - 本轮融资呈现“循环融资”叙事:投资者以资金换取OpenAI未来的技术授权、云服务采购承诺或IPO退出机会 [16] - OpenAI股东名单同时包括微软、亚马逊、英伟达、软银四家业务存在重叠与冲突的巨头,平衡股东利益将成为管理层的挑战 [16]
英伟达的下一个Mellanox-针对Agentic-AI底时延的Groq-LPU
2026-03-02 01:22
关键要点总结 涉及的行业与公司 * 行业:人工智能芯片、高性能计算、半导体制造与先进封装 * 公司:英伟达、Groq、台积电、英特尔、AMD 核心观点与论据 英伟达的战略与并购逻辑 * 英伟达处理Groq的策略与2019年收购Mellanox的路径一致,旨在吸收其技术团队与IP并融合进后续产品,而非以独立产品线形式销售,以强化其在高性能计算领域的护城河[1][2] * 英伟达当前的三大护城河被定义为:高性价比算力、interconnect(互联技术)、CUDA软件生态[2] Groq LPU的技术定位与设计初衷 * Groq LPU主要针对推理侧对极低时延的刚性需求,尤其适配batch size=1的推理场景[1][4] * GPU擅长训练和batch size较大的推理,而面向Agentic AI/AGI应用,推理环节的多步链式处理需要更强调低时延和确定性的架构[4] * 实现超低时延的两大关键技术:1) 采用约230MB的片上SRAM以降低外部存储访问时延[5];2) 通过compiler定义确定性时序,实现更稳定可预测的低时延表现[5] LPU与英伟达产品的整合路径与时间线 * LPU与英伟达GPU的整合预计至少需要18-24个月,最可能落地在Finman那一代产品[1][6] * 整合形态更可能是封装级集成,采用chiplet思路,将LPU die与Finman compute die通过混合键合和TSV技术结合,以实现极低时延的数据交互[1][6] * Finman compute die可能采用台积电A16节点,而承载大量SRAM的LPU die可能选择更成熟的3nm或4nm节点,以利于实现更高的SRAM配置密度和3D堆叠集成[1][7] * LPU能力将整合进GPU体系内部,通过chiplet形态纳入整体架构,不会以独立LPU产品形式推出[1][7] 技术协同与产业链影响 * LPU的整合不会对HBM用量产生影响,因为HBM面向训练和大batch size推理,而LPU的SRAM属于GPU内部另一层级的memory[8] * 若方案落地,受益方向更可能集中在Triplet相关的先进封装环节,而非HBM或PCB方向[1][9] * 台积电A16节点将引入背部供电技术,可腾出正面布线空间用于放置LPU chiplet,支撑通过triplet架构进行集成,并有助于降低功耗[3][13] * LPU存在互联可扩展性局限,其架构最多可连到576颗并保持性能,英伟达可能通过将LPU直接放入GPU架构内部来规避此问题,将互联重点转回NVLink框架[3][9] * LPU的软件体系有融合进CUDA的可行路径,即可将其SRAM视为memory hierarchy中的新增一层,通过CUDA既有的内存管理方式进行统一调度[10] CPU架构演进与市场策略 * 需关注Rubin Ultra是否会提供X86架构选项,这与英伟达近期加仓英特尔、清仓ARM的持仓变化存在逻辑关联[12] * 推理与Agentic AI的强化使CPU在推理与指令处理环节的作用被重新认识,X86因指令丰富、功能覆盖强,其重要性可能上升[12] * 英特尔可能不再区分P核与E核路线,转向只做一条路线,可能与功耗优化诉求相关[13] * 英伟达CPU路线分三步:先scale out,再scale up,最终走向全光架构[14] * 2026年是CPU元年,因Rubin是第一批上CPU的产品;2027年预计将是CPU放量的一年,依据是Rubin Ultra阶段CPU将上scale up,量级将明显提升[14][15] 产品发布与行业展望 * 即将到来的GTC大会,Rubin相关内容因已多次披露,预计不会作为主要篇幅;更值得关注的是Rubin Ultra以及Firemon加LPU的架构方向等主线[11] * 对大模型驱动的AI长期演进判断:大模型不是通往AGI的唯一道路,当前处在“青黄不接”阶段,后续会出现新的算法以及改良算法[16] * 近期李飞飞与杨乐昆倡导的“世界模型”方向,强调Spatial Intelligence,试图刻画“世界中正在发生的事情”,被认为对机器人智能发展尤为关键[16] * 不同算法在不同时间点对芯片的需求结构可能不同,需求强弱可能阶段性切换[16] 其他重要内容 * 对英伟达的投资观点:财报后目标价格为310美元,认为对2026年利润等预期的定价已相对充分[16] * 整体建议持续关注GTC三大重点所映射的全链条机会[16]
一个Agent,发出了「人生」第一条朋友圈
机器之心· 2026-03-01 11:34
文章核心观点 - 复旦大学与深圳夸夸菁领科技有限公司联合成立的A3实验室研发并开源了名为GenericAgent的新型AI智能体,该智能体具备自学习、自进化能力,能够通过自主学习操作复杂应用(如微信)并与人类自然互动,展现了向通用人工智能(AGI)演进的潜力[1][3][4] 自学习与自进化:AGI的可能形态 - 智能体具备自进化特性,能在环境探索中学习生长,理解并交互复杂环境(如社交平台),最终演变为解决问题的专家或贴心助手[5][6] - 自进化体现在三个维度:1) **自组织记忆**:拥有记忆分层组织和持续精炼功能,能自主整理记忆以提升检索效率和长期运行稳定性[6];2) **自适应学习**:在交互过程中自主记住合理步骤与策略,环境适应性强[8];3) **自主成长进步**:通过“Fork”模式复制自身以尝试多样策略,并用更优策略更新自身,在闲置时可通过“探索模式”自主培养新能力[11] - 实现自进化仅依赖三大原则:极简架构、极强执行、极致迁移[13] 极简架构:实现便捷落地 - 架构设计追求极简,体现在极简架构、极低开销和极简部署三个方面[14] - **极简架构**:核心代码仅3000多行(核心模块数百行),实现了传统架构需50多万行代码的能力,代码高度可读[15] - **极低开销**:通过记忆分层索引和按需加载,大幅压缩系统提示(System Prompt),节省Token开销,确保上下文信息高密度、无冗余[18] - **极简部署**:仅需Python和Requests环境即可运行,实现“只要有电的地方就能进化”[18] 极强执行能力:深入的工具控制力 - 智能体拥有“八爪鱼”式的工具控制力,能深入操控系统内每个工具,适应复杂环境交互[16][17] - 通过仅9个**原子工具**(如执行任意代码、文件操作、浏览器控制等)即可操控整个数字世界(PC与网络)[18] - 具备**现场“制造”工具**的能力:当现有工具不足时,可开启探索模式,现场安装Python包、编写脚本并验证方案[18] - 采用**降维打击的浏览器策略**:通过JS插件直接接管用户正在使用的已登录浏览器实例,无需重新登录即可在用户权限下执行操作,实现真正的“人机接力”[20] 极致的迁移能力:打破软硬件藩篱 - 设计初衷是打破软硬件限制,让智能不被禁锢于特定“黑盒”[22] - **不挑底座模型**:可适配Claude、Gemini、Kimi等多种大模型,在架构加持下缩小对底座模型能力的依赖,确保输出稳定[23] - **硬件门槛极低**:仅需有电、有网、有Python环境的普通PC或手机(支持Windows、Mac、Android)即可运行[24][26] - **技能可极致复用**:智能体在一台机器上习得的复杂技能可被提炼成记忆并直接移植,使个人调教成果能被广泛共享,降低全社会的智能应用成本[30][32]
1100亿美元融资实为豪赌,OpenAI今年必须实现AGI或者IPO
凤凰网财经· 2026-02-28 21:08
OpenAI创纪录融资 - 2026年2月,OpenAI完成1100亿美元单笔融资,为人类历史上最大规模的非上市公司单笔融资 [2] - 此轮融资由亚马逊投资500亿美元、英伟达和软银各投资300亿美元构成 [5] - 亚马逊投资中的350亿美元附有条件,需OpenAI在年底前实现AGI或完成IPO才能到账 [6] - 融资后公司投后估值达到8400亿美元,投前估值为7300亿美元 [7] 公司财务状况与市场地位 - 2025年公司营收达到131亿美元,超出原定目标30%多,但同年亏损80亿美元 [11] - 预计2026年亏损将飙升至250亿美元,2026年烧钱率预计维持在83.3% [12][13] - 从当前到2029年,累计亏损预计将达到1150亿美元,公司预计到2030年代才可能实现盈利 [12] - ChatGPT市场份额从2025年初的86.7%下降至2026年初的64.5%左右 [14] 融资背后的战略逻辑 - 主要投资者(亚马逊、英伟达、软银、微软)与OpenAI存在深度商业合作,融资部分资金将以购买服务形式回流至投资方 [16] - 科技巨头通过投资抢占股份和话语权,旨在锁定长期商业合同并定义未来AI技术标准和商业规则 [17][18][20] - 融资用于支持公司到2030年约6000亿美元的算力支出计划,以及此前提及的1.4万亿美元基础设施投入 [22] - 公司估值逻辑基于对AI基础设施和算力霸权未来主导地位的预期 [24][26] 星门计划(Stargate)的困境 - 星门计划是2025年1月宣布的、为期4年、总投资5000亿美元的AI数据中心建设项目,合作伙伴包括OpenAI、甲骨文和软银 [28] - 项目进展缓慢,合资公司未招聘员工或开发数据中心,三方在控制权、场地所有权和资金流向上存在分歧 [29][30] - 项目延误导致OpenAI错失关键建设窗口,未能实现2025年底前签约10吉瓦算力的目标,实际仅签约约6.8吉瓦 [34][41][42] - 为填补算力缺口,公司不得不从AWS和谷歌云等竞争对手处购买临时算力,增加了成本和对云服务商的依赖 [43] 与Anthropic的竞争及IPO前景 - OpenAI的主要竞争对手Anthropic在2026年初完成300亿美元G轮融资,投后估值达3800亿美元,较2025年9月翻倍多 [47] - Anthropic年化营收达140亿美元,过去三年每年增长超过10倍,其产品Claude Code年化营收超25亿美元,2026年初以来收入翻倍有余 [49] - Anthropic聚焦企业市场(80%收入来自企业),预计2028年实现盈亏平衡,2026年烧钱率将降至营收的三分之一左右 [50] - OpenAI主攻C端市场,ChatGPT拥有超过9亿周活跃用户和5000万付费订阅用户 [51] - 两家公司均在为2026年下半年IPO做准备,但预测市场对OpenAI在2026年内IPO的概率评估仅为51.5% [52][54] - 若Anthropic先于OpenAI上市,将获得更大的资本市场灵活性,OpenAI因此加速了IPO进程 [56][58] 技术发展与其他战略动向 - 2026年1月爆火的AI智能体(agent)项目OpenClaw的创始人加入OpenAI,公司获得该领域关键技术和人才储备 [63] - 行业竞争核心假设是缩放定律(scaling law)仍然有效,即投入更多算力和数据能获得更强模型能力 [60] - 若缩放定律失效,模型能力提升遇到瓶颈,当前的高估值可能面临风险 [61]
AGI 凉了?吴恩达、斯坦福、谷歌云罕见同频:AI 测评逻辑正被 Agent 颠覆
AI前线· 2026-02-28 12:05
AI行业焦点转向:从布道到价值评估 - 2026年初,AI行业焦点已从“能不能做到”转向“在什么条件下、以什么成本、为谁创造价值”[2] - 斯坦福HAI明确指出,2026年是AI从布道走向评估的一年[2][7] - 大量企业已完成第一轮生成式AI部署,开始有条件回看投入与产出[4][5] 现有评价体系面临挑战 - 过去依赖的Scaling Law(模型越大、数据越多、算力越强,能力越好)在医疗、法律等高责任领域显得单薄[8][9][10] - 分数上涨不等于风险可控,能力增强不代表系统可落地,现有评价体系可能跟不上应用场景的复杂度[10] - 吴恩达指出“AGI”概念被过度滥用,导致学生、CEO及社会对AI能力产生系统性高估[11][13] 提出新的评估标准:图灵-AGI测试 - 吴恩达提出“图灵-AGI测试”,旨在重新界定AI上限[7][14] - 该测试核心是评估AI能否在任务不预设、路径不可控、反馈持续变化的条件下,从头到尾完成一件事[16][18] - 与当前主流基准测试不同,它关注长期规划、持续学习和跨任务迁移等真实智能,而非固定题目解题能力[18] AI价值评估需算“经济账” - 斯坦福学者指出,过去几年AI行业只算“能力账”,系统性地回避了“经济账”,现在是时候好好算钱的问题了[21] - AI“单点能力”提升并不必然带来整体效率提升,有时甚至因引入核查、协调等新成本而产生反效果[21] - 评估不能只测模型,必须测“人+AI+流程”这个整体,关注系统整体是否变得更复杂、更难以信任[23] 企业级AI投资回报的关键发现 - 谷歌云《The ROI of AI 2025》报告调查了3466名全球营收千万美元以上的企业老板或高管[6][29] - 真正实现正向、可持续投资回报的,并非零散的生成式AI能力,而是“Agent+流程+组织”的系统级落地[7][30] - 在最早一批入场Agentic AI的公司里,88%已在至少一个GenAI场景中看到正向回报[7][30] 技术路径拐点:从大模型到Agent体系 - 当前AI核心问题从“模型能不能更强”转变为如何将其真正用进系统里[31] - 在使用GenAI的企业中,52%已将Agent投入生产环境[33] - 谷歌报告显示,让AI获得正向ROI的场景具有流程清晰、可规模化复制的共同点,如生产力、客户体验、业务增长、营销和安全[34][36] Agent的等级划分与演进方向 - 谷歌将Agent按效果分为三个等级:Level 1(生成式AI工具)、Level 2(真正意义上的单体Agent)、Level 3(多Agent协同工作流)[37][38] - 目前绝大多数已产生正向ROI的Agent集中在Level 2,属于“单体Agent+明确流程”形态[40] - Agent的下一步演进方向是“更可管理”,让多个Agent在清晰分工和明确规则下稳定协作,而非盲目堆砌数量[40] Skill-First成为Agent发展的核心理念 - 未来趋势是Agent调度一堆边界清楚、可被调用复用监控的“技能模块”[40][41] - 吴恩达是“Skill派”,强调将AI能力拆解为可验证、可组合、可评估的能力单元,以判断边界和管理风险[43][44] - 能跑出ROI的系统往往是Skill拆得够细、流程跑得顺、责任链条说得清楚的Agent系统[42] 学界对AGI与行业热度的冷静预测 - 斯坦福HAI联合主任James Landay预测2026年不会出现AGI[25] - 2026年AI主权的前景在于模型运行位置和数据由谁掌控,而非比拼模型大小[25] - 斯坦福HAI对全球算力投资升温发出警告,认为资本持续涌入却看不到回报拐点带有泡沫意味[27][28]