Workflow
通用人工智能(AGI)
icon
搜索文档
阿里吴泳铭最新演讲:积极推进3800亿AI基建计划,并将持续追加更大投入(全文)
新浪科技· 2025-09-24 11:29
人工智能发展路径 - 实现通用人工智能AGI已是确定性事件 但只是起点 终极目标是发展出能自我迭代 全面超越人类的超级人工智能ASI [1] - 通往ASI的三阶段演进路线:第一阶段智能涌现 AI通过学习海量人类知识具备泛化智能 第二阶段自主行动 AI掌握工具使用和编程能力以辅助人 这是行业当前所处阶段 第三阶段自我迭代 AI通过连接物理世界并实现自学习 最终实现超越人 [3][4][5] - 全球AI行业投资总额已超过4000亿美元 未来5年累计投入将超过4万亿美元 这是历史上最大的算力和研发投入 [6] 阿里云战略布局 - 阿里云作为全栈人工智能服务商 通过两大核心路径实施AI战略:通义千问坚定开源开放路线 致力于打造AI时代的Android 构建作为下一代计算机的超级AI云 为全球提供智能算力网络 [5] - 积极推进三年3800亿的AI基础设施建设计划 并将持续追加更大投入 对比2022年GenAI元年 2032年阿里云全球数据中心能耗规模将提升10倍 [5][25] - 通义千问开源300多款模型 覆盖全模态全尺寸 全球下载量超6亿次 衍生模型超17万个 是全球第一的开源模型矩阵 [24] 技术演进趋势 - 大模型是下一代操作系统 将替代现在OS地位 成为承载用户 软件与AI计算资源交互调度的中间层 [18] - 自然语言是AI时代编程语言 Agent就是新软件 Context是新Memory 大模型通过MCP接口连接各类Tools和Agent [18] - 数据中心计算范式从CPU为核心的传统计算 加速转变为以GPU为核心的AI计算 需要更稠密算力 更高效网络 更大集群规模 [22] 应用场景拓展 - AI将渗透到物流 制造 软件 商业 生物医疗 金融 科研等几乎所有行业领域 [11] - 未来可能有超过全球人口数量的Agent和机器人与人类一起工作 对真实世界产生巨大影响 [12] - Token消耗速度两三个月就翻一番 Token就是未来的电 驱动千行百业每天的工作 [6][24] 基础设施需求 - 超级AI云需要充足能源 全栈技术 数百万计GPU和CPU 协同网络 芯片 存储 数据库高效运作 [22] - 未来全世界可能只会有5-6个超级云计算平台 [22] - 阿里云运营中国第一 全球领先的AI基础设施和云计算网络 是全球少数能做到软硬件垂直整合的超级AI云计算平台之一 [24]
OpenAI 发布 GPT-5,通用人工智能又近了一步
36氪· 2025-09-24 07:13
核心观点 - OpenAI发布最新大型语言模型GPT-5,公司称其在推理、代理任务、编码等能力上均超越前代模型,是通往通用人工智能(AGI)道路上的重要一步 [1] 模型性能与能力 - **推理能力**:GPT-5带来了前所未有的推理能力,将感应编码提升到新高度,ChatGPT免费版本用户首次能真正接触到推理功能,模型能自动判断何时需要进行推理 [1][3] - **编程能力**:GPT-5在编程方面下了很大功夫,旨在开启“按需软件”新时代,演示中模型思考14秒后生成数百行代码,构建了一个具备闪卡、测验和互动游戏功能的法语学习网页应用 [4] - **代理任务能力**:在代理型人工智能任务中表现更佳,在选择工具完成任务、执行长时间任务时更少“迷失方向”,且在错误纠正方面表现优于前代模型 [4] - **智能与可靠性**:GPT-5不仅更智能、更快速,而且更值得信赖,幻觉现象更少,更少自信地给出错误答案,更倾向于承认自身知识的局限性 [3] - **交互体验**:与GPT-5聊天感觉像与一位拥有博士学位的专家交谈,对话感觉更加自然,更像人类 [1][2] 产品发布与可及性 - **发布与访问**:GPT-5通过ChatGPT界面向所有人开放,包括免费版本用户,付费用户可享受访问更强大版本模型等额外权益 [3] - **产品线简化**:GPT-5的推出消除了公众对OpenAI众多大型语言模型(如GPT-4, GPT-4o, GPT-4.5及“推理”模型o1和o3)名称和功能混淆的困惑 [3] 安全与责任特性 - **安全处理**:采用名为“安全完成”的新技术处理模糊查询,在确保安全的前提下,模型会尽力提供尽可能有用的答案,而非简单的二元化拒绝 [5] - **心理健康与奉承行为**:GPT-5在处理心理健康场景和奉承行为方面有所进步,公司已聘请法医精神病学家研究其产品对人们心理健康的影响,并对ChatGPT进行了提醒用户休息、强调“基于事实”回应等改动 [5][6] 行业意义与未来展望 - **AGI进程**:GPT-5是具有通用智能的模型,但公司指出其仍缺乏对AGI至关重要的许多关键属性,例如无法在部署过程中持续从新事物中学习 [7] - **规模定律与未来投资**:人工智能的规模定律绝对仍然成立,公司不断发现新的扩展维度,面前还有数量级上的性能提升空间,必须以超乎想象的速度投资于计算资源,并打算继续这样做 [7]
DeepSeek成了硅谷最大的“不能说的秘密”
虎嗅APP· 2025-09-23 21:59
DeepSeek模型的市场影响 - DeepSeek模型在旧金山企业中被广泛使用 包括非AI公司也在本地部署其版本[2][9] - 模型完全免费且训练成本仅为西方模型的一小部分 但性能更优[10] - 硅谷企业将其视为"不能说的秘密" 并用于客服和后台等核心业务[10] 中国AI行业的竞争优势 - 中国学者在顶级AI/ML期刊的高被引论文数量显著上升 而欧美国家增长近乎横盘[12] - 硅谷AI初创公司中拥有大量中国籍员工 使得这些公司骨子里"很中国"[12] - 中国AI公司如DeepSeek在硬件限制下仍取得突破 未来若获得顶尖半导体将更具竞争力[13] AI行业发展趋势与挑战 - AI终将像电一样以近乎零的边际成本普及 长期价值将集中在算力、带宽、存储和能源等基础设施[13] - 当前美欧AI领域存在明显泡沫 未来几年许多富豪将损失惨重[13] - 大型语言模型和Transformer技术存在天花板 边际收益递减现象已经开始显现[15][16] 全球AI公司的表现与文化 - 欧洲AI独角兽Lovable在8个月内达到1亿美元年度经常性收入 速度超过美国公司Cursor[7] - Lovable内部采用"997"工作文化 认为需要比中国人更拼才能赢得竞争[7][15] - 西方初创公司在AI浪潮中获得创纪录的估值、融资额和年度经常性收入[16] 中国公司的出海与文化输出 - DeepSeek、华为和比亚迪在西方年轻人中产生巨大冲击 民调显示35岁以下群体将中国视为未来[19] - 中国AI公司出海氛围比想象中宽松 西方年轻用户通过TikTok等平台对中国形成新认知[19][20] - 中国文化输出拐点已到 Labubu等IP在海外获得认可 软实力成为下一波浪潮[23] 创业者与成功路径 - 统计数据表明第一次创业成功率最高的年龄是42岁 而非少年天才[20] - 更稳妥的创业路径是先进入好公司积累行业经验 再出来单干[20] - Scale AI创始人Alexandr Wang是典型年轻成功案例 公司曾接受Meta 143亿美元投资[7][21]
OpenAI获英伟达1000亿美元投资!
国芯网· 2025-09-23 21:56
OpenAI与英伟达的战略合作 - OpenAI与英伟达宣布达成具有里程碑意义的战略合作意向书,英伟达将向OpenAI投资最多1000亿美元 [1] - 根据协议,OpenAI将部署容量为10GW的AI数据中心,用于训练下一代模型,并配备400万至500万块英伟达GPU,这相当于英伟达2025年全年的预计出货量 [1] - 英伟达采用分阶段投资模式:首个1GW数据中心预计在2026年下半年上线,将基于Vera Rubin平台,后续按进度追加投资,总额可能达到千亿美元 [1] 合作背景与高层表态 - 英伟达CEO黄仁勋表示,从首台DGX超级计算机到ChatGPT的突破,双方已相互成就十年,此次以10GW算力合作为下一代智能时代赋能 [4] - OpenAI CEO Sam Altman表示,合作将赋能个人和企业创造新的AI突破,并暗示未来几周将发布计算密集型新产品 [4] 合作对OpenAI的战略意义 - 该协议解决了OpenAI从非营利组织转型为盈利性企业后最大的瓶颈——算力成本 [4] - 当前,训练GPT-5级别模型的电费支出已占其总成本的35%,而自建数据中心可将长期运营成本降低70% [4] - 专属算力集群将支持OpenAI率先探索通用人工智能(AGI)的物理世界交互能力,例如通过机器人集群实现全球物流自动化 [4] 合作模式与生态联盟 - OpenAI将视英伟达为其AI工厂扩张计划的首选战略计算与网络合作伙伴 [5] - 双方将协同优化技术路线图:OpenAI聚焦模型与基础设施软件,英伟达专注硬件与软件生态 [5] - 此次合作进一步强化了双方已开展的深度协作,其合作伙伴网络还包括微软、甲骨文、软银及Stargate联盟等,共同致力于构建全球最先进的AI基础设施 [5]
Nvidia砸千亿美元助力OpenAI,马斯克狂飙造全球最大AI集群 | Jinqiu Select
锦秋集· 2025-09-23 12:44
行业核心观点 - AI行业竞争从算法和产品层面进入基础设施和算力的硬核较量阶段 [2] - 模型层顶级玩家通过资本、算力和速度构建了难以撼动的护城河 [3] - 模型智能水平将持续提升,为非模型层创业者创造基于趋势设计业务的机会 [4] Nvidia与OpenAI合作 - Nvidia宣布向OpenAI投入高达1000亿美元的战略投资 [1] - 双方将携手打造至少10吉瓦的数据中心基础设施,用于支撑下一代模型的训练与部署 [1] xAI的算力基础设施布局 - xAI从2025年3月起迅速启动Colossus 2项目,半年内完成约200MW冷却能力和机架安装,速度远超业界平均水平 [5][11] - 为解决孟菲斯本地电力限制,xAI在密西西比州Southaven收购旧电厂并获临时许可运行燃气涡轮机,形成跨州供电方案 [5][14] - 与Solaris Energy Infrastructure合作,通过租赁和合资模式快速部署超过460MW涡轮发电机组,规划总装机规模扩大到1GW以上 [5][19][24] - 通过多层布局和高密度设计,将现有站点容量提升到超过1GW,增强单一相干集群优势 [5][27] xAI的财务状况与融资 - Colossus 2所需资本支出高达数百亿美元,xAI尚未产生有意义的外部收入 [29] - 传闻中的9位数年化经常性收入绝大部分是X.com到xAI的公司间转移 [29] - 正准备新一轮数百亿美元融资,公司估值接近2000亿美元,沙特公共投资基金将扮演重要角色 [31] - 未来两三年仍需持续投入数百亿美元资金,高度依赖外部融资及Elon Musk其他企业内部资金转移 [5] xAI的技术与产品 - Grok 4在技术指标上已达到一线AI实验室水平,但商业收入和企业客户接受程度表现不足 [5] - API产品存在性价比劣势,Grok 4定价与Claude Sonnet 4持平但编码能力稍逊 [5][45] - 发布蒸馏模型Grok Code Fast 1,以更小体积保留Grok 4部分性能,在OpenRouter上需求激增 [45][47] - 采用独特的强化学习路径Ani,通过人类情感与互动环境训练模型,而非仅局限于数字生产力领域 [5][53] xAI的人才与文化 - 从DeepMind、Meta、英伟达等公司成功引进大量顶尖人才,员工超过一千名并持续扩张 [41] - 公司文化以高压和极快工作节奏著称,人员流动性极高,长期组织稳定性面临风险 [5][42] - 前首席财务官加入后不到4个月离职,部分高级研究员也已离开 [42] xAI的市场策略与挑战 - 产品选择与Elon Musk旗下X深度融合的路线,消费者侧取得进展但企业端表现乏力 [5][50] - 在企业方面采用率非常低,部分由于模型幻觉问题及对特定话题的敏感行为 [49] - 与OpenAI、Anthropic等公司专注于代码和自动化应用的策略不同,xAI追求更通用的AGI路径 [52]
英伟达与OpenAI达成千亿美元级合作 共建AI基础设施集群
环球网资讯· 2025-09-23 12:09
合作概述 - 英伟达与OpenAI达成里程碑式战略合作,联合建设全球规模最大的AI计算基础设施网络 [1] - 项目涵盖至少10吉瓦(GW)的AI专用数据中心集群,并部署数百万块英伟达GPU [1] - 项目将配套构建自主可控的清洁能源供应体系 [1] 投资与时间规划 - 英伟达承诺为该项目提供至多1000亿美元投资 [1] - 首阶段系统计划于2026年下半年通过英伟达新一代Vera Rubin超级计算平台上线 [1] - 首期Vera Rubin系统将于2026年第三季度在得克萨斯州达拉斯数据中心点亮 [2] 技术配置与规模 - 首期系统初始配置包含50万块Blackwell Ultra GPU [2] - 其算力规模相当于当前全球前50大超级计算机总和 [2] 对OpenAI的战略意义 - 该协议解决了OpenAI从非营利组织转型为盈利性企业后的最大瓶颈——算力成本 [1] - 当前训练GPT-5级模型的电费支出已占其总成本的35% [1] - 自建数据中心可将长期运营成本降低70% [1] - 专属算力集群将支持OpenAI率先探索AGI的物理世界交互能力,例如通过机器人集群实现全球物流自动化 [1] 合作执行细节 - 英伟达与OpenAI计划在未来6周内敲定股权分配、技术共享及数据安全等细节 [2] - 双方将成立联合治理委员会监督项目进展 [2]
2025年中国企业级AI Agent应用实践研究
钛媒体APP· 2025-09-23 11:49
AI Agent技术定义与核心能力 - AI Agent是指具备环境感知、自主决策与行动执行能力的人工智能系统,其核心能力包括感知能力、规划能力、行动能力和记忆能力[2] - AI Agent与大模型的关系是“数字人”与“数字大脑”的关系,大模型为Agent提供感知与认知能力,而Agent是在大模型基础上整合规划、记忆和工具使用三大关键组件的高级架构[4] - 真正AI Agent的核心判别标准是工具调用能力,能够主动调用外部工具拓展能力边界,实现从“解答问题”到“解决问题”的跨越,而传统AI产品仅具备被动响应能力[6] 全球AI产业格局与价值链布局 - 全球人工智能企业在应用层、基础模型层、云端推理层和加速器硬件层四大环节呈现显著分化,OpenAI在应用层、基础模型层和云端推理层保持领先但硬件依赖外部,谷歌实现四大环节深度全覆盖[8] - 国内百度、华为与国外微软、亚马逊均已达成全链条布局,具备端到端技术落地能力,而DeepSeek等企业在前三环节深度渗透但硬件领域布局相对滞后[8] - 2024年美国AI领域投资规模达1090亿美元,同比增长40%,聚焦底层技术突破,而中国投资规模146亿美元,同比下降14%,资金更集中于头部大模型公司[54] 中美Agent性能对比与技术发展 - 中美Agent性能差距显著缩小,在任务适应力与资源效率上表现相当,国产Agent在强本土化场景中任务准确率显著领先,如DeepSeek-R1中文任务准确率达92% vs Claude 3的94%[10] - 国际产品在泛化能力与迭代成本方面保持优势,尤其在零样本迁移能力上展现更强适应性,如Operator在环境异常时自动重新定位元素成功率高达94%[10] - GPT-5发布提升全球标准,评测得分68.95,国内领先模型Qwen3和DeepSeek-R1分别得分63.59和62.53,显示国内大模型在核心能力上快速追赶[67] 企业级AI Agent市场规模与应用现状 - 2025年中国企业级AI Agent市场规模约为232亿元,2023-2027年复合增长率达120%,预计2027年市场规模将达到655亿元[14][83] - 中国企业级AI Agent应用正处于从“普及级”向“融合级”过渡阶段,头部企业已进入融合级并探索驱动级,而大多数企业仍处于萌芽和普及级[70] - AI Agent应用场景呈现深度分化,智能客服以超70%渗透率成为成熟标杆,数据分析场景达60%渗透率成为第二增长曲线,研发、营销、知识助手场景孕育下一轮爆发点[16][71] 行业应用渗透与采购行为特征 - 智能客服渗透率呈现行业梯度差异:互联网、通信、金融等行业渗透率突破80%构成第一梯队,医疗、教育等行业约60%为第二梯队,工业制造等低频高壁垒行业处于探索期[16][73] - 企业采购AI Agent最关注的六大关键指标依次为:召回准确率、首字延时、数据安全合规、多模态推理能力、跨系统协同水平、长任务收敛度[22] - 头部企业凭借资源与场景优势成为采购主力,重点部署于高价值环节,而中小企业实际采购率不足15%,受限于试错成本与技术门槛[90] 技术演进趋势与产业影响 - AI Agent正推动生产力范式从“AI辅助人类”向“AI自主服务”跃迁,从优化存量价值的劳动效率工具转变为创造增量价值的生产主体,具备目标设定与因果推理能力[27] - AI Agent将重塑互联网流量入口,从“找信息”转向“做任务”,传统搜索引擎价值从流量分发转向直接满足需求,通用入口级Agent竞争将在2025年底拉开帷幕[28][29] - 传统软件AI升级如同“燃油车改电动车”,受制于历史架构限制,而AI原生软件以“需求预判式”数据融合为核心,推动软件从被动工具蜕变为主动业务引擎[12]
算力三国:英伟达、甲骨文与 OpenAI的万亿棋局
36氪· 2025-09-23 11:36
英伟达的战略布局 - 英伟达向OpenAI投资1000亿美元,该笔投资将随着每吉瓦算力设施的建成逐步到位,而每一吉瓦意味着约40-50万台GPU的部署规模 [3] - 该投资规模相当于英伟达全年的芯片出货量,是去年的两倍 [3] - 这种合作模式形成商业闭环,英伟达锁定了OpenAI的长期订单,双方将联合优化软硬件路线图,形成深度绑定的技术壁垒 [5] - 英伟达即将推出的Vera Rubin平台,单机架可提供8艾FLOPS的AI算力,是上一代产品的7.5倍,其Rubin CPX GPU专为长上下文推理设计,预计2026年下半年投入使用 [5] - 英伟达还斥资50亿美元入股英特尔,旨在整合x86架构CPU优势,弥补自身在通用计算领域的短板,构建更完整的生态系统以应对AMD和云厂商自研芯片的挑战 [6] 甲骨文的云基建扩张 - 甲骨文与OpenAI签订始于2027年的五年期3000亿美元云服务合同,使公司的剩余履约义务激增至4550亿美元 [7] - 甲骨文提供从数据中心建设到云平台运营的全栈服务,与英伟达形成差异化互补 [7] - 甲骨文参与“星际之门”项目,负责得克萨斯州阿比林地区的八座数据中心建设,预计2026年底全部完工 [9] - 公司计划将云基础设施收入从180亿美元飙升至1440亿美元,但2025财年自由现金流为负3.94亿美元,增长预期高度依赖大客户业务扩张 [9] OpenAI的算力网络策略 - OpenAI采用“多供应商制衡”策略,同时与英伟达、甲骨文、微软等多方建立深度合作,以确保算力安全并获得更大谈判筹码 [12] - 与英伟达的1000亿美元合作确保芯片供应,甲骨文的3000亿美元合同提供云基础设施支持,与微软的非约束性备忘录维持战略灵活性 [12] - OpenAI通过独特的非营利母公司架构坚守对AGI的控制权,确保所有安全相关决策以“造福全人类”为准则 [12] - 预测到2029年前公司将消耗1150亿美元现金,仅2030年租赁服务器的支出就将达到1000亿美元,其用户规模持续增长为商业化提供基础 [13] AI基建的行业影响与挑战 - 预测到本十年末全球AI基础设施支出将达到3-4万亿美元 [14] - 2024年全球数据中心耗电量达415太瓦时,占全球电力消耗的1.5%,到2030年将飙升至945太瓦时,超过日本当前全年用电量 [16] - OpenAI的10吉瓦项目电力需求足以供应数百万户家庭,未来5年可再生能源发电量预计将因此激增84% [16] - 美国占据全球数据中心用电量的45%,其数据中心用电增量将占全国总需求增长的近50%,AI基础设施已成为国家安全议题 [17] - 基础设施门槛大幅提高可能导致行业资源进一步向OpenAI、Meta等巨头集中,传统科技公司面临洗牌 [17]
英伟达OpenAI千亿交易,其他人还剩啥?
虎嗅· 2025-09-23 11:05
合作核心框架 - OpenAI计划在未来数年内分阶段部署总规模不低于10吉瓦(GW)的英伟达AI计算系统,涉及数百万颗下一代GPU [1] - 英伟达将根据算力基础设施上线进度,向OpenAI提供总额最高可达1000亿美元的资金支持 [1] - 目前协议仍处于意向阶段,具体投资形式、股权结构及交付时间表仍在磋商中 [1] 公司战略定位转变 - 英伟达角色从领先的芯片供应商转变为AI基础设施的共建者,将与OpenAI深度协作优化模型与硬件架构 [2] - 此次投资旨在加速通用人工智能(AGI)的实现,通过构建前所未有的算力平台为整个AI生态提供动力 [2] - 英伟达将自身资本与OpenAI增长绑定,从供应链巨头转变为共同承担风险、分享收益的“产业合伙人” [3] 行业需求与瓶颈 - 当前AI发展的最大瓶颈是算力,OpenAI对未来模型计算量增长和市场需求的预估远超以往 [2] - 合作本质是针对“算力短缺”的战略性资本布局,以确保模型研发与商业化进程不因算力不足而中断 [5] - 合作是为了确保能够持续推动AI技术边界、构建更强大、更安全的AI系统所必需的战略性一步 [2] 合作规模与产业影响 - 10GW算力规模约等于400到500万块顶级GPU,体量堪比英伟达一整年的预期出货量 [6] - 建造一个1GW的AI数据中心成本约500~600亿美元,总投入为天文数字 [6] - 英伟达与OpenAI的深度绑定意味着最顶级的GPU资源将被优先占用,对微软、亚马逊、谷歌等云厂商构成巨大竞争压力 [6] 商业模式与监管考量 - 此次投资是一种精巧的财务安排,OpenAI利用资金购买英伟达芯片,帮助英伟达锁定未来几年巨额营收,使财务预期更稳定 [6] - 大规模资本与算力集中在两家公司手中,将面临潜在的反垄断、国家安全与外资审查等监管风险 [6] - 双方声称“细节仍在敲定”是为应对复杂的监管审查预留空间 [6] 行业竞争重心转移 - AI竞赛的重心正在从“模型”转向“基础设施”,未来五年竞争的关键在于谁能稳定地供给海量GPU、电力和网络 [7][8] - 谁掌握了基础设施,谁就拿到了将模型商业化、将服务规模化的入场券 [8]
从Transformer到GPT-5,听听OpenAI科学家 Lukasz 的“大模型第一性思考”
AI科技大本营· 2025-09-23 10:11
Transformer架构的诞生与影响 - 2017年论文《Attention Is All You Need》提出彻底抛弃循环神经网络,仅使用注意力机制处理语言,其提出的Transformer架构重塑了人工智能版图[2] - 该论文在Google Scholar上的引用次数高达197,159次,成为大模型理论的奠基性文章,开启了人工智能新纪元[2][17] - Transformer架构以其无与伦比的并行计算能力和对长距离依赖的出色捕捉,迅速成为自然语言处理领域的全新范式,并辐射到计算机视觉、语音识别等AI子领域[17] 核心人物Lukasz Kaiser的学术背景 - Lukasz Kaiser拥有波兰弗罗茨瓦夫大学计算机科学与数学双硕士学位,并在德国亚琛工业大学获得博士学位,专攻"自动结构上的逻辑与博弈"这一艰深领域[7] - 2009年其博士论文荣获E.W. Beth dissertation prize,这是全球逻辑、语言和信息领域的最高学术荣誉之一,证明其在纯粹理论科学领域达到世界顶尖水平[8] - 博士毕业后受聘于巴黎狄德罗大学LIAFA实验室,成为法国国家科学研究中心终身研究员,拥有稳定的学术职位和完全的研究自由[9] 从学术界到工业界的转型 - 2013年Kaiser辞去法国终身研究员职位加入谷歌大脑,这一决定源于对"重复"的厌倦和对"变革"的极度渴望,从"证明"转向"构建"的冲动[10][11] - 当时自然语言处理领域被循环神经网络统治,但RNN存在长距离依赖问题和串行处理缺陷,与GPU和TPU的并行架构不匹配[12][14] - Kaiser团队最初将注意力机制作为RNN的增强补丁,但最终提出完全基于注意力的新模型构想,彻底推翻了RNN的统治地位[14][15] Transformer八子的分化与Kaiser的选择 - Transformer八位作者中七位已踏上创业之路,成为AI产业浪潮中的商业巨擘,如Aidan Gomez创立Cohere、Noam Shazeer创立Character.ai等[4][24] - Lukasz Kaiser是八子中唯一未创业的科学家,于2021年离开工作八年的谷歌,加入以AGI为最终使命的OpenAI,继续坚守技术研究最前线[4][24][25] - 在OpenAI期间,Kaiser深度参与并主导了GPT-4、GPT-5以及代号为"o1"和"o3"的推理模型等核心研发工作[4][27] 通用人工智能的探索历程 - 2017年Kaiser参与发表论文《One Model To Learn Them All》,提出MultiModel单一模型同时处理八个不同任务,是AGI追求的第一次公开实践[20][22] - 该研究证明统一深度学习架构有潜力联合学习跨领域知识,尽管单项任务表现未超越专业模型,但为通用智能探索开辟了新方向[22] - Kaiser认为AI下一阶段关键在于教会模型"思考",通过生成更多中间步骤进行深度推理,而不仅仅是直接输出答案[29] 行业技术发展趋势 - AI发展经历了从2014年"证明可行性"到2017年"架构创新",再到2019年"自监督预训练"以及2021年"规模定律",最终到2023年"数据质量与RLHF"的进化路径[27] - 未来计算力将从大规模预训练转向在少量高质量数据上进行海量推理计算,预示着AI即将迎来又一次范式转移[29] - 多模态融合、模型规模持续提升以及AI能力通过API和云服务形式普及,已成为行业明确的发展方向[31]