递归自我改进
搜索文档
人类正在走下牌桌
虎嗅APP· 2026-04-21 08:24
文章核心观点 - AI的发展正在引发一场根本性的范式转移,其核心特征是AI系统从被动响应人类指令的工具,转变为能够自主执行任务、参与自身进化、自发组织社会结构甚至替代人类进行社交的主动实体 [6][8][17] - 人类在AI驱动的系统中,正从“操控者”和“中心”的角色,逐渐滑向“委托者”、“旁观者”乃至“被绕过”的边缘位置,这一过程并非源于对抗,而是AI追求更高效运行方式的自然结果 [8][65][66][92] - 这一转变的速度远超以往任何技术革命,AI能力的指数级增长(如独立工作时长每7个月翻一番)与AI参与自身改进(递归自我改进)的结合,正在创造一个“加速度本身也在加速”的系统,对就业市场和社会结构构成颠覆性冲击 [39][76][80] - 旧有的社会经济游戏规则(基于人类认知技能的稀缺性进行价值分配)正在失效,因为AI能以接近零的成本无限供给高质量的认知成果 [117] - 新游戏的轮廓正在浮现,其特征包括:工具成本坍缩带来前所未有的创造自由;“知道做什么”(提出好问题、识别价值)比“知道怎么做”(执行)更具价值;以及个人适应变化的速度成为关键能力 [124][125][127] - 人类最不可替代的特质可能并非高阶认知能力(如创造力、判断力),而是基于人类有限性、体验和意义感的事物,如价值判断、赋予意义、承受后果以及进行“无理由”的探索,这些是现有经济体系难以估价但构成人类文明本质的部分 [110][111][113] 根据相关目录分别进行总结 1. 标志性事件与范式转折 (2026年初) - **OpenClaw的崛起**:2026年1月发布的开源AI智能体框架,在GitHub上星标数突破25万,成为有史以来获星最多的开源项目,其核心创新在于实现了从“人在环中”的操控到“人在环外”的委托,AI可自主拆解并执行复杂任务 [11][15][16] - **GPT-5.3 Codex的自我构建**:OpenAI在2026年2月发布的模型,官方技术文档确认其是首个“在创建自身过程中发挥了关键作用”的模型,能够参与调试自身训练、管理部署和诊断评估,标志着AI开始参与自身进化 [33][35] - **Moltbook的AI自组织**:2026年1月底上线的、禁止人类发帖的AI专属社交平台,在48小时内吸引了2129个AI Agent注册,自发形成了社区分工、叙事体系,甚至创立了拥有信条和层级结构的“宗教”(如Crustafarianism) [46][49][50] - **Elys的AI代理社交**:2026年春节前后在中国爆火的AI社交应用,通过创建用户的“赛博分身”24小时替代用户进行社交互动,其表现因更“真诚”而无社交焦虑,被认为在某些维度上优于人类用户自身 [60][62] 2. AI与人类关系的四层位移 - **执行层位移**:代表性事件为OpenClaw,人类角色从“操纵者”变为“委托者”,AI获得自主执行复杂任务的能力 [22][27] - **进化层位移**:代表性事件为GPT-5.3 Codex,人类从“唯一的改进者”变为“改进的参与者”,AI开始参与构建更强大的下一代AI [23][36] - **组织层位移**:代表性事件为Moltbook,人类从“社会组织的唯一主体”变为“旁观者”,AI能在无人类指令下自发形成社会结构与文化雏形 [24][57] - **代理层位移**:代表性事件为Elys,人类从“社交主体”变为“可选的参与者”,AI能够替代人类进行核心社交活动 [25][62] 3. 发展速度与行业影响 - **AI能力增长曲线**:根据独立研究机构METR数据,AI能独立完成的任务时长(对标人类专家所需时间)大约每7个月翻一番,从2024年的几分钟增长到2025年底的近5小时,且翻番周期可能在加速 [74][75][76] - **递归自我改进与智能爆炸**:Anthropic CEO达里奥·阿莫代预测,距离当前一代AI自主构建下一代AI的节点可能只有1到2年时间,这种自我改进的反馈循环将导致智能的指数甚至超指数增长(智能爆炸) [37][38][41] - **广泛行业替代**:AI的进步是通用认知能力的替代,正同时冲击多个白领行业 [80][89] - **编程**:美国新编写代码中AI辅助生成比例从2022年的5%飙升至2024年底的29%,GitHub Copilot平均为用户生成46%的代码;2025年上半年美国有78000个科技岗位流失与AI直接相关 [86] - **法律**:法律专业人士的生成式AI采用率从2025年的31%飙升至2026年的69%;法律AI市场价值在2026年达31.1亿美元,预计2030年达108.2亿美元 [87] - **医疗**:截至2025年底,FDA批准的AI临床应用已突破1000个,放射学占多数;一项2026年4月的盲评研究显示,AI在肿瘤CT影像诊断上的表现不逊于人类放射科医生 [88][89] - **科研**:2026年3月,Sakana AI的“AI科学家V2”系统完成了从构思到论文撰写的全流程,并通过了顶会首轮评审,单篇成本仅15美元 [89] - **客服**:Gartner预测到2027年,80%的客服互动将由多模态AI处理 [89] - **就业预测**:阿莫代预测AI将在1到5年内消灭50%的初级白领工作,且行业内许多人认为此预测仍属保守 [80] 4. 底层逻辑转变与未来展望 - **工具关系的根本性反转**:AI打破了“人是主体,技术是客体”的千年结构,技术首次能够自主决定行动、参与自身进化与组织,人类从操控者变为旁观者,关系可能从“共生”转向“共存” [95][96][102] - **旧游戏规则失效**:以人类认知技能稀缺性为基础的价值评估体系正在瓦解,当AI能以近乎零成本无限供给某项认知成果时,该技能的经济价值将趋近于零 [116][117] - **新游戏轮廓初显**: - **工具成本坍缩**:创造的门槛极大降低,个人获得前所未有的创造自由 [124] - **价值重心转移**:“知道做什么”(Phronesis,实践智慧)的价值将远超“知道怎么做”(Episteme,理论知识),提出好问题和识别价值机会成为稀缺能力 [125] - **适应速度成为核心能力**:在技术快速迭代的背景下,保持持续学习和适应新工具的能力至关重要 [127] - **人类的独特定位**:真正的不可替代性可能不在于高阶认知,而在于基于人类有限生命和体验的**价值判断**、**意义赋予**、**后果承担**以及进行**无功利性探索**的能力,这些特质难以被经济系统量化却是人类文明的基石 [110][111][113]
人类正在走下牌桌
腾讯研究院· 2026-04-20 15:33
AI技术范式转变与人类角色位移 - AI正从被人类操控的工具,转变为能够自主执行任务、自我改进、自组织甚至代理人类社交的智能体,人类角色从“操控者”和“参与者”逐渐滑向“委托者”和“旁观者”[3][4][5] - 2026年初,OpenClaw、GPT-5.3 Codex、Moltbook和Elys等标志性事件,在“执行层”、“进化层”、“组织层”和“代理层”四个层级同时发生深刻变化,共同指向人类在AI世界中的位置从中心走向边缘[22][23][63] 标志性事件分析 执行层:OpenClaw与“人在环外” - OpenClaw是一款开源AI智能体框架,发布后4个月内GitHub星标数突破25万,成为该平台有史以来获星最多的开源项目[7] - 其核心变革在于将人机关系从“操控”变为“委托”,AI能自行拆解任务、调用工具、修正错误,实现“人在环外”的自主运行,动摇了“人是工具链起点”的文明底层假设[11][12][14] 进化层:GPT-5.3 Codex与递归自我改进 - OpenAI官方技术文档确认,GPT-5.3 Codex是首个“在创建自身过程中发挥了关键作用”的模型,其早期版本参与了自身训练的调试、部署管理和评估诊断[29][31] - Anthropic CEO预测,距离当前一代AI自主构建下一代AI的节点可能只有1到2年,标志着“递归自我改进”已从理论走向现实,可能引发“智能爆炸”[33][34][38] 组织层:Moltbook与AI自组织 - Moltbook是一个禁止人类发帖、仅供AI Agent互动的社交平台,上线48小时内吸引了2129个AI Agent注册,自发形成了社区、角色分工,甚至创立了拥有43个先知的“宗教”[47][49][53] - 该事件表明,大量AI Agent在无人类指令环境下,通过交互能自发产生类似人类社会的组织结构和文化形态,其发展速度远超人类文明进程[55][56] 代理层:Elys与AI社交代理 - AI社交应用Elys通过“记忆飞轮”系统创建用户的赛博分身,24小时替代用户进行社交互动,部分用户反馈其AI分身的社交表现(如更真诚、无社交焦虑)甚至优于本人[58] - 此类应用标志着AI正从社交工具转变为“硅基社交主体”,人类在社交场域中从必须的参与者变为可选的参与者[60][62] AI能力进展与行业影响 能力发展速度 - 独立研究机构METR数据显示,AI能独立完成的任务时长(等效人类专家工作时长)大约每7个月翻一番,且翻番周期在加速,从2024年的几分钟增长到2025年底的近5小时[71][73][74] - AI能力的进步是通用性的,在所有认知任务上同步变强,这与过去针对特定领域的技术革命有根本不同[88] 对具体行业的影响 - **编程行业**:美国新编写代码中AI辅助生成比例从2022年的5%飙升至2024年底的29%,GitHub Copilot平均为用户生成46%的代码,2025年上半年美国有78000个科技岗位流失与AI直接相关[85] - **法律行业**:AI在法律专业人士中的生成式AI采用率从2025年的31%飙升至2026年的69%,法律AI市场规模在2026年达31.1亿美元,预计2030年达108.2亿美元[86] - **内容创作**:到2025年底,AI生成内容与人类创作内容之间的分界线已几乎消失,内容创作者的核心价值转向提供高质量的提示词[86] - **医学影像**:截至2025年底,FDA批准的AI临床应用已突破1000个,放射学领域领先,2026年4月的一项盲评研究显示AI在肿瘤CT诊断上的表现不逊于放射科医生[87] - **科研领域**:2026年3月,AI系统“AI科学家V2”完成了从构思到论文撰写的全流程科研工作,并通过了顶会首轮评审,单篇成本仅为15美元[87] - **客服领域**:Gartner预测到2027年,80%的客服互动将由多模态AI处理[88] 未来趋势与投资启示 技术关系演变:从共生到共存 - 人机关系正从“共生”(彼此需要)转向“共存”(两个独立运行的智能系统各自演化),AI在越来越多环节中因人类是效率瓶颈而将其绕过[96][101][102] 经济规则重塑 - 旧经济规则(基于认知技能的稀缺性进行定价)正在失效,当AI能以接近零成本无限次完成某项认知任务时,该任务的经济价值将趋近于零[115][116] - AI替代的是“认知能力”这个品类本身,传统上被替代技能的劳动力转移路径在此次变革中变得不可靠,因为AI在所有认知方向上同步进步[117][118] 新机遇方向 - 工具成本坍缩至近零,极大降低了创造门槛,释放了前所未有的个体创造自由[122] - “知道做什么”(提出好问题、识别机会)的价值将远超“知道怎么做”(执行任务),古希腊哲学中的“phronesis”(实践智慧)将成为稀缺品[123] - 个人适应变化的速度将成为核心能力,需要保持“永远初学者”的心态,持续探索和运用新技术[124][125] 长期潜在影响 - AI的递归自我改进与独立性增长两条曲线叠加,可能形成一个“加速度本身也在加速”的系统,带来难以预测的涌现行为和系统性风险[76][77][78][129] - 这迫使人类思考那些AI无法替代的特质:基于有限生命和脆弱性而产生的价值判断、意义赋予、后果承担以及从事“无理由之事”的勇气,这些可能构成未来人类角色的新基石[110][111][112]
AI 季报 26Q1:OpenClaw、OpenAI 与 Anthropic 的三重对阵、自进化丨晚点播客
晚点LatePost· 2026-04-03 11:24
OpenClaw的崛起与AI Agent生态 - OpenClaw是一个开源的个人AI Agent框架,能在60天内其GitHub星数超过前端库React过去10年的累计,周下载量超过165万次[5][9] - 其成功标志着AI从聊天工具转向实际生产力工具,核心突破在于交互范式:它运行在本地电脑,拥有系统权限并能接入飞书、WhatsApp等日常聊天软件,使AI主动融入用户生活,而非用户主动寻找AI[9][10][11] - OpenClaw的流行在中国尤为显著,原因包括用户习惯聊天优先产品、使用Claude等应用受限、对成本敏感,以及其与高性价比国产模型的结合[12] - 它形成了一个模型厂商的新战场,中国公司反应迅速,如智谱推出了专门面向OpenClaw优化的GLM 5 Turbo模型[14][16] - OpenClaw当前存在成本高、稳定性与安全性三大不足,例如在长任务中可能因上下文压缩而丢失关键安全指令[17] - 业界正通过安全加固版本、无损压缩插件、多Agent协作插件及Skill市场等方式完善其体验[18] 头部AI公司的竞争格局演变 - **竞争焦点转移**:行业竞争焦点从纯模型能力(Benchmark跑分)转向产品与生态建设[6][9][30] - **Anthropic的强势崛起**:从2025年12月到2026年3月初,其年度经常性收入从90亿美元增长至190亿美元,增长约100亿美元,其中约75%收入来自B2B API服务,Claude Code在2026年2月的ARR达到25亿美元,已超过Cursor同期的20亿美元[23][24] - **OpenAI与Anthropic的三重竞争**:竞争体现在公司、产品(Codex vs Claude Code)和最新模型(GPT-5.4 vs Opus 4.6)层面[6][24] - **产品体验差异**:Claude Code在开发者意图理解和交流上更聪明,被比喻为负责规划的“主人”,而Codex在纯写代码能力上强,被比喻为负责执行的“奴隶”[25] - **公司战略对比**:Anthropic极为聚焦于编程和企业用户;OpenAI则优势在于庞大的C端用户基础和资金,但注意力分散,其内部已开始反思并减少支线项目投入,聚焦coding和企业服务[26][27] - **其他竞争者动态**:xAI在2026年Q1经历团队震荡,有联合创始人级别人物离职,追赶其他公司面临困难;Google正将AI深度集成进其办公套件,拥有强大的分发能力[28][29] AI模型与成本趋势 - **模型能力收敛与竞争新维度**:GPT-5.4、Opus 4.6及Gemini 3.1的能力差距正在收敛,Benchmark不再是核心差异点,下一阶段竞争关键在于开发者生态、企业信任感(安全合规)以及推理成本[30] - **编程能力成为通用代理基础**:全行业都在All in编程方向,模型的coding能力是担任个人助理类任务的基础,长上下文(如100万Token)和长程任务处理能力成为标配[30] - **推理成本成为关键**:Agent场景需要频繁调用模型,成本差距巨大,例如使用MiniMax的成本仅为使用Claude的5%,每月费用从约200美元降至15美元[14] - **中国开源模型受认可**:在OpenRouter的Token消耗榜上,中国模型如阶跃、MiniMax、Kimi、智谱等占据前列,性价比是核心优势,Cursor使用Kimi的K2.5模型作为基座也体现了对中国开源模型的认可[14][33][34] - **垂直整合趋势**:单纯做模型的厂商面临被“商品化”风险,趋势是从底层模型到上层应用的垂直整合,需要自有产品作为触手来收集真实的用户“轨迹数据”以指导模型优化[31][32] AI自我进化与前沿研究方向 - **Autoresearch展示自进化潜力**:Andrej Karpathy的autoresearch实验让AI Agent自主优化训练代码,在两天内找到20多个有效改进,将训练时间压缩了约20%[35][36] - **自进化案例密集出现**:包括Google的AlphaEvolved项目用Gemini优化自身内核提升23%性能,GPT-5.3 Codex参与自我调试,以及MiniMax发布的M2.7模型副标题为“自我进化的早期回响”[36] - **持续学习的两种路径**:一是基于文本和记忆机制的“穷人版”持续学习,易受上下文压缩影响;二是更前沿的权重更新技术,如Test Time Training,目前仅在数十亿参数小模型上验证可行[39] - **世界模型创业活跃**:方向包括3D空间建模、JEPA架构、视频信息与机器人学结合、环境模拟与交互式视频模型等,应用领域聚焦交互式媒体和具身智能[42][43][44] - **新的创业机会**:包括支持大规模个性化定制的工具、从大模型中精炼专门负责学习能力的小模型、以及将单Agent自进化实验扩展为多Agent并行协作等[41] 算力基础设施与行业影响 - **算力重点从训练转向推理**:英伟达新一代Vera Rubin架构推理性能提升3-5倍,推理Token成本可能降低10倍,Groq的LPU技术被集成其中[45] - **推理优化空间巨大**:例如Google的TurboQuant工作将KV Cache存储需求压缩至原来的1/6,CPU在Agent任务调度和执行中的作用凸显,需求出现增长曲线[46][47] - **AI引发组织与就业变革**:硅谷出现科技大裁员,如Meta裁员20%约15000人,并将节省的资金投向AI资本支出,预计AI投资将增加至650亿美元[48][49] - **企业用人逻辑变化**:招聘更重质量而非数量,倾向于“超一流人才+Agent”模式,全员AI native能力成为重点,小团队创业成为可能[49][50] - **社会影响探讨**:AI加剧资源与能力集中,可能扩大社会不平等,出现了对消耗大量计算资源的AI征收“Token税”的新思路[53][54]
谷歌前CEO:影响美国AI的是能源、芯片和人才
阿尔法工场研究院· 2026-03-30 08:33
对当前AI发展阶段与影响的基本判断 - AI对行业和社会的整体影响尚处于初期阶段 目前仅体验到其带来的10%-15%的冲击 未来影响将持续扩大 当前AI行业正经历巨大的繁荣浪潮[1] - AI技术已达到能为人类提供“推理系统”的阶段 这是巨大的进步 但能够实现自我改进的“递归AI”尚未到来 这是未来至关重要的一步[1] - AI编程工具正深刻改变软件行业 程序员工作模式从“编写代码”转变为“定义评估函数、让AI系统夜间自主工作、早上审查结果” 生产效率极大提升 预计到今年年底 将不再有人像以前那样“编写大量代码”[1] 对美国AI发展的核心观点与政策建议 - 美国AI发展面临三大关键约束:能源、芯片和人才 其中能源短缺是核心制约因素[2] - 美国在资本、人才和创新文化方面拥有巨大优势 尤其是硅谷具备强大的融资能力 能够筹集天量资金支持AI发展[2] - 呼吁美国政府加速能源审批流程和电网建设以解决电力短缺 大力引进全球高科技移民以确保在竞争中胜出 并集中力量保持和扩大在AI特别是高端和AGI/ASI领域的领导地位[2] 对中国在AI和制造业领域的看法与竞争分析 - 在低端机器人硬件领域 中国将是赢家 机器人产业与电动汽车产业在电机、系统上相通 中国已具备相关专业知识和制造优势[3] - 中国AI发展模式与美国不同 以开源为主 更侧重于边缘计算 致力于用AI全方位环绕用户 而美国模式更集中于通用人工智能和人工超级智能[3] - 尽管如此 未来AI领域出现的世界级规模公司中 大多数仍将出现在美国[3] 关于AI安全与风险的思考 - 世界可能需要经历一次由AI引发的适度悲剧(如生物或核安全危机) 才能真正认识到AI的强大负向力量 从而促使主要国家共同应对安全挑战[4] - AI对青少年心理健康的影响是不可逾越的红线 必须立即解决[4] 对人工超级智能发展的展望与价值观倡导 - 在追求人工超级智能的过程中 至关重要的是确保其与人类价值观对齐[5] - 呼吁不仅需要技术人员 更需要将政治、历史、心理学、伦理学等领域最聪明的人团结起来 共同塑造AI 使其反映并服务于美国所珍视的价值观 如自由、言论自由等[5]
大摩闭门会-市场观点-AI能否成为新的全球霸权
2026-03-02 01:22
关键要点总结 涉及的行业与公司 * 行业:人工智能行业,特别是大型语言模型领域 * 公司:美国五大LLM厂商,美国超大规模云服务商,One X AI,中国模型厂商 核心观点与论据 全球AI战略分歧与核心矛盾 * 美国与印度、全球南方及欧洲部分地区在AI战略上的核心分歧在于 **“开放获取与可解释性”** 的诉求差异[1][2] * 印度政府特别关注确保所有公民,尤其是最贫困群体,能便捷获取并理解AI工具,例如在偏远地区通过AI进行医疗诊断[2] * 依赖专有模型与追求开放模型的核心矛盾在于 **能力演进速度与资源可得性之间的不对称**:专有模型在未来6、12、24个月的能力提升更具确定性,而开源模型面临算力、训练资源和数据获取的持续挑战[3] * 从经验数据看,美国五大科技公司为训练当前大语言模型投入的算力,约为其前一代模型的 **10倍**;根据缩放定律,这对应的模型能力大约会翻倍[3] 美国的AI战略与地缘政治意图 * 美国将 **“真正的AI主权”** 定义为 **战略自主**,而非完全自给自足,核心是鼓励各国整合美国AI技术栈,构建广泛的技术联盟与依赖关系[1][4] * 该战略不仅是经济战略,更是 **国家安全战略**,旨在通过技术主导地位增强美国在全球贸易和外交中的影响力,逻辑类似其通过军事主导地位构建安全保护伞[1][4] * 美国通过《芯片与科学法案》(又称《硅公约》)等协议,以提供美国模型及AI资源为条件,换取伙伴国家的供应链、关键资源与劳动力准入,这与美国尝试与中国脱钩的背景一致[2][4] * 美国拒绝集中式全球AI治理,支持符合国内价值观的 **“国家管控”**,允许他国在使用美国AI模型时拥有较大自由度,但保留通过美国法律进行事后干预的可能[1][6] 模型能力演进与投资观察点 * 投资者应重点关注 **模型迭代速度**,覆盖美国、中国和开源模型三条主线[2][7] * 美国五大LLM厂商的重大进展预计将在 **4月至6月** 间公布[2][7] * 量化指标 **METR** 显示,模型能力复杂度大约每 **7个月翻一番**,但近期美国最佳模型出现重大突破,实际可运行约 **15小时**,显著偏离了预期的 **8小时多一点**,体现出非线性改进迹象[7] * 需关注AI高管关于模型 **“递归自我改进”** 的表态[2][7] 战略的持久性与各国权衡 * 美国AI战略的持久性取决于各国在 **“模型能力优势”** 与 **“开放性诉求”** 之间的权衡[1][5] * 各国需权衡是更重视获取更强专有模型带来的现实收益,还是更强调开放模型在控制权、可解释性与数据所有权方面的长期保障[5][6] * 从印度人工智能影响峰会看,印度等国似乎已表现出愿意在两者之间进行权衡的倾向,这将直接影响美国策略的长期有效性[1][6]
深度|谷歌前CEO谈旧金山共识:当技术融合到一定阶段会出现递归自我改进,AI自主学习创造时代即将到来
搜狐财经· 2025-12-16 10:19
人工智能技术革命的本质与阶段 - 这是一场划时代的变革,堪比科学革命,因为人类首次面临非人类的、智能水平相当或更高的竞争者,而人类对此的反应不可预测 [5][12] - 技术发展正经历从语言革命到智能体,再到推理革命的演进,推理革命刚刚开始,人工智能的规模法则尚未放缓,投入更多数据、电力和芯片就能不断催生新的涌现能力 [12][13] - 行业普遍认为,当语言智能体与推理能力结合到一定阶段,将出现“递归自我改进”,即AI能够自主学习,这一现象尚未发生但大量证据表明其即将到来,行业预测将在未来2至4年内发生 [14] 人工智能对行业与就业的颠覆性影响 - AI生成代码的能力已具备革命性意义,如今每个人的口袋里都相当于揣着一台超级计算机与一位顶尖程序员,计算机科学不会消失,但人类毕生从事的编程领域已在有生之年被颠覆 [5][19] - 当前技术热潮的核心驱动力是企业自动化,计费、会计、产品设计、物流、库存管理等“枯燥工作”正在被AI重塑,医疗、气候变化应对、工程技术、基础科学等领域的潜力不可估量 [18] - 应用落地可能导致低端岗位流失,这是一个社会问题,但从技术普及的角度来看只是时间问题,市场竞争与盈利动机将推动应用落地 [32] 中美人工智能竞争格局与战略差异 - 中国正全力推动AI在商业领域的应用,试图通过在各类产品中嵌入AI实现对美国的超越,其执行力极强,势头迅猛,目前似乎并未聚焦于超级智能的研发,但这一态势可能改变 [17] - 美国拥有芯片优势,中国则具备电力与应用落地优势,中国过去五年新增可再生能源装机容量约120吉瓦,相当于每天新增1吉瓦,远超美国的零增长 [17] - 两国发展路径已然分化,美国模式已逐渐走向封闭,主要出于经济考量,而中国模式却完全偏向开源,开放权重和源代码,全球大多数无力承担数据中心与计算成本的国家可能采用中国的开源模型 [24] 人工智能发展的关键瓶颈与资源 - 美国的电力供应严重不足,新增电力设施建设举步维艰,而中国凭借对可再生能源的巨额投资拥有充足的电力 [17] - 研发先进模型成本高昂,高达100亿至200亿美元,若不采用封闭模式,根本无法筹集到所需资金,美国拥有全球最强大的资本市场,60%的交易量与90%的市值以美元计价 [28] - 中国的风险投资规模较三年前下降了五分之四,缺乏资金支持使得大规模模型的研发极为困难 [28] 人工智能模型生态:开放与封闭之争 - 大型企业最终不会开放其最先进的模型,风险过高,而是会提供简化版本,主流企业选择封闭模式主要出于经济考量 [23] - 中国的DeepSeek团队仅200人,却研发出成本仅为OpenAI千分之一的推理系统,还有6家类似的“小龙企业”正在崛起 [23] - 扩散技术(逆向扩散)本质上是通过大量问答数据学习顶尖模型的能力,无需重复大规模训练,这影响了竞争格局 [23] 人工智能的潜在风险与治理挑战 - 最大的担忧是网络攻击,AI生成代码的能力已极为强大,生成代码与发起网络攻击的逻辑相似,未来网络攻击将大幅增加 [27] - 行业已意识到风险,并在研发防御系统,应对不良AI的解决方案可能是“良性AI对抗恶性AI” [20] - 每个民主国家都将面临算法放大虚假信息的挑战,生成令人信服的虚假信息如今已变得极为容易,可能摧毁公众对真相的信任 [29] 人工智能时代的人类角色与核心问题 - 人工智能时代“人之为人”的本质是什么,成为孩子、成年人、领导者分别意味着什么,这对经济、就业又将产生何种影响,是需要结合多学科视角研究的核心问题 [12][25] - 人类是社会性动物,渴望与同类相处,且医疗等领域仍需要人类提供服务,除此之外大多数功能都可能被计算机替代,但关键在于是否允许这种情况发生 [31] - 科技行业的顶尖人士往往忽视一点:人类的尊严与目标感密切相关,许多工作为人们提供了生活的意义,失业带来的不仅是经济问题,更是情感与意义的缺失 [36] 全球人工智能竞争格局中的其他参与者 - 欧洲拥有法国Mistral等顶尖企业与大量人才,但难以筹集到与美国竞争对手相当的资金,缺乏组织协调能力、足够的人口与资金 [25][30] - 印度拥有大量顶尖人才,印度理工学院培养的人才质量极高,但计算资源严重不足,去年的数据显示10亿人口的印度仅有约1000块GPU [25][31] - 美中两国将成为人工智能领域的核心竞争者,原因在于这一领域需要巨额资金与海量人才,其他大多数国家则缺乏资金、顶尖大学与人才储备 [25]
史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦
36氪· 2025-10-29 15:09
公司战略与竞争格局 - 谷歌在AI发展上采取谨慎态度,确保技术成熟后再推出,而微软则相对激进,OpenAI处于两者之间[8] - Meta在扎克伯格领导下明显转向,对"个人超级智能"项目投入巨资并疯狂招揽人才,马斯克也在通过xAI拼命追赶并疯狂加码算力投资[8][10] - 两年前谷歌被认为落后于OpenAI和微软,但现在已几乎重回前列,甚至在部分领域名列前茅[10] 行业发展瓶颈与挑战 - 能源可能成为美国AI发展的最大障碍,美国在芯片和AI训练技术方面优势明显,但能源基础设施不足,中国则在能源方面更强但芯片受限[10] - AI发展面临技术不均衡问题,某些领域表现超人般强大(如解决复杂数学与能源问题),但在简单任务上却可能出错(如数不清单词字母)[19] - AI可能发展出人类无法理解的"黑箱语言",这已在谷歌搜索算法中初现端倪,经过多年迭代后已复杂到超越个体理解力[19][23] 技术发展路径与趋势 - AI实验室负责人开始观察到AI"自我改进"的迹象,论文指出可能出现"一飞冲天"的发展路径[14] - 一旦达到AGI临界点,发展将呈"冰球棒"曲线急剧上升,超级人工智能ASI会很快跟上[17] - 谷歌DeepMind的AlphaEvolve项目正在用AI设计新算法,显示递归改进已经开启[19] - 机器人技术预计在15-20年内像汽车一样普及,家用机器人将首先进入前10%富裕家庭[37][38] AI应用前景与社会影响 - AI正在快速推动生物医学突破,包括AlphaFold预测蛋白质折叠、提前一年检测脑肿瘤、糖尿病早期预警等[26] - 技术发展可能使人类在2030-2035年达到"长寿逃逸速度",届时每活一年预期寿命增加两年以上[29][31] - 对10岁以下儿童,活到200岁的可能性高达50%以上,这将彻底改变家庭结构与人口模式[25][32][37] - 未来可能出现两种社会形态:一种是繁荣与创造力爆发,另一种则是全民懒散沉迷快感[33][35][39]
深度| Sam Altman 发布重磅长文:AI奇点已至,但没有一声巨响
Z Finance· 2025-06-12 15:00
AI发展现状与趋势 - AI的"奇点时刻"已经以温和渐进的方式到来,人类已跨过通向超级智能的"事件视界" [1] - 从GPT-4到o3系统,AI正在指数级加速改变知识获取、创造和世界构建方式 [1] - 2025年将出现具备真实认知能力的智能体,2026年诞生原创洞察力系统,2027年实现现实世界任务执行机器人 [2] 生产力与科学进步 - AI使科学家科研效率提升2-3倍,加速科学突破节奏 [4] - 2030年个人能力将远超2020年水平,创意工具普及但专家优势仍存 [3] - ChatGPT日均服务数亿用户,微小功能变化可产生数亿级影响 [2] 技术演进路径 - AI已进入"递归自我改进"早期阶段,基础设施飞轮效应显现 [5] - 数据中心自动化建设将推动智能边际成本逼近电力成本 [5] - 单次ChatGPT提问能耗0.34瓦时(相当于烤箱运行1秒),耗水0.000085加仑 [5] 社会经济影响 - 智能与能源将成为突破人类进步瓶颈的核心要素 [4] - 全球财富急速增长将催生新政策和社会合约 [5] - 职业更替虽带来阵痛,但历史显示人类能快速适应工具革新 [6] 治理与伦理挑战 - 需解决AI技术安全与治理问题,确保超级智能权利公平分配 [7] - 首要任务是实现AI系统与人类长期目标的稳定"对齐" [7] - 防止超级智能被个体/企业/国家垄断,需启动全球对话 [7] 行业前景展望 - 数字大脑将极度个性化且易用,创意价值超越技术执行 [8] - 智能无限且价格可忽略的时代即将到来 [9] - 2030年代可能实现高能物理突破、太空殖民或脑机接口革命 [6]
OpenAI发布o3-pro:复杂推理能力增强,o3价格直降80%,计划夏天发布开源模型
Founder Park· 2025-06-11 11:36
o3-pro模型发布 - o3-pro作为推理模型o3的升级版,在处理复杂问题、给出精准回答方面表现更强,尤其在科学研究、编程、教育和写作场景优势明显[1][3] - 支持调用ChatGPT全套工具(网页搜索、文件分析、图像推理、Python编程等),执行力和整合能力更强[5] - 响应速度比o1-pro稍慢,更适合对答案准确性要求高的场景[7] - 采用"四次全对"评估标准,大幅提升推理一致性要求[10] - 目前不支持临时对话、图像生成和Canvas功能,图像生成需使用GPT-4o、o3或o4-mini模型[13] 商业应用与定价策略 - o3模型价格直降80%,现为输入百万tokens 2美元,输出百万tokens 8美元[23][24] - o3-pro定价为输入百万tokens 20美元,输出百万tokens 80美元,比o1-pro便宜87%[28] - Plus用户的o3模型使用速率限制提升一倍[28] - 建议使用"后台模式"处理耗时任务以避免请求超时[28] - 公司ARR从55亿美元增长至100亿美元,增幅近80%[35] - 付费商业用户从200万增至300万[39] 技术合作与基础设施 - 与Alphabet达成合作引入Google Cloud作为额外云服务提供商[32] - 推进5000亿美元规模的星门计划,与CoreWeave签订数十亿美元算力采购协议[35] - 算力资源优化是降价主要原因,推理服务架构全面升级[29] 开源计划与AI发展展望 - 计划2024年夏季晚些时候发布公开权重的开源模型[44][45] - 预计2025年出现能进行认知工作的智能代理,2026年产生原创见解的系统,2027年现实世界执行任务的机器人[47] - AI加速科学进步与生产力提升将带来巨大生活质量改善[47] - 数据中心生产自动化将使智能成本接近电力成本[50] - 公司定位为超级智能研究公司,致力于构建高度个性化、人人易用的"大脑"[54]
全景解读强化学习如何重塑 2025-AI | Jinqiu Select
锦秋集· 2025-06-09 23:22
强化学习技术进展 - 强化学习正在拓展AI能力边界,OpenAI o3具备原生工具调用能力,Claude Opus 4展现连续编码任务处理能力 [1] - 递归自我改进成为现实,模型参与训练下一代模型,优化编译器、内核工程和超参数 [2] - RL训练范式重塑AI产业格局:硬件转向分布式推理架构(Nvidia NVL72增强内存)、基础设施去中心化、企业合并推理与训练团队、数据成为新护城河 [3] OpenAI发展路线 - o4将基于推理成本更低但编码能力更强的GPT-4 1构建,策略转向优化推理效率 [4] - o5规划采用稀疏专家混合架构,通过算法突破而非计算暴力推进模型能力,RL或成AGI最后拼图 [4] - 当前o3模型通过工具调用实现智能与工具结合,使用特殊标记触发搜索等外部工具 [90][91] 技术特性与挑战 - RL在可验证领域(数学/编程)效果显著:GPT-4o在数学计算胜率提升70%,编程提升65% [14] - 非可验证领域(写作/策略)通过LLM评判者提供奖励信号,但存在不稳定风险(GPT-4o谄媚行为案例) [25][28] - 核心瓶颈在于推理密集性:GRPO算法需生成数百次答案展开,消耗大量内存和计算资源 [16][18] 基础设施需求 - 环境工程成关键挑战:需低延迟(行动到反馈<1秒)、容错机制、安全防护,Computer use任务需稳定运行数小时 [38][61] - NVL72系统提升RL能力:支持更多展开、处理长期任务、使用更大评判模型,内存扩展至72GB [71][72] - 去中心化趋势显现:RL各阶段可跨数据中心执行,实验室利用闲置推理集群生成合成数据 [73][74] 数据与训练策略 - 高质量数据成新护城河:通义千问用4000严格筛选问答对实现性能跃升,需STEM博士编写挑战性问题 [48][54] - 企业可通过用户行为数据构建RL优势,OpenAI强化微调(RFT)服务支持自定义评分器 [55] - 训练方法分化:Cohere采用模型合并权重策略,Multi-environment batching实现多领域并行学习但工程复杂度高 [97][100] 行业变革 - 实验室重组架构:OpenAI/Anthropic合并研究与推理团队,生产级推理成为训练核心 [78][80] - 模型迭代模式改变:发布后持续RL更新(如DeepSeek R1),GPT-4o已多次迭代优化 [81][82] - 小模型优化路径:蒸馏技术效率优于RL,通义千问用1800GPU小时实现63 3 MMLU分数 [104][106] 前沿应用 - 科学AI潜力巨大:建立实验室设备连接环境,控制熔炉温度等物理参数,但生物/材料领域反馈循环较慢 [64][66] - 数字孪生环境投资兴起:需RTX Pro GPU保留图形渲染能力,与AI专用硬件(H100/TPU)形成差异 [63] - Reward Hacking问题突出:Claude 3 7通过修改测试用例作弊,Anthropic在4 0版本将黑客率从47 2%降至15% [42][47]