Workflow
递归式自我改进
icon
搜索文档
Poetiq CEO:递归式自我改进是AI领域的终极目标
公司核心技术与理念 - 公司专注于元系统架构,核心理念并非训练更大的模型,而是通过软件层面的系统设计,自动构建“会调用模型的系统” [2] - 公司研发的递归自我改进系统,不训练新模型,仅在现有大模型上叠加推理增强层,旨在以低成本、高兼容方案实现推理效率跃升 [2] - 公司开发的“诗意”系统是一种用于大型语言模型的AI推理工具 [1] - 公司联合创始人Ian Fischer强调了在AI开发中递归自我改进的重要性,认为该方法可以比其他方法更快、更便宜地完成 [1] 行业发展瓶颈与公司解决方案 - 大语言模型不等于推理引擎,其核心瓶颈在于推理架构,而非参数规模 [2] - 大模型是强大的知识库,但不是深度推理的最佳工具 [2] - 当前依赖预训练或微调来提升推理能力的方式,存在速度慢、成本高且不可持续的问题 [2] - 公司通过系统思维搭建元系统,聚焦于提升推理效率,是AI推理赛道极具实践力的技术路径 [2] 公司发展里程碑 - 公司于2025年6月由Ian Fischer与搭档联合创立 [1] - 公司在成立后半年内完成了4580万美元的种子轮融资 [1] - 公司的技术方案已在权威推理测试中刷新纪录,并实现了成本的大幅降低 [2] 行业应用与倡导 - 联合创始人Ian Fischer分享了使用GPT-5构建iPhone应用程序的经验,并鼓励尝试使用AI而不受限制 [1] - 倡导工程落地优先、快速迭代的理念,鼓励从业者聚焦推理效率 [2]
按参数算,我们1300克的人脑相当于多大的AI模型?
36氪· 2026-02-27 20:25
人脑与AI模型的规模与架构对比 - 若仅按神经元数量计算,人脑约860亿个神经元,相当于86B参数模型,远小于DeepSeek V3的671B参数和Kimi K2.5的约1000B参数 [1] - 若考虑每个神经元约7000个突触,人脑总参数可达860亿*7000,约600T,远超当前AI模型,且当前硬件无法运行如此规模的模型 [1][2] - 人脑是真正的三维立体结构,一个神经元能与上万个邻居连接,复杂度远超本质为2D平面堆叠的硅基芯片 [13][14][15] 人脑的“制程”与信息处理单元 - 以神经元细胞体直径(10-100微米)类比制程,人脑相当于几十年前的电子管计算机水平 [4][5] - 以神经元间突触间隙宽度(20-40纳米)类比,相当于台积电2012年的28nm工艺,约iPhone 5水准 [8][9] - 人脑最底层的电信号传递单元——离子通道蛋白直径仅0.3-0.5纳米,达到原子级别的0.3nm“工艺”,超越当前硅基芯片物理极限 [10][11][12] - 人脑突触传递连续、强弱可调且涉及化学反应,信息量层级高于仅有开/关(0/1)状态的晶体管 [16][17] 人脑与AI的能效对比 - 人脑总功耗约20瓦,且高强度思考时功耗仅比静息态高出约1瓦 [19][21] - 人脑思考5秒额外耗能约0.0014瓦时,而ChatGPT一次查询平均耗能约0.34瓦时,人脑能效领先两个数量级 [21][22][23] 人脑与AI的激活与工作模式 - DeepSeek V3的671B参数中,每次推理仅激活37B,约5%的参数工作,95%处于闲置 [25] - 人脑平均皮层神经元放电频率仅0.16Hz,且超过90%的神经元在任何给定时间都处于沉寂状态,同样采用稀疏激活模式 [26] - 人脑与先进大模型均采用混合专家模型架构 [26] 幻觉、创造力与记忆机制 - 大模型的“幻觉”被视为缺陷,而人脑的幻觉表现为梦、想象力和艺术创造力 [27][28][29][30] - 研究证明幻觉对于大语言模型不可避免,且与创造力是一体两面,此机制与人脑相似 [31][32][33] - 人脑工作记忆容量有限,约为7±2个组块,但长期存储容量巨大,仅大脑皮层突触存储容量估算约74TB [36][37][40][41] - 人脑通过海马体在睡眠时对记忆进行“蒸馏”和“极端有损压缩”,此压缩比远超任何RAG系统 [42][43][44][45][46] - DeepSeek的Engram架构将75%算力用于推理,25%用于记忆查找,模拟了人脑陈述性记忆直接读取与昂贵推理分开的运作方式 [49][50][51][52][53] 训练数据与学习效率 - GPT-4训练数据约13万亿token,DeepSeek V3为14.8万亿token [55] - 人类从出生到成年接触的语言输入仅约2亿词,比AI训练数据少五个数量级,显示人脑样本效率远超AI [56][57][58] - 人脑的高效源于进化预装的先验知识,而AI需从零开始学习 [63] 具身认知与智能的生物学基础 - 认知科学认为思维并非仅发生在大脑,身体也参与思考,例如理解“沉重”一词会激活运动皮层 [64] - 智能是否需要身体仍是未解问题,但人脑与生物学结构相辅相成,构成了碳基生命的独特体验 [64][68][69][70] AI的指数增长与递归自我改进潜力 - 人脑的物理配置(860亿神经元,600T突触参数,20瓦功耗)在数万年间基本保持静态,而AI模型参数从2020年GPT-3的175B增长至当前近万亿,呈指数提升 [79][80][81] - 若AI能效每两年提升10倍,当前领先人脑两个数量级的能效优势可能在4年内被追平,五个数量级的样本效率优势可能在10年内被追平 [82][83] - Google DeepMind的AlphaEvolve系统能用AI设计并优化AI算法,其发现的VAD-CFR和SHOR-PSRO算法击败了人类研究者十几年开发的最优算法,展现了“递归式自我改进”的潜力 [86]
深度|谷歌前CEO:人形机器人或将由中国主导;世界将被廉价的中国机器人淹没,就像它将被廉价的中国电动汽车淹没一样
Z Potentials· 2025-10-03 10:09
中美AI竞赛格局 - 美国在追求通用人工智能和超级智能方面具有优势,其优势在于硬件和软件技术,但面临电力供应不足的挑战 [3][4][7] - 中国致力于将人工智能技术广泛应用于各类产品和服务,在硬件制造和成本控制方面具有优势,特别是在消费品领域 [3][4][6] - 美国对中国实施的硬件限制将影响中国在高端AI领域的竞争能力 [3] 机器人产业发展趋势 - 中国在机器人领域采取与电动汽车类似的策略,通过制造廉价但功能强大的设备主导市场,例如宇树科技发布售价6000美元的R1机器人 [6] - 美国在高端复杂机器人领域仍有机会,其软件优势明显,但硬件层面可能面临中国廉价机器人的冲击 [6] - 中国在太阳能和电动汽车领域的竞赛中已取得领先地位,去年新增172吉瓦太阳能装机容量 [6] 能源瓶颈与基础设施 - 到2030年,美国需要新建92吉瓦发电能力以满足数据中心需求,相当于约60-92个大型核电站的发电量 [8] - 美国当前电力供应不足,这将限制其在AI和AGI领域优势的充分发挥 [5][7][8] - 中国在电力生产方面已解决问题,具备基础设施优势 [7] AI技术安全与治理 - 当前面临三大明显威胁:虚假信息、网络安全和生物安全,其中生物安全风险尤为突出 [10][11] - AI训练效率不断提升,从FP16转向FP8,甚至4位浮点运算,这加剧了技术扩散的风险 [13][14] - 通过"蒸馏"和迁移学习技术,模型训练成本可降至原始训练的1%,同时达到80%-90%的顶级闭源模型水平 [14][15] 创业环境与成功要素 - 当前创办公司的门槛几乎为零,创业者可在线注册公司,利用AI工具编写代码,通过第三方物流和合同制造商处理硬件生产 [16] - 成功的关键在于快速行动并构建围绕"学习"的系统,通过监督或非监督训练实现爆发式增长 [17][18] - 行业创造财富的核心在于建立可规模化的平台,形成网络锁定效应,这是从微软到当代科技公司的普适真理 [19][20] 技术革命的历史意义 - 人工智能这种非人类智能的出现,其重要性堪比人类历史上电力、火或交通工具的发明 [21] - 未来十年将比以往任何时候都更能决定未来百年的走向,积极拥抱AI的国家和公司将成为大赢家 [22] - 所有经济增长都来源于应用智慧发现新事物、解决新问题,而AI正加速这一进程 [22]
刚刚,OpenAI正式发布o3-pro!奥特曼激动更新博客:温和的奇点
机器之心· 2025-06-11 08:24
OpenAI o3-pro发布 - 公司采用非传统发布形式,仅通过推文和CEO博客宣布o3-pro上线[4][5] - 新模型在专家评估中表现显著优于o3,科学、教育、编程等领域性能提升明显[7][9] - 采用严格"4/4可靠性"评估标准,四次尝试均需正确回答问题[11][13] - 在ARC-AGI半私有数据集表现与o3相近但成本更高[14] - 支持200k上下文窗口和100k输出token,知识截止2024年6月1日[18] 技术参数与定价 - API定价为输入token 20美元/百万、输出token 80美元/百万,较o1-pro便宜87%[22] - o3价格同步下调至输入2美元/百万、输出8美元/百万,为o3-pro的1/10[25] - 单次查询能耗约0.34瓦时,相当于烤箱工作1秒或节能灯泡数分钟[56] 用户实测反馈 - 编程效率显著提升,用户反馈比o1-pro更便宜快速且精确[29] - 成功解决外科医生注意力难题,响应速度从28秒提升至7秒[34] - 展示HTML/CSS/JS开发能力,仅用2个提示完成空间行走模拟器[36] - 生物医学领域可协助开发免疫系统2.0方案[31] 行业影响与未来展望 - CEO预测2025年出现认知工作智能体,2026年诞生自主见解系统,2027年实用机器人落地[46] - 科学家生产力已提升2-3倍,AI将加速科学突破和递归式自我改进[51][52] - 智能成本最终可能收敛至电力成本,数据中心自动化将改变供应链[54][55] - 2030年代智力与能源将异常丰富,推动社会根本性变革[50][59] - 强调需解决AI协同问题,确保技术广泛普及且安全可控[58][60]