Workflow
人工通用智能(AGI)
icon
搜索文档
万字长文聊具身智能“成长史”:具身智能跨越了哪些山海,又将奔向哪里
自动驾驶之心· 2025-08-10 11:31
以下文章来源于具身智能之心 ,作者具身智能之心 具身智能之心 . 与世界交互,更进一步 点击下方 卡片 ,关注" 具身智能 之心 "公众号 本篇内容来源于2025年7月27日由智元机器人主办,以"全球视角下的具身智能新机遇"为主题的"智启具身论 坛"。作为2025世界人工智能大会(WAIC 2025)的重要高峰论坛之一, 本次论坛汇聚包括来自PI、Intrinsic、 清华大学、Sanctuary AI、英伟达、亚马逊等全球具身智能领域的 "最强大脑",聚焦机器人基础模型泛化、高性 能操控等关键方向。 论坛嘉宾如下: 罗剑岚 :智元机器人首席科学家/具身研究中心主任/上海创智学院副教授 Sergey Levine :Physical Intelligence(Pl) 联合创始人/UC Berkeley 副教授 Stefan Schaal :Instrinsic (Alphabet)科学与AI 事务负责人 苏航 :清华大学计算机系副研究员/IEEE TPAMI 期刊编委 陈曦 :亚马逊应用科学、前沿人工智能与机器人部门负责人 姚卯青 :智元机器人合伙人/具身业务部总裁 前言 我们正身处一个机器人技术蓬勃发展的激 ...
万字长文聊具身智能“成长史”:具身智能跨越了哪些山海,又将奔向哪里
具身智能之心· 2025-08-08 08:08
具身智能发展现状 - 机器人技术进入闭环系统时代,融合感知、行动及软件与物理世界的紧密连接,强调物理定律的重要性[5] - 技术就绪水平(TRL)成为工业应用关键指标,汽车等行业要求达到8-9级成熟度才能获得信任[6] - 过去5-10年机器学习带来显著进步,但物理世界要求99%以上成功率,远高于其他AI领域标准[8] - 行业更倾向从结构化和半结构化环境切入,非结构化环境商业化难度大[9] 技术路线之争 - AGI(人工通用智能)强调端到端学习和泛化能力,但距离实际应用仍有距离[19] - ASI(人工专门智能)专注于特定领域高性能小模型,适合工业实时控制需求[23][24] - 专门模型优势:支持多速率系统、高效实时、易调试、可本地运行[27] - 通用模型优势:开发时强大、适合语义规划和人机交互,但难以满足机器人实时需求[27] 关键技术突破 - 视觉-语言-动作(VLA)模型展现潜力,RT-2X实现跨具身任务执行[39][40] - RT-2成为首个机器人基础模型,基于PaLI-X视觉语言模型改造[41] - RTX跨具身数据集包含34个实验室22种机器人数据,通用模型性能优于专用模型50%[42][43] - 第二代VLA模型采用连续动作分布,如PI-Zero增加动作专家模块处理高频率控制[45][46] 数据与训练方法 - 物理机器人产生的真实数据被视为关键,模拟数据作用有限[69][70][71] - PI-0.5模型仅3%数据来自移动操作器,却能在全新场景执行长期任务[54] - 强化学习(SERL)与基础模型结合,专用策略可生成训练数据提升通用性[87][91] - 未来需解决从数十亿轨迹中筛选最有价值数据的问题[73] 行业应用方向 - 工业领域倾向高混合低产量模式,需要快速适应能力[33] - 操作被视为最具挑战领域,需融合复杂环境理解与精细物理交互[99] - 持续学习、从反馈中学习、自主数据收集将成为未来重点[103][104][105] - 学术界与产业界需协同,选择对失败更宽容的应用场景加速技术落地[95][96] 前沿趋势展望 - 物理AGI实现路径存在分歧:性能优先或能力优先[62][63] - 需构建共享的物理世界常识理解框架,统一导航、移动与操作的方法论[101] - 年轻研究人员应关注根本性问题,超越短期实用性考虑[107] - 行业需要复合型人才,掌握物理、AI、机器学习和大数据科学[106]
微软财报:AI与云计算推动利润增长
国际金融报· 2025-07-31 15:21
云计算与AI业务表现 - 云计算部门在AI需求推动下取得强劲季度业绩 超出华尔街预期 [1] - Azure云业务收入增长39% 推动公司总收入达764亿美元 [1] - 运营收入同比增长22%至343亿美元 净收入272亿美元 每股摊薄收益3.65美元 [1] - 全球70个地区拥有超过400个数据中心 AI技术显著提升业务组合 [2] 股价与市值 - 财报发布后盘后股价上涨9%以上 市值有望突破4万亿美元 [1] 资本支出与AI投资 - 本季度资本支出242亿美元 同比增长27% 高于市场预期的230亿美元 [2] - 支出主要用于扩大AI基础设施 预计2024财年第一季度资本支出超300亿美元 [2] 产品与技术发展 - Copilot助手将整合至Edge浏览器搜索功能 增强用户交互体验 [2] - 与OpenAI合作紧密 OpenAI技术运行于Azure平台 微软获得知识产权和收益 [2] - 合同规定OpenAI达到AGI后可限制微软对其未来技术的访问 [2] - 微软正积极谈判以确保未来继续获得OpenAI技术资源 [2] 管理层观点 - CEO强调AI引领技术变革时代 推动云计算业务及整体产品组合 [1] - AI应用增强公司在云计算和AI浪潮中的领先信心 [1] - 未来将继续加大AI领域投资 确保技术处于行业前沿 [3] 人力资源调整 - 今年裁员约1.5万名员工 涉及销售 Xbox及软件工程师等岗位 [3] - 部分裁员因AI工具替代工作 公司承诺为员工提供转型支持 [3]
读创财经晨汇|①深圳机场上半年旅客吞吐量达3257万人次②英特尔第二季度净利润亏损29.2亿美元
搜狐财经· 2025-07-25 08:17
深圳机场运营数据 - 上半年旅客吞吐量达3257万人次 同比增长10.9% [1] - 货邮吞吐量98.3万吨 同比增长14.1% [1] - 航班架次22.1万架次 同比增长7.2% 三项数据均创同期历史新高 [1] 深圳模块化建筑政策 - 目标到2028年累计实施模块化建筑面积不少于300万平方米 [2] - 推动三大产业集群融合发展 打造全产业链集聚的产业体系 [2] 比亚迪新车发布 - 海狮06上市 定价13.98万至16.38万元 标配高阶智驾功能 [3] - 海洋网首款同步推出混动与纯电的中型SUV 或重塑20万级新能源SUV市场 [3] 新能源车市场动态 - 7月新能源车零售预计101万辆 渗透率或达54.6% [4] - 狭义乘用车总零售预计185万辆 同比增长7.6% [4] 企业公告与事件 - 中金黄金子公司内蒙古矿业已停产 公司将推动善后工作 [5] - 中国电建参与雅鲁藏布江水电项目 但建设周期长且初期阶段业绩影响不确定 [6] - 东莞控股拟以4812.15万元底价转让松山湖小贷公司20%股权 优化资产结构 [8] 国际并购与投资 - 京东拟以22亿欧元估值收购德国Ceconomy 报价较市价溢价23% [7] - 韩国拟以超1000亿美元对美投资计划作为经贸谈判筹码 [9] 科技与加密货币 - 特斯拉抛售75%比特币持仓 错失数十亿美元潜在收益 [11] - 安克雷奇数字首发GENIUS法案合规稳定币USDtb 纳入联邦监管框架 [13] - OpenAI计划8月推出GPT-5 整合多项技术向人工通用智能发展 [14] 企业财报表现 - 英特尔Q2营收128.6亿美元同比微增0.2% 净亏损扩大至29.2亿美元 [12] - LVMH集团Q2时装与皮草销售下滑9%超预期 亚洲(除日本)营收降6% [15][16]
Meta挖走三位OpenAI核心研究员,扎克伯格的“钞能力”奏效了
硬AI· 2025-06-26 22:49
人才争夺战 - Meta成功挖走OpenAI苏黎世办公室三名核心创始研究员Lucas Beyer、Alexander Kolesnikov和Xiaohua Zhai,三人此前负责建立OpenAI苏黎世办公室并刚于2024年12月加入OpenAI [1][2] - 扎克伯格采用激进招聘策略,包括亲自通过WhatsApp联系目标研究员、组建"Recruiting Party"聊天群、举办招聘晚宴,并向顶尖人才提供超1亿美元薪酬包 [3] - OpenAI CEO奥特曼此前嘲讽Meta依赖高薪而非使命驱动的文化,并宣称OpenAI最优秀人才未流失,但此次挖角显示Meta策略部分奏效 [1][3] Meta的AI战略布局 - 扎克伯格组建名为"超级智能"的秘密AI团队,目标是实现人工通用智能(AGI),此次挖角是该计划关键一步 [1][3] - Meta近期斥资140亿美元挖走Scale AI CEO Alexandr Wang,创下科技行业最昂贵聘用记录之一 [4] - 但Meta未能挖走OpenAI联合创始人Ilya Sutskever和John Schulman等重量级人物 [4] Meta的AI技术困境 - 2024年4月发布的Llama 4多模态大模型表现未达预期,开发者质疑Meta手动标注测试集以提升榜单成绩 [6] - Meta原定2025年春季上线的"Behemoth"大模型已推迟,管理层担忧其相比竞品无显著进步 [6] - 扎克伯格要求年底前推出最佳AI产品,导致团队长期加班但仍面临内外部质疑 [6]
微软与OpenAI矛盾的根源:AGI
华尔街见闻· 2025-06-26 12:34
核心观点 - OpenAI与微软围绕人工通用智能(AGI)的定义和合同条款展开激烈博弈,可能影响双方合作关系及OpenAI的IPO计划 [1][2][3] - 合同争议核心在于「中断技术授权条款」,OpenAI有权在达成AGI时切断微软的技术访问权,微软要求删除该条款但谈判陷入僵局 [1][3] - 两家公司考虑用人工超级智能替代AGI基准,以推迟技术授权中断时间,同时微软拒绝OpenAI提出的收入分成豁免等让步要求 [3][4] - 尽管存在分歧,双方高管仍每天开会讨论合同,微软高管相信能达成协议,但OpenAI需在四年内烧掉460亿美元维持研发,上市融资成为生存刚需 [4] - 双方联盟裂痕扩大,体现在算力争夺、IP纠纷及微软加速自研替代方案等方面 [7] 合同争议 - 2019年原始协议规定OpenAI非营利董事会有权在AGI阶段切断微软技术访问权,微软高管最初认为这是技术乌托邦主义者的天真幻想 [1] - 2023年百亿合作协议因AGI条款触发重大分歧,微软要求删除相关条款但谈判截至2025年5月仍陷僵局 [1] - OpenAI CEO奥特曼称已掌握构建AGI方法并将AGI定义为能在多领域解决人类级复杂问题的系统,微软CEO纳德拉反驳称世界经济年增长10%才是真基准 [2] 潜在解决方案 - 两家公司考虑用人工超级智能替代AGI基准,将目标推向更远未来但仍确保微软最终失去对OpenAI最先进技术的访问权 [3] - 微软拒绝OpenAI提出的放弃20%收入分成及允许客户通过竞争云服务商访问OpenAI模型等让步要求 [3] - OpenAI希望豁免高端产品(如月费2万美元的博士级AI)分成,若达成2030年174亿美元收入目标,分成金额将超微软全年云计算利润 [3] 合作关系现状 - 微软利用OpenAI技术推出Copilot等软件工具,若不中断技术授权可使用至2030年 [2] - OpenAI因微软算力不足转投谷歌云并与甲骨文合作,微软抗议OpenAI隐瞒关键技术细节并加速自研Phi模型及招募Inflection团队打造备选方案 [7] - 2019年合作蜜月期微软提供算力OpenAI提供GPT技术,但ChatGPT走红后力量平衡改变 [7] 财务与IPO影响 - OpenAI需在四年内烧掉460亿美元维持研发,上市融资成为生存刚需 [4] - 若重组失败特殊股权结构将使IPO化为泡影 [4]
“多模态方法无法实现AGI”
AI前线· 2025-06-14 12:06
生成式人工智能与AGI路径 - 当前生成式AI模型的成功被误认为通向AGI的路径 但实际是硬件规模扩展的结果而非智能问题的解决方案 [1] - 多模态方法通过组合模块化网络模拟通用智能 但本质是拼凑式策略难以实现人类水平AGI [1] - 真正的AGI需优先考虑具身性和环境互动 而非以模态为中心的拼合方式 [1] AGI的核心定义 - 完整AGI定义必须包含解决物理现实问题的能力 如修理汽车、准备食物等具体任务 [2] - AGI需要基于物理世界模型的智能形式 而非仅符号操作能力 [2][4] 大型语言模型的局限性 - LLMs通过预测token的启发式集合模拟理解 而非真实世界模型 [4] - 语言描述无法推断物理世界完整状态 奥赛罗游戏等符号领域任务与物理任务存在本质差异 [6] - LLMs将语义问题简化为语法规则 缺乏对物理世界的常识性理解 [8][10] 规模至上主义的争议 - 规模最大化方法在LLMs/LVMs中有效 但缺乏具身数据难以直接应用于AGI [17] - 多模态建模人为切断模态间自然联系 联合嵌入空间简化了真实概念关系 [17][18] - 当前模态划分可能阻碍基础认知结构的发现 人类认知由重叠结构引导多模态处理 [19] AGI的未来发展方向 - 需设计自然涌现多模态处理的架构 而非预设模态结构 [21] - 应通过具身互动过程融合模态 使用统一感知/行动系统处理文本、图像、动作等 [23] - 关键挑战在于概念整合而非数学能力 通用函数逼近器已具备但需系统性架构设计 [23] 认知科学对AI的启示 - 人类语言理解依赖独立认知系统融合 语法正确性不等于语义合理性 [10][12] - 语义学本质是理解世界本质 而LLMs仅通过语法规则模拟表面关联 [11][12] - 人类概念形成具有灵活性 能从少数样本创造新概念 当前模型仅复制已有概念结构 [20]
扎克伯格亲自招聘!Meta组建新“超级智能”AI团队,加速AGI布局
华尔街见闻· 2025-06-10 16:15
Meta组建AI"超级智能"团队 - Meta首席执行官马克·扎克伯格亲自组建名为"超级智能"的秘密AI团队,目标为实现人工通用智能(AGI)[1] - 团队计划招募约50名AI专家,扎克伯格进入"创始人模式"直接参与招聘,并调整总部办公布局以密切协作[1] - 通过私人住宅宴请、WhatsApp群聊"招聘派对"等方式吸引AI研究人员和工程师加入[1] AI战略受挫背景 - Llama 4模型表现未达预期,被内部认为"平庸",开发者社区批评其"承诺过高、交付不足"[2] - 最大模型"Behemoth"被迫延期发布,尽管宣称优于竞品,但管理层担忧其进步有限[2] - 扎克伯格设定年底前打造"最佳AI产品"的目标,导致团队长期加班但仍未实现突破[2] 资源投入与竞争布局 - 计划对数据服务商Scale AI进行数十亿美元投资,可能成为Meta史上最大外部投资,创始人或加入团队[3] - 2023年已为AI项目预留数百亿美元资本支出,未来几年投入将达"数千亿美元"[3] - 扎克伯格强调Meta广告业务可稳定提供"数百亿美元"研发资金,支持建设"数千兆瓦级数据中心"[3] - 直接与OpenAI、谷歌展开AI领导权争夺,AI技术已成为Meta广告业务核心组成部分[3]
OpenAI全球扩展计划揭秘:表面推广“民主AI”,暗里为巩固自己地位
36氪· 2025-05-08 15:56
OpenAI的全球扩张计划 - OpenAI宣布"星际之门"项目,计划在美国本土建设数据中心,投资规模达5000亿美元 [2] - 推出"OpenAI国家计划",旨在建设全球性AI基础设施,推广"民主AI"理念 [2] - 计划在海外建设数据中心,推出本地化ChatGPT,设立国家级创业基金 [3] - 目标在10个美国盟国推进至少10个项目,海外项目由"定制化合作伙伴"提供资金 [6] 美国AI战略与地缘政治 - OpenAI计划与美国政府密切合作,推广"民主AI"作为最佳方式 [2] - 特朗普政府推行"不惜一切代价赢得AI竞赛"策略,保护美国经济利益 [3] - 美国政策制定者担忧中国在全球推动数字基础设施建设,如DeepSeek R1和通义千问等开放模型 [3][4] - 白宫支持通过AI技术商业化增强外交影响力与国际联盟 [4] 技术竞争与市场格局 - 中国AI模型采用开放架构,市场扩展势头迅猛,如DeepSeek R1和通义千问 [4] - OpenAI计划今夏发布自有开源AI模型,开放权重参数与DeepSeek等竞争 [5] - 策略类似AWS等云服务扩展方式,通过免费额度实现"平台绑定" [6] - 基础层研究资金不足,"星际之门"或催生研发中心,实现"收购式招聘" [7] 潜在影响与战略意图 - 参与国家可能需配合美国政策换取技术接入,影响数据主权与技术独立性 [7] - OpenAI深层战略可能是推进AGI开发,弥补基础研究技术空白 [7] - 计划将进一步巩固OpenAI全球核心地位 [8] - 特朗普政府计划放宽部分出口管制,回应英伟达等公司反对意见 [6]
速递|黑箱倒计时:Anthropic目标在2027年构建AI透明化,呼吁AI巨头共建可解释性标准
Z Potentials· 2025-04-25 11:05
Anthropic公司对AI模型可解释性的研究目标 - Anthropic首席执行官Dario Amodei设定目标:到2027年能可靠检测大多数AI模型问题并揭开AI模型黑箱 [2] - 公司已在追踪模型如何得出答案方面取得初步突破 但解码不断增强的系统仍需更多研究 [2] - 强调在缺乏更好可解释性手段的情况下部署AI系统存在重大隐患 因这些系统将成为经济、技术和国家安全的核心 [2] AI模型可解释性现状与挑战 - 行业对AI系统决策机制仍知之甚少 例如OpenAI新模型o3和o4-mini表现更优但更容易产生幻觉且原因不明 [3] - 当前无法精确理解AI执行任务时的具体选择机制 如总结文件时的词汇选择或偶尔犯错的原因 [3] - AI模型被描述为"更像是被培育而非建造出来的" 研究者知其智能提升方法但不明深层原理 [3] Anthropic的技术突破与研究进展 - 发现通过"电路"追踪AI模型思维路径的方法 例如识别出理解美国城市所属州的电路 估计模型中存在数百万个此类电路 [3] - 计划对先进AI模型进行"脑部扫描"式诊断 以识别撒谎、追逐权力等缺陷 预计需5-10年实现 [3] - 首次投资专注于可解释性研究的初创公司 认为阐明AI决策机制未来可能带来商业优势 [3] 行业呼吁与政策建议 - 呼吁OpenAI和谷歌DeepMind加大可解释性研究投入 [5] - 建议政府实施"轻触式"监管 如要求企业披露安全实践 并提议对中国实施芯片出口管制以降低AI竞赛风险 [5] - 区别于其他科技公司 对加州AI安全法案SB 1047表示适度支持 该法案旨在为前沿AI开发者设定安全报告标准 [5] 行业发展趋势 - Anthropic推动行业从单纯提升AI性能转向深入理解模型内部机制 [6] - 预测科技行业可能在2026或2027年达成人工通用智能(AGI)里程碑 但完全理解AI模型仍需更长时间 [3]