通用人工智能（AGI） - 财报，业绩电话会，研报，新闻 - Reportify

通用人工智能（AGI）

搜索文档

马斯克的官司还没打完，OpenAI 已经开始“动刀”了

36氪· 2025-09-05 16:30

OpenAI的法律行动 - OpenAI向支持马斯克立场的非营利组织发出律师函和传票，要求交出通信记录等文件[2] - 传票对象包括AI伦理组织Encode和AI治理公益组织LASST，这些组织曾质疑OpenAI从非营利转型为商业公司[2][6] - 传票内容要求提供一切与马斯克相关的通信记录，甚至提及Meta和扎克伯格[6] 马斯克与OpenAI的法律纠纷 - 马斯克于2024年3月起诉OpenAI，指控其背叛了不为了盈利、将AGI交给全人类的初心[7] - 马斯克指控OpenAI让ChatGPT的升级路线向微软的商业利益倾斜，而非人类共同利益[7] - OpenAI回应称马斯克当年试图控制OpenAI董事会和产品方向，并有意让OpenAI与特斯拉合并，被拒后撤资[9] OpenAI的政治策略 - OpenAI于2025年成立名为Leading the Future的政治行动委员会，用于合法接收政治捐款和游说国会议员[15] - 该组织最初为OpenAI从非营利转向营利化辩护，后转向抹黑反对者[16] - OpenAI在社交媒体和论坛排查反对者，甚至因一个非营利组织房东公司名含"Tesla"而怀疑其与马斯克有关[17][18] 行业影响与核心争议 - 诉讼揭示了AGI发展路径的核心争议：谁有权掌控AGI方向，非营利初心如何面对数百亿美元算力成本[12] - 行业面临共同困境：非营利结构可能扼杀进化，完全市场化则可能使AGI成为资本工具[12] - 争议焦点从"谁说了什么"转向"谁有权说话"，监管机构和非营利组织等社会监督体系面临被收编或威胁[26]

通用人工智能（AGI）

非营利组织商业化

Artificial Intelligence

通用人工智能（AGI）

非营利组织商业化

Artificial Intelligence

李飞飞的答案：大模型之后，Agent向何处去？

虎嗅· 2025-09-05 08:34

论文核心观点 - 李飞飞领衔的14位专家团队发布80页Agent AI综述提出统一的多模态智能体认知框架为行业提供前瞻性发展蓝图 [1][2][3][5][6][61] 技术架构 - 建立感知-决策-行动加记忆与学习的五模块认知闭环架构形成动态迭代的智能交互系统 [9][10][26] - 感知模块支持多模态信息输入包含视觉听觉文本传感器数据并具备任务规划与技能观察能力 [12][13][14] - 认知模块由大语言模型和视觉语言模型驱动负责多步推理与策略制定 [16][17] - 行动模块生成物理世界或虚拟世界的操作指令通过控制器改变环境状态 [18][19] - 学习模块支持预训练/零样本/强化学习/模仿学习等多种机制通过环境反馈持续优化 [20][21][22] - 记忆模块实现持久化结构化存储保留知识逻辑推理路径支持经验复用 [23][24][25] 基础模型作用 - 大语言模型和视觉语言模型为智能体提供世界知识库与零样本规划能力显著降低任务规则编写成本 [28][29][31] - 模型存在幻觉问题 Agent通过环境交互获得物理规律反馈倒逼模型与现实世界对齐 [32][33][34][35] - 基础模型可能继承社会偏见需通过多元化训练数据和偏见检测机制确保包容性 [36][37] - 在医疗等敏感领域需建立数据隐私保护框架通过提示工程和人类监督层确保安全可控 [38][39] 应用场景 - 游戏领域可创建具备记忆情感的NPC 支持自然语言交互与动态行为调整显著提升开放世界沉浸感 [41][42][43][44] - 作为AI副驾驶自动生成游戏关卡道具及3D场景大幅提高开发效率 [45] - 机器人领域实现自然语言指令解析自主规划复杂物理操作序列 [47][48] - 通过GPT-4V理解人类演示视频并转化为可执行任务简化编程流程 [49] - 采用领域随机化技术增强模拟到现实的迁移能力提升环境适应性 [50] - 融合视觉语言触觉等多模态信息实现精细环境交互如根据"易碎"指令调整抓取力度 [51] - 医疗领域作为聊天机器人进行初步问诊病史收集提升初级诊疗覆盖率 [54] - 连接实时医学数据库实现事实核查与来源引用抑制模型幻觉保障诊断准确性 [55] - 处理分流患者信息并监控慢性病体征数据实现高效个性化健康管理 [57] 发展挑战 - 需突破视觉语言听觉动作等多模态深度融合技术而非简单拼接 [59] - 需开发跨游戏机器人医疗等不同领域的通用智能体而非定制化模型 [60] - 建立科学评测体系如CuisineWorld多智能体协作基准和VideoAnalytica视频理解基准 [61]

通用人工智能（AGI）

Artificial Intelligence

通用人工智能（AGI）

Artificial Intelligence

生成式AITop100展现全球竞争新格局，中国公司在移动应用领域更具优势

环球时报· 2025-09-05 06:45

全球AI应用竞争格局 - 中美主导全球AI应用市场美国在网页端领先中国在移动端更具优势[1] - 全球Top100消费级生成式AI应用榜单以流量为标准反映过去两年半竞争格局[1] - 市场向分散格局转变无单一公司能在所有平台占据主导地位[1] 中国企业表现 - 5家中国公司跻身网页端全球前20：DeepSeek第三夸克第九豆包第十二月之暗面Kimi第十七阿里巴巴通义千问第二十[2] - 移动端Top50榜单中中国应用占据22席豆包全球第四百度AI搜索第七 DeepSeek第八美图第九夸克第四十七[3] - 中国团队开发多款出口全球产品如DeepSeek、MinMax的Hailuo和快手的Kling[2] 细分领域优势 - 中国在图像视频类AI应用完成突围美图公司有5款产品上榜照片与视频类应用[2] - 中国视频模型比国外产品更具优势因拥有更庞大AI人才库和研究样本池[2] - 中国市场呈现多元化发展从图像编辑到生产力工具等细分领域[2] 技术发展趋势 - 移动平台成为AI用户主要使用方式影响技术力量平衡 Gemini在安卓设备大幅缩小与ChatGPT差距[3] - 生成式AI应用生态系统趋于稳定新进入者减少网页端仅11个新入围者移动端14个[3] - 全球AI生态逐步稳定从通用工具到专业场景各领域均出现有竞争力产品[5] 国家战略差异 - 美国投入数十亿美元追求通用人工智能(AGI) 中国专注"AI+"应用建立低成本高效率工具[5] - 中国企业产品化和市场化能力日趋成熟被海内外消费者广泛接受[4] - 韩国企业在资金实力及基础设施方面明显落后 Top100榜单无本土产品入围[5] 未来竞争展望 - 2025年可能成为转折点单一AI霸权时代让位于群雄逐鹿新格局[6] - 未来将出现多个势均力敌竞争者各自凭借独特生态系统整合和应用领域聚焦[6] - 谷歌、X、阿里巴巴为首的大厂竞争加速中国展示消费级AI领域巨大影响力[5]

通用人工智能（AGI）

Artificial Intelligence

通用人工智能（AGI）

Artificial Intelligence

2025年具身智能行业研究：跨领域融合引领的新一轮智能革命

头豹研究院· 2025-09-04 20:52

报告行业投资评级 - 报告未明确给出具体的行业投资评级 [1] 报告的核心观点 - 具身智能正从实验室转向商业化探索在各行业场景开启试点应用 [2] - 2025年全球具身智能已逐步从实验室走向场景落地但商用化进展低于预期 [4] - 未来五年具身智能在各场景落地将遵循"从简单到复杂"、"先专后通"原则 2030年前核心在工业专用场景 [4] - 技术挑战包括缺乏自主意图生成能力难以完成环境理解到任务执行的闭环真实数据量不足合成数据质量低软件生态割裂 [8][34] - 应用挑战包括市场需求模糊用户接受度低产品形态合理性限制场景适配性产业链条不完善 [8][39] 具身智能行业综述基本定义与关键特征 - 具身智能是人工智能与机器人学交叉的前沿领域核心在于通过物理实体与环境的动态交互实现智能行为 [13][17] - "本体+环境+智能"是具身智能的核心三要素本体是物理载体智能是算法模型和决策能力环境是交互的物理世界 [13][17] - 形成"感知-决策-行动-反馈"循环系统 [17] 具身智能 vs 离身智能 - 核心差异在于是否依赖物理载体与环境交互具身智能通过身体与物理世界实时交互离身智能依赖虚拟环境数据和算法 [19] - 具身智能优势：动态环境适应性强高泛化能力精准物理交互 [19] - 具身智能劣势：硬件成本高开发复杂度高能耗大 [19] - 离身智能优势：高效计算低成本部署跨领域通用性 [19] - 离身智能劣势：缺乏物理反馈场景局限性动态环境适应差 [19] 发展历程 - 1945年梅洛-庞蒂提出"身体是认知的主体"为具身认知理论奠定基础 [20] - 1950年图灵首次提出具身智能概念 [20] - 1977年吉布森提出"可供性"理论 [20] - 1986年罗德尼・布鲁克斯提出"包容架构" [20] - 1980年代末日本早稻田大学研发首个人形机器人WABOT-1 [20] - 1994年MIT启动Cog项目模拟人类婴儿认知发展 [20] - 2013年波士顿动力Atlas展示复杂物理环境适应性 [20] - 2016年谷歌DeepMind AlphaGo展示强化学习框架 [20] - 2018年OpenAI Dactyl项目展示具身学习潜力 [20] - 2022年ChatGPT推动具身智能向"认知-行动"一体化演进 [20] - 2023年中国工信部发布《人形机器人创新发展指导意见》 [20] - 2024年OpenAI与Figure合作推出Figure 01 [20] - 2025年中关村论坛发布"具身智能十五大重点方向" [20] 技术体系 - 演进趋势由分模块化AI算法整合向基于大模型的统一技术框架转型 [21][23] - 技术体系以"感知-决策-行动-反馈"四大核心模块构建闭环系统架构 [21][23] - 感知模块是多模态传感器实时采集环境数据 [23] - 决策模块基于感知信息进行任务规划和动态决策 [23] - 行动模块将决策结果转化为物理动作 [23] - 反馈模块构建闭环学习机制持续优化性能 [23] 核心技术层面 - 商业化落地本质是将认知智能与物理执行系统深度融合 [24] - 涉及算法演化数据来源和硬件演进三大层面 [24] - 算法层面：上层控制负责任务定义与行为决策下层控制负责操作执行与运动控制 [25][26][28] - 数据层面：真实数据依赖动作捕捉合成数据通过域随机化模拟网络视频数据补充长尾行为 [29] - 硬件层面：以SoC芯片为基础形成AI决策与实时控制的双层控制器架构 [25][26][28] 应用现状 - 工业制造案例：优必选Walker尝试物流分拣特斯拉Optimus尝试汽车总装线搬运 [32] - 工业制造挑战：效率低下（Walker搬运箱子需2-4分钟工人仅需1分钟）成本极高（单机价格40-60万元回收周期3-4年） [32] - 服务与零售案例：软银Pepper在商场引导松下"松松"在家电零售导购 [32] - 服务与零售挑战：交互生硬难以应对复杂需求短期内难以提升销售额 [32] - 医疗与养老案例：日本Robear协助老人移动傅利叶康复机器人帮助患者下肢康复 [32] - 医疗与养老挑战：高准入门槛需药监局审批成本高昂医保未纳入报销 [32] - 特种与高危案例：NASA Valkyrie用于太空任务波士顿动力Spot在核电站巡检 [32] - 特种与高危挑战：成本高应用限于高预算场景特种场景下故障难以现场维修 [32] 面临的挑战 - 算法层面：缺乏自主意图生成能力仍需人类智能介入 [35] - 算法层面：感知与行动存在"认知断层" 难以完成感知到任务执行的闭环 [35] - 数据层面：真实数据稀缺合成数据质量低数据标准化缺失 [36] - 软件层面：软件生态割裂开发工具链不完善 [37] - 硬件层面：硬件成本高能源效率低核心部件自主化不足 [39] - 商业层面：市场需求模糊用户接受度滞后 [40] - 产品层面：产品形态合理性影响性能和场景适配性 [41] - 产业链层面：产业链条不完善协同效率低下 [42] 国家层面相关政策 - 2025年政府工作报告首次将"具身智能"纳入未来产业培育体系 [44] - 2023年工信部《人形机器人创新发展指导意见》提出到2025年初步建立创新体系 [44] - 2023年工信部等十七部门《"机器人+"应用行动实施方案》推动机器人规模化应用 [44] - 2021年工信部等十五部门《"十四五"机器人产业发展规划》提出机器人产业营业收入年均增速超过20% [44] - 2021年工信部等八部门《"十四五"智能制造发展规划》提出到2025年70%规模以上制造业企业基本实现数字化网络化 [44] 地方层面相关政策 - 2025年上海浦东新区《具身智能产业支持16条政策》对关键技术攻关给予最高2000万元资金支持 [45] - 2025年浙江《关于支持人工智能创新发展的若干措施》建设具身智能产业基地 [45] - 2025年天津《天津市促进人工智能创新发展行动方案》推动人形机器人关键领域研究 [45] - 2025年重庆产业攻关项目需求征集包括具身智能领域 [45] - 2025年四川推动具身智能等技术交叉融合创新 [45] - 2025年江苏推动具身智能等新一代人工智能技术创新 [45] - 2025年河南建立未来产业投入增长机制聚焦具身智能 [45] - 2025年山东对年销售额突破5000万元的人形机器人企业给予最高800万元奖励 [45] - 2025年深圳计划新增培育估值过百亿企业10家以上营收超十亿企业20家以上 [45]

通用人工智能（AGI）

具身智能机器人

通用人工智能（AGI）

具身智能机器人

薛澜：AI治理并非创新对立面，需要回归全球合作

第一财经· 2025-09-04 11:40

人工智能治理的必要性与紧迫性 - 人工智能具有跨境传播特性和系统性风险治理不能局限于国家层面[1][6] - 当前存在认知误区认为治理会束缚技术创新这种观点低估了技术风险并忽视治理对技术发展的关键引导作用[1] - 人工智能在认知领域进展迅速部分模型在数学奥林匹克竞赛解题准确率已超越人类平均水平增强了AGI可行性预期和治理紧迫感[1] 人工智能治理的多维框架 - 治理是多维度、多工具、多主体参与的系统性过程旨在协调技术进步与社会价值[2] - 伦理与价值维度关注安全可控性、透明可解释性、公平非歧视性和责任可追溯性中国2019年提出"负责任人工智能"八项准则欧盟和OECD发布多套伦理框架[3] - 政策支持维度通过财政投入、研发资助和基础设施建设提供制度土壤中国2017年《新一代人工智能发展规划》采用"三步走"战略推动产业发展[3] - 规制与标准维度包括法律法规、技术标准和分级管理欧盟《人工智能法案》将AI系统分为四类实施差异化监管[4] 全球人工智能治理核心挑战 - 技术路径差异导致治理分化各国对风险认知存在本质分歧例如国产大模型DeepSeek在中文语义建构方面突破显著引发是否需与国外模型采用同等评估标准的争议[7] - 治理节奏与技术发展错配 AI技术呈指数级演进而治理体系滞后 GPT-4发布半年内多款对标模型上线但多数国家监管机制仍未落地[8] - 全球治理机制复合体缺乏协调联合国教科文组织、OECD、欧盟和世界经济论坛等机制存在目标重叠和规则冲突导致治理效能低下和合规困境[9] - 地缘政治因素形成合作壁垒 AGI研发演变为少数国家主导的竞赛型项目全球协同开发与风险共担路径难以实现[10] 人工智能治理的未来方向 - 治理需具备合作性、包容性和合法性否则将加剧跨境风险、智能鸿沟和信任危机[11] - 治理是与技术共同进化的制度生态工程需同步协调安全风险管控、社会结构塑形和市场机制构造三大任务[11]

人工智能治理

通用人工智能（AGI）

人工智能治理

通用人工智能（AGI）

早鸟优惠即将截止！3个月搞透具身大脑+小脑算法

具身智能之心· 2025-09-04 09:04

具身智能行业概述 - 具身智能强调智能体与物理环境的交互与适应聚焦智能体在物理世界中感知环境理解任务执行动作并反馈学习的能力 [1] - 大脑负责思考感知主导语义理解和任务规划小脑负责执行高精度的运动执行 [1] 国内外产业布局 - 近2年具身明星团队陆续创业成立星海图银河通用逐际动力等公司推动具身本体和大小脑技术进步 [3] - 华为2024年底启动全球具身智能产业创新中心与乐聚机器人大族机器人等企业合作建设具身智能大脑小脑等关键技术 [5] - 京东自2025年5月以来连续投资智元机器人千寻智能逐际动力等多家公司强化物流科技与家庭服务场景效率与服务能力 [5] - 腾讯蚂蚁集团小米等科技巨头积极通过战略投资与合作布局加快构建具身智能产业生态 [5] - 国外Tesla/Figure AI在工业与物流机器人应用上持续推进美国投资机构积极支持Wayve Apptronik等公司落地自动驾驶与仓储机器人 [5] - 国内企业以产业链投资与综合平台驱动具身智能落地国外科技巨头侧重基础模型模拟环境与类人机器人原型研发 [5] 技术演进阶段 - 第一阶段技术研究聚焦抓取位姿检测通过点云或图像预测末端执行器姿态实现静态物体抓取但缺乏任务上下文和动作序列建模 [6] - 第二阶段进入行为克隆阶段机器人借助专家演示数据学习从感知到控制的端到端映射具备模仿人类完成复杂任务能力 [6] - 第三阶段2023年兴起Diffusion Policy方法通过扩散模型生成整个动作轨迹提升策略稳定性与泛化能力 [6] - 2024年进入Vision-Language-Action模型阶段融合视觉感知语言理解与动作生成模块支持零样本或小样本快速泛化 [7] - 第四阶段2025年探索VLA模型与强化学习世界模型触觉感知等模块融合弥补当前VLA模型局限 [9] - VLA+强化学习提升机器人在长时任务中的试错能力与自我改进能力 [11] - VLA+世界模型引入环境动态预测使机器人具备想象未来的能力 [11] - VLA+触觉信息拓展从看到看+触多模态融合的具身感知边界 [12] - 技术演进从低层感知到中层策略再到高层理解逐步迈向通用任务和开放环境的智能体时代 [14] 应用与产品落地 - 技术发展造就人形机器人机械臂四足机器人等产品落地服务于工业家居餐饮医疗康复等领域 [14] - 相关产品和融资络绎不绝岗位呈现爆发式增长 [14] 工程与系统能力需求 - 具身智能从论文走向部署对工程能力提出更高要求 [17] - 需在Mujoco IsaacGym Pybullet等平台完成策略训练与仿真测试 [17] - 需训练并部署Diffusion Policy VLA 力触融合的VLA模型 [17] - 需实现强化学习在VLA后训练上的应用支持机器人反馈微调 [17] - 需实现从世界建模预测到策略学习到物理执行的一体化具身智能架构 [17]

通用人工智能（AGI）

具身大脑+小脑算法课程

人形机器人

通用人工智能（AGI）

具身大脑+小脑算法课程

人形机器人

字节Seed部门豪掷百万期权，力挽大模型人才“留守”潮

搜狐财经· 2025-09-04 05:06

公司期权激励计划 - 字节跳动对Seed部门实施期权增发计划主要覆盖大模型技术研发的核心技术人员[1] - 根据员工绩效和职级不同每月发放9万至13万字节期权计划持续18个月[1] - 期权计算价格定为每股189.9美元低于最新期权回购价格200美元[3] 部门战略定位 - Seed部门成立于2023年是公司通用人工智能（AGI）战略的关键组成部分[3] - 部门主导研发豆包大模型内部设立代号"Seed Edge"的AGI研究团队[3] - 部门已启动独立期权激励机制以远低于市场预期的估值向核心员工发放期权[3] 行业影响与内部反应 - 高强度内部激励措施旨在稳固核心人才加强大模型技术领域竞争壁垒[3] - 内部员工在平台上表示羡慕称Seed部门已成为公司内部"明星部门"[3] - 业内人士认为期权发放使同行公司在挖角时面临更大难度[3]

通用人工智能（AGI）

大模型技术

豆包大模型

通用人工智能（AGI）

大模型技术

豆包大模型

通往AGI的快车道？大模型驱动的具身智能革命 | Jinqiu Select

锦秋集· 2025-09-01 23:29

具身智能与大模型融合综述文章核心观点 - 具身智能被视为实现通用人工智能（AGI）的关键路径，通过"感知-决策-行动"闭环在真实世界中学习并执行复杂任务 [1] - 大模型（如LLM、LVM、LVLM、MLM、VLA）在多模态推理与生成能力上的突破，显著推动了具身智能的演进 [1][7][25] - 世界模型为智能体提供内部环境模拟能力，支持在虚拟空间中演练与优化策略 [1][2][116] - 分层决策与端到端决策成为自主决策的两大核心范式，分别适用于结构化环境与开放动态环境 [6][55][74] Embodied AI系统构成与运行流程 - 系统由物理实体（如人形机器人、智能车辆）和智能体（认知核心）构成，物理实体负责执行动作并接收反馈 [4] - 运行流程包括：从语言指令解读人类意图→主动探索环境→感知多模态元素→执行动作，模仿人类学习范式 [4] - 智能体通过模仿学习从人类演示或视频数据获取技能，通过强化学习整合外部反馈优化策略 [4] 具身智能核心：决策与学习 - 自主决策通过分层范式（分离感知、规划、执行模块）或端到端范式（统一框架集成功能）实现 [6] - 具身学习通过模仿学习（从演示获取技能）和强化学习（迭代优化提升技能）实现持续改进 [6] - 世界模型通过模拟真实世界推理空间，为智能体提供试验和经验积累机会 [6][116] 主流大型模型概览 - Large Language Model (LLM)：包括BERT（2018年）、GPT系列（GPT-3参数量达1750亿）、PaLM等，突破zero-shot/few-shot学习能力 [9][10] - Large Vision Model (LVM)：ViT将Transformer应用于计算机视觉，DINOv2通过自监督学习提升图像表示质量，SAM支持1100万图像预训练的分割任务 [11] - Large Vision Language Model (LVLM)：CLIP通过图文对比学习对齐特征，BLIP-2引入QFormer实现跨模态融合，GPT-4V具备强大多模态推理能力 [12][13] - Multimodal Large Model (MLM)：Gemini高效处理文本/图像/音频，DALL·E3通过增强文本编码器改善图像-提示对齐，Sora可生成60秒高质量视频 [14][15] - Vision-Language-Action Model (VLA)：RT-2将动作空间离散化为256区间，开源模型（如Octo、TinyVLA）提升计算效率与泛化能力 [16][71] 大型模型通用能力增强技术 - In-Context Learning (ICL)：通过精心设计提示实现zero-shot泛化，无需额外训练 [19] - X of Thoughts (XoT)：CoT融入中间推理步骤，ToT探索多推理路径，GoT采用图结构实现非线性推理 [20] - Retrieval Augmented Generation (RAG)：从外部知识库检索信息，确保响应准确性 [21] - Reinforcement Learning from Human Feedback (RLHF)：整合人类偏好优化模型输出 [23] - Model Context Protocol (MCP)：提供标准化接口增强模型与外部系统互操作性 [24] 分层自主决策 - 高层规划分为三类：基于结构化语言（LLM生成PDDL或直接作为规划器）、基于自然语言（LLM分解计划）、基于编程语言（指令转可执行代码） [31][33][38] - 底层执行通过传统控制算法（PID、MPC）、LLM驱动学习控制（模仿学习+强化学习）、模块化控制（调用预训练模型如CLIP/SAM）实现 [42][43][45] - 反馈机制包括：大模型自我反思（Re-Prompting重新生成计划）、人类反馈（交互式纠正）、环境反馈（多模态输入转化为语言调整计划） [49][52][54] 端到端自主决策 - VLA模型集成感知、语言理解、规划、动作执行与反馈优化，包含token化与表示、多模态信息融合、动作去token化三个组件 [58][60][62] - RT-2利用ViT进行视觉处理，PaLM集成多模态信息，动作空间离散化为8维度（含256区间） [63] - VLA增强方向：感知能力增强（BYO-VLA滤除视觉噪声）、轨迹动作优化（Octo结合扩散模型）、训练成本降低（π0利用流匹配提升实时性能） [65][70][71] 分层与端到端决策对比 - 分层架构优势：高可解释性、易集成领域知识、模块化设计；劣势：模块协调可能导致次优解、适应性受限 [74] - 端到端架构优势：最小化误差累积、强泛化能力、高效复杂任务处理；劣势：黑箱性质、高计算成本、依赖训练数据 [75] Embodied Learning方法 - 模仿学习：通过最小化专家动作负对数似然学习策略，依赖高质量演示数据 [83][84] - 强化学习：最大化长期累积奖励，PPO/SAC等算法提升稳定性，但需海量探索 [87][89] - 迁移学习：通过KL散度约束迁移源任务策略至目标任务，加速学习但需避免负迁移 [90][91] - 元学习：MAML框架通过少量样本快速适应新任务，但需多样任务预训练数据 [93][94] 大模型赋能的模仿学习 - Diffusion models增强策略：Diffusion Policy通过U-Net生成动作序列，3D-Diffusion利用3D输入提升空间感知 [100][101] - Transformer架构策略：RT-1结合大规模数据集提升泛化，ALOHA实现低成本硬件精确操作，RoboCat实现跨任务快速泛化 [102][103] 大模型赋能的强化学习 - 奖励函数设计：Text2Reward生成可解释Python代码，Eureka利用GPT-4实现全自动优化 [109] - 策略网络构建：Diffusion-QL增强多模态动作分布，Decision Transformer将问题重构为序列建模，LLM（如GLAM）直接生成动作序列 [113][114][115] 世界模型设计与应用 - 设计类型：隐空间世界模型（RSSM）、基于Transformer（IRIS/Genie）、基于扩散（Sora/UniPi）、联合嵌入预测架构（JEPA） [119][122][125][128] - 决策应用：模拟验证（NeBula构建概率信念空间）、知识增强（WKM提供全局先验知识） [133][134] - 具身学习应用：基于模型的强化学习通过模拟状态转换和生成数据提升学习效率 [135]

通用人工智能（AGI）

分层自主决策

端到端自主决策

通用人工智能（AGI）

分层自主决策

端到端自主决策

23岁天才被OpenAI解雇后，又凭AI狂揽15亿美元

36氪· 2025-09-01 17:09

公司概况 - 23岁创始人利奥波德·阿申布雷纳从OpenAI研究员转型为AI对冲基金创始人其基金管理资产规模突破15亿美元[1][3] - 基金采用多空策略做多受益AI发展的半导体基础设施和电力公司同时做空可能被技术淘汰的传统行业[1][5] - 基金2025年上半年扣除管理费后收益率达47% 远超同期标普500指数6%涨幅和科技对冲基金指数7%的平均回报[5] 投资策略 - 投资组合覆盖全球AI相关股票及Anthropic等明星初创企业持仓集中度较高[5][9] - 电力供应商Vistra因向AI数据中心供电同时成为该基金和VAR Advisors的前三大重仓股[9] - 多数投资者同意将资金锁定数年这在对冲基金行业相当罕见[7] 行业动态 - AI对冲基金成为资本新焦点 VAR Advisors基金3月推出后快速积累约10亿美元资产[8] - 老牌对冲基金Point72抽调基金经理成立Turion基金规模突破20亿美元截至7月底年内回报率达11%[8] - 投资向一级市场延伸 Atreides与Valor Equity Partners合作推出创投基金已从阿曼主权财富基金等机构募集数亿美元[10] 技术观点 - 创始人165页论文《Situational Awareness》预言2027年将实现通用人工智能[3][12] - 论证基于GPT模型有效计算量增长曲线算力年增长约0.5个数量级算法效率年提升近0.5个数量级[12][14] - 预测AI模型到2027年将能胜任AI研究员或工程师工作具备参与自身演进的能力[19]

通用人工智能（AGI）

情境感知能力

通用人工智能（AGI）

情境感知能力

AI治理，需要多元工具协同应用

经济网· 2025-09-01 17:01

人工智能治理认知误区 - 存在认为人工智能治理过早束缚技术创新的典型认知误区低估技术社会风险和治理机制引导作用[1] - 治理并非创新对立面而是实现人工智能健康有序可持续发展不可或缺的制度性支撑[1] 人工智能技术进展 - 人工智能在人类认知领域进展惊人数学奥林匹克竞赛解题准确率部分超越人类平均水平[1] - 技术跃升增强通用人工智能可行性预期加强社会各界治理紧迫感[1] 人工智能治理框架维度 - 伦理与价值维度关注安全可控性透明可解释性公平非歧视性和责任可追溯性等基本原则[3] - 中国2019年提出"负责任人工智能"八项治理准则欧盟OECD等发布多套伦理框架[3] - 政策支持与市场激励维度通过财政投入研发资助反垄断等手段维护创新生态多样性[4] - 中国2017年《新一代人工智能发展规划》采用三步走战略推动产业发展[5] - 规制与标准维度包括法律法规技术标准分级管理等欧盟人工智能法案采用四类风险分级监管[5] 全球人工智能治理挑战 - 技术路径不同导致治理差异化各国对风险治理认识存在本质分歧[6] - 国产大模型DeepSeek2024年初引发中文语料特殊保护机制等治理工具适配问题[6] - 治理节奏与技术发展错配监管政策制定周期性与技术迭代速度难以同步[7] - GPT-4发布半年内多款对标模型上线但多数国家大模型法律分类仍未落地[7] - 全球治理机制复合体缺乏协调联合国教科文组织 OECD 欧盟等机制存在目标重叠和冲突[8] - 机制复合体导致治理效能低话语权失衡和合规困境等现实难题[9] - 地缘政治因素形成合作壁垒 AGI研发演变为少数国家主导的竞赛型项目[10] - 缺乏合作性难以应对跨境风险缺乏包容性加剧智能鸿沟缺乏合法性削弱公众信任[10] 人工智能治理定位 - 治理是与技术共同进化的制度生态构建工程需同步协调安全风险管控社会结构塑形和市场机制构造[10]

人工智能治理

通用人工智能（AGI）

人工智能治理

通用人工智能（AGI）