物理智能

搜索文档
Jinqiu Select | Physical Intelligence 联创:AI训练的真实数据不可替代
锦秋集· 2025-07-22 23:04
核心观点 - 过度依赖替代数据源会严重限制AI模型的最终能力 真正的技术突破必须建立在真实数据基础之上 [1] - 当前AI研究面临"勺叉困境":试图用模拟器 人类视频或手持设备等廉价替代方案训练机器人 结果导致模型在真实场景中表现不佳 [1][3] - 机器学习的铁律是训练数据必须与测试条件相匹配 替代数据无法完全替代真实数据在物理世界中的实践 [10] 权宜之计的替代方案 - **模拟训练**:通过sim-to-real方法在模拟环境中训练机器人 但最佳模拟往往不是精确复现现实 而是编码机器人需要应对的各种变化 [3] - **人类视频学习**:需定义人机对应关系 但需弥合人类动作与机器人动作在动力学和外观上的差异 [3] - **手持夹爪设备**:让人们使用模仿机器人夹爪的设备收集数据 但仍受限于设备的工作空间和运动学差异 [3] 替代方案的局限性 - 替代数据将模型限制在三个条件的交集中:系统有效行为 能用替代方法实现的行为 不会暴露领域差异的行为 [4] - 模型越强大 越能区分替代数据与真实数据 导致交集缩小 任何扩大交集的尝试都会削弱模型能力 [6] - 替代数据优化针对特定场景 无法保证在新场景下的匹配度 模型的泛化能力反而成为推广到新场景时的累赘 [7] 真实数据的重要性 - 构建机器人基础模型必须依赖真实数据 才能实现像LLM和VLM在虚拟世界中的广泛泛化能力 [11] - 替代数据应作为辅助知识源 用于了解"世界可能发生什么" 而非"智能体该怎么做"的直接指令 [12] - 在大量真实机器人经验基础上 加入人类数据或模拟数据等多样化来源 比完全回避真实数据更有效 [11] 勺叉现象的普遍性 - "勺叉"现象不仅存在于数据替代方案 还包括混合系统 手工约束学习系统等方法 都试图用人工设计应对训练不充分问题 [13] - 手工设计的归纳偏置会成为性能瓶颈 违背机器学习通过数据驱动获取能力的核心优势 [13]
一亿美金种子轮,刷新硅谷具身智能融资记录!周衔、许臻佳、李旻辰等华人合伙创业
机器之心· 2025-07-02 08:54
核心观点 - AI将完成人类所有工作,带来巨大挑战和机遇 [2] - AI在脑力劳动和体力劳动发展不均衡,具身智能是解决方向 [3][4] - Genesis AI完成1.05亿美元种子轮融资,创硅谷具身智能赛道纪录 [5][6] - 公司目标是实现体力劳动自动化,打造物理智能基础模型 [35][40] 公司概况 - 创始团队来自Mistral AI、英伟达、谷歌、苹果及CMU、MIT等顶尖机构 [12] - 团队由年轻博士组成,横跨物理模拟、图形学、机器人技术等领域 [14][32] - 核心成员包括CEO周衔(CMU机器人学博士)、Théophile Gervet(Mistral多模态模型负责人)、许臻佳(斯坦福UMI机器人项目共同一作)等 [16][18][20] - 工程团队包括苹果、谷歌、英伟达等公司的技术专家 [33] 技术方向 - 基于开源项目Genesis(生成式物理引擎,GitHub 25.4k stars)开发 [8][9] - 打造通用数据引擎,整合物理模拟、多模态AI和真实机器人数据 [37] - 采用合成数据+真实数据的双引擎模式,突破数据壁垒 [39] - 不押注单一技术路线,追求仿真与现实数据闭环 [38] 融资与规划 - 种子轮融资1.05亿美元,由Khosla Ventures、Eclipse领投,红杉中国等跟投 [5][6] - 计划组建高人才密度团队,实现物理智能突破 [35] - 下一个里程碑预计2024年底发布 [42]
中科院院士郑海荣:马斯克的脑机接口方案“太落后了”
经济观察报· 2025-07-01 19:30
脑机接口技术路径 - 行业更应关注无需手术的"无创"脑机接口技术,而非侵入式或介入式方案 [1][2] - 侵入式方案面临生物相容性挑战,Neuralink患者85%电极因"回缩"失效 [6] - 介入式方案如Synchron和Precision Neuroscience取得阶段性进展,但本质仍是"置入"传感器 [7][8] 技术发展现状与趋势 - 全球脑机接口市场规模预计从2023年23.5亿美元增至2033年108.9亿美元 [5] - Neuralink已实现患者通过意识控制机械臂玩"石头剪刀布"及操作CAD软件 [5] - Synchron与苹果达成BCI HID协议实现设备原生集成,英伟达合作开发"Chiral"认知AI基础模型 [8] 无创技术研究进展 - 通过超声波、fMRI等外部手段实现大脑信息"读取"和"写入",避免破坏颅骨屏障 [9] - 国家自然科学基金项目已用超声波控制老鼠神经元放电,精准调控记忆和行为 [10] - 利用高分辨率成像观察血流动态,结合AI反推神经活动以解码大脑意图 [10] AI与脑机接口融合 - AI发展将经历数据智能、物理智能、生物智能三阶段,脑机接口是实现终极形态的关键 [12][13] - 生物智能需人类大脑直接控制,确保技术发展方向有益人类 [13] - 未来医疗将整合基因、影像等数据构建"数字孪生体",实现疾病精准预测 [13] 行业应用前景 - 教育领域可能因知识"写入"技术颠覆传统死记硬背模式 [14] - 医疗体系将转型为AI深度赋能的数据整合中心,取代传统科室结构 [13] - 技术成熟仍需20-30年,需建立强监管规则防范伦理风险 [14][17]
比李飞飞提出“空间智能”更早!杭州这家企业正在打通机器人产业化落地最后一公里
机器人大讲堂· 2025-06-11 18:31
人工智能新概念 - 智澄AI创始人胡鲁辉首次提出"物理智能"概念,强调通过实时感知物理世界动态并构建可交互的世界模型,解决传统机器人泛化能力弱等问题,实现跨任务自主决策 [1] - 斯坦福李飞飞团队提出"空间智能"概念,侧重空间关系理解与视觉任务应用,但"物理智能"在覆盖范围和应用深度上更具前瞻性 [1] 行业融资动态 - 2024年中国新增70+具身智能企业,头部企业智元机器人完成超6亿元融资,宇树科技获数亿美元B2轮融资 [2] - 智澄AI成立于2024年3月,专注大模型通用人工智能机器人研发,目标打造理解物理世界的计算平台 [4] 公司技术实力 - 创始人胡鲁辉拥有微软、亚马逊等科技巨头高管经历,持有30余项美国专利,团队来自国际顶尖企业及高校 [6] - 自研TR系列机器人已迭代至第四代,TR4具备生化实验精准滴液能力,TR5双足人形机器人即将发布 [6][7][8] 产品形态策略 - 反对盲目追求双足形态,主张根据场景需求设计机器人结构,如TR2双臂机器人在家务操作中效率媲美人形机器人 [9][10] - 已开发TR2双臂、TR4复合人形等多形态产品,核心聚焦物理世界认知能力而非单一形态 [10] 技术突破方向 - 通过本体材料优化(如TR4稳定结构)、算法融合(强化学习+模仿学习)及数据平台构建,提升机器人泛化能力 [13] - 建立真实场景数据采集体系,支持机器人快速掌握新技能 [13] 商业化优势 - 全栈自研能力+工程化经验使公司能快速实现技术转化,已获客户订单进入小批量交付阶段 [14][17] - 相比学术机构的基础研究,公司更擅长"从1到N"的产业化落地,资金储备保障研发自主性 [17] 行业政策展望 - 2025年为人形机器人产业化关键年,政策目标包括建立创新体系及批量生产 [18] - 物理智能被视为推动落地的核心要素,需突破空间认知与泛化作业能力 [19]
产学界大咖共议人工智能:通用人工智能将在15至20年后实现
北京日报客户端· 2025-05-18 19:28
通用人工智能发展前景 - 具备泛化能力与通识能力的通用人工智能有望在15至20年后出现 [1] - 通用人工智能需具备与人类相当或更高水平的综合智能 能自主感知环境 学习新技能 跨领域解决问题并遵循人类伦理 [1] - 2024-2025年AI进展进入快车道 具身智能呈现百花齐放态势 [1] 通用人工智能实现路径 - 实现通用人工智能需突破信息智能 物理智能和生物智能三大难点 [3] - 信息智能(语言 文字 语音 视频)需4-5年达人类水平 5年左右达通用AGI标准 [3] - 物理智能(无人驾驶 机器人等)需至少10年实现 [3] - 生物智能(脑机接口等)需15-20年实现 需多学科领域突破 [3] - 三种智能将并行发展 相辅相成 [3] 人工智能大模型发展 - 2025年AI发展呈现多模态和GDP相关行业应用两大特点 [4] - 中国在推动AI落地方面具有显著优势 [4] - 大模型生命周期包括数据获取 预处理 模型训练 微调和推理五个环节 [5] - 前三个环节需大量算力和存储资源 通常由顶尖科技公司完成 [5] - 一般单位只需基于已有基础模型进行领域适配的微调和推理应用 [5] 人机关系与机器人发展 - AI智商水平可能已超过人类 但仍是人类认知与能力的延伸 [5] - 人类直觉具有不可替代性 [5] - 人形机器人发展关键是创造实际价值 [5] - 人形机器人走向成熟需较长周期 当前行业处于探索阶段 [5]
五年内,AI能证明人类没有证明的猜想吗?张亚勤和丘成桐打了个赌
第一财经· 2025-05-17 21:05
AI在科研与工程中的应用现状 - 微软软件工程师已有90%代码由AI生成,显示AI在编程领域的高渗透率 [1] - AI当前在结构化任务(如棋类、编码、语言处理)表现超越人类,但在模糊概念理解(如量子力学)仍存短板 [2] - 猎豹移动认为AI在语言认知推理层面无显著短板,但物理层面的真正理解需更长时间突破 [2] AI的科学发展潜力与挑战 - 张亚勤预测AI五年内将证明人类未解数学猜想(如黎曼猜想),十年内可能发明新公式 [1] - 清华大学教授提出AI需在零人类知识积累下实现从0到1创新,才是真正智能诞生的标志 [2] - 当前大模型参数规模与人类大脑(860亿神经元/百万亿突触)仍差100倍,能效比显著落后(20瓦 vs 超高算力需求) [3] AGI发展时间表 - 信息智能(语言/视频处理)预计五年内达到人类水平,实现通用AGI [4] - 物理智能(无人驾驶/人形机器人)需至少十年发展周期 [4] - 生物智能(脑机接口)是最难突破领域,预计需15-20年实现人机生命体融合 [4] 技术路径差异 - 人类大脑具备高效记忆系统(海马体短期/皮层长期记忆),AI记忆机制仍逊色 [3] - AI优势在于智能可复制迭代(如自动驾驶),人类教育过程则需长期投入 [3] - 通用人工智能需满足三大标准:泛化能力、持续进化能力、超越多数人类任务表现,预计需15-20年达成 [3]
张亚勤:后ChatGPT时代,中国人工智能产业的机遇、5大发展方向与3个预测
36氪· 2025-05-16 12:27
ChatGPT的技术突破与行业影响 - ChatGPT成为历史上最快突破1亿用户的科技应用,两个月内实现这一里程碑 [3] - ChatGPT基于GPT-3.5优化,语言能力显著超越GPT-3,首次通过图灵测试 [1][4] - 生成式AI领域出现技术质变,ChatGPT标志着AI从垂直工具向通用智能体的跃升 [4][6] 大模型驱动的IT行业结构重塑 - 新IT架构分为四层:算力基石层、IaaS层、基础模型层(MaaS)、垂直模型层(VFM)+SaaS层 [9] - 垂直基础模型层和SaaS层是创新风口,边缘计算领域存在大量机会 [11] - 企业可通过精调训练(Fine Tuning)和提示工程(Prompt Engineering)降低开发成本 [12] 中国AI产业的发展机遇 - 中文大模型需多语种训练数据,非中文数据不会成为瓶颈 [15][16] - 国内技术差距集中在高端芯片、算法系统和平台级技术,但追赶潜力大 [17] - 垂直领域(如医疗、边缘智能)是主要机会点,"百模大战"加速市场活力 [18][19] AI大模型的五大发展方向 - 多模态智能:整合文字、图像、视频、生物信息等跨模态数据 [32] - 边缘智能:部署轻量化模型到终端设备,实现低延时处理 [33] - 物理智能与生物智能:推动自动驾驶、机器人及医疗领域突破 [33] 生成式AI的未来技术路线 - 基础大模型+垂直模型+边缘模型构成技术底座,生态规模将超移动互联网10倍 [34] - 统一标识(Tokenisation)和规模定律(Scaling Law)是核心要素 [34] - 5年内可能在Transformer等主流框架外出现颠覆性新技术 [34][35]
Science正刊 用一根软管造就史上最简单的软机器人!
机器人圈· 2025-05-13 18:44
软体机器人创新设计 - 受自然界动物运动机制启发,开发出无需中央处理器控制的软体机器人,通过神经系统、身体结构与环境的协作实现自主运动 [2] - 荷兰研究团队开发的自振荡肢体系统在恒定气流驱动下能以300赫兹频率自主踏步,运动速度比现有机器人快几个数量级 [3] - 该系统通过物理交互展现智能行为,包括自主避障、水陆步态切换和趋光性,为高效能自主机器人开辟新途径 [3] 自振荡肢体技术 - 设计灵感来源于喷水软管振荡和充气跳舞人,使用硅胶软管在3D打印支架中形成自动抖动肢体 [5] - 注入恒定气流后软管每秒摆动100次,呈现"踩地-抬脚"周期性动作,无需控制电路 [5] - 通过追踪折点变化发现四个关键阶段,形成自我维持的振荡机制,可通过调节进气量控制频率 [7] 多肢体协同运动 - 通过改变连接管长度实现两种步态:短管同步运动、长管交替前进 [10] - 四肢软体机器人在28升/分钟气流驱动下速度达每秒1.1米,呈现瞪羚式跳跃步态 [10] - 重新设计的"充气袋"式软肢仅需0.1升/分钟气流,无线机器人总重77克,速度每秒18厘米 [13] 环境适应能力 - 机器人能根据环境自动改变运动模式:陆地同步、水中交替步态 [15] - 遇到障碍物时能自动调整方向逃脱,加装光敏电阻后具备趋光性,可追随光源前进 [15] - 通过与环境的物理交互实现自发同步运动,在不同地面保持节奏一致 [13] 设计理念创新 - 通过身体结构和环境互动模糊传统"驱动-控制-感知"边界,实现运动、决策和反馈一体化 [19] - "高度耦合、结构驱动"的设计理念可能成为软体机器人发展新方向 [19]