核心观点 - Reality Proxy是一种新型混合现实交互技术,通过数字替身实现现实物体的抽象操控,突破传统XR设备在物体选择上的物理限制[10][13][14] - 该技术采用三级流程(激活/生成/交互代理)实现自然交互,支持7种创新功能如多对象刷选、语义分组等,显著提升操作效率[17][19][30][31][32][33][36][38] - 在办公、建筑导航、无人机控制等场景验证中,系统展现出解决远距离/密集物体交互痛点的能力,用户评估显示其易用性和实用性突出[41][45][47][51][53][54] 技术原理 - 通过头戴设备捕获场景层级结构,将真实物体抽象为固定大小的3D矩形代理,保留空间关系[14][17][19][20][22] - 采用"延迟跟随"机制将代理锚定在手部附近,减少视觉搜索负担,通过双重高亮反馈保持现实世界关注[24][25][26][28][29] - 代理选择精度不受物体实际尺寸影响,支持标准手势操作(捏合/缩放/滑动等)实现精准控制[21][22][31][34] 交互功能 - 浏览预览:滑动代理快速查看多物体信息(如书籍内容)[30] - 批量操作:双手划定区域选中多个代理对应物体[31] - 属性筛选:长按代理调出属性面板实现分类选择(如红色杯子)[32] - 物理交互:利用桌面等表面转换为自然触摸板实现拖动/缩放选择[33][34] - 智能分组:双击代理语义归类或自定义立方体容器进行整体操作[36][38] 应用场景 - 办公场景:快速检索书籍并计算总价[41] - 建筑导航:在大型空间中实现层级结构浏览(整栋楼→单层房间)[38][45] - 无人机控制:通过嵌入跟踪器实现多无人机动态操控[47][48] - 厨房交互:支持不同粒度物体操作(如微波炉部件)[43] 团队背景 - Xiaoan Liu:Fusion Reality创始人,清华大学研究助理,谷歌前员工,专注XR设备与交互技术研究[57][58][62] - Mar Gonzalez-Franco:微软EPIC团队前首席研究员,创立沉浸式技术实验室,Traity公司A轮融资470万美元[64] - Xianhao Carton Liu:明尼苏达大学计算机博士,斯坦福/哈佛研究实习生,图灵班人工智能荣誉学士[66] - Chen Zhu-Tian:明尼苏达大学助理教授,香港科技大学博士,研究方向为人机交互[68]
AI眼镜“隔空取物”,戴上即可随心选中现实世界任意物体
具身智能之心·2025-08-09 08:48