Workflow
人机交互
icon
搜索文档
机器人读博士“能武”更要“能文”
证券时报· 2025-07-30 02:50
机器人博士生的出现 - 全国首个机器人博士生"学霸01"被上海戏剧学院录取为戏剧与影视专业全日制博士新生,将进行四年学术生涯 [1] - "学霸01"前身是机器人马拉松赛事季军"行者二号",具备运动控制、传感技术等能力 [1] - 机器人读博士的目的是培养其理解人类、场景和艺术专业的能力,利用表演课程数据提升"理解人"的能力 [1] 机器人产业新命题 - 未来机器人不仅需要"能动"更要"能懂",增强对人类行为的理解能力是关键 [2] - "懂人"的机器人可在零售领域分析顾客行为推荐产品,在养老领域判断老人需求,在教育领域实现个性化教学 [2] - 当前工业制造是机器人主要应用场景,但行业终将从"机械性能突破期"走向"人机交互跃升期" [2] 机器人行业发展路径 - 解决精密运动控制技术难题是当前重点,工业制造将率先大规模应用机器人 [2] - 未来运动控制突破后,对人类理解能力将成为限制机器人应用的新瓶颈 [2] - 提前进行"理解人"的研究和训练是为行业未来增长储备动能 [2]
阿里曝光自研AI眼镜 AI To C战略攻入硬件领域
中国经营报· 2025-07-27 12:46
阿里巴巴AI眼镜发布 - 公司在2025世界人工智能大会首次曝光"夸克AI眼镜",预计年内发布,标志着其AI To C战略正式进入硬件领域 [1] - 产品由夸克团队研发,深度整合阿里巴巴生态系统,包括通义千问大模型、高德导航、支付宝支付、淘宝比价和飞猪商旅提醒等功能 [1][5][6] - 产品在硬件结构上进行了系统重构,具备通话、音乐、翻译、会议纪要等功能,并在AI交互、佩戴舒适度、显示与影像、续航等方面实现突破 [6][7] 行业竞争格局 - 中国智能眼镜市场已聚集消费电子巨头、互联网大厂、专业AR厂商与跨界新势力等多方竞争者 [2] - 高盛预测中国智能眼镜市场2025年将达到290万副,小米AI眼镜预计占据10%市场份额,产品定价为1999元/副 [8] - 行业仍处于初期阶段,面临产品不够智能、续航短、不够舒适美观等用户体验问题 [7] 公司战略布局 - 公司认为AI眼镜将成为继智能手机之后最重要的个人移动入口,能捕获80%以上人体感知输入,覆盖办公、生活及移动场景 [2] - 公司通过"自有生态构建+行业合作"模式,联合高德、支付宝、淘宝、飞猪等内部资源构建垂直场景AI能力矩阵 [5][6] - 公司将联合全球领先眼镜品牌,通过技术、渠道、服务及C2M定制能力整合解决用户体验瓶颈 [7] 技术应用场景 - 产品实现近眼显示导航系统,支持骑行、步行等移动场景精准指引 [6] - 通过多模态大模型结合百亿级图片检索能力,提升图像问答的识别率和准确性,支持快问快答和专业讲解 [6] - 此前公司已在Vision Pro平台推出三维空间互动购物应用,支持虚拟试车、眼动追踪、手势旋转和AI搭配方案生成 [3]
Meta发布“意念操控”腕带,研究登Nature,要抢马斯克生意?
36氪· 2025-07-26 10:15
技术突破 - 推出基于表面肌电图(sEMG)的通用型非侵入性神经运动接口,以腕带形式呈现,无需侵入性手术即可精准捕捉手腕神经信号,识别点击、滑动和捏合等多种手势意图[1] - 摆脱对键盘、鼠标、触摸屏等传统输入设备的依赖,且不受动作遮挡影响,相比侵入性脑机接口无需定制解码器,可在不同人群中通用化应用[3] - 基于300多名受试者提供的超过100小时肌电数据,开发出高度适应性的机器学习模型,无需个人校准即可实现高精度手势识别,少量个性化数据可使笔迹识别准确率提升16%[3] 硬件与模型设计 - 研发高灵敏度sEMG腕带(sEMG-RD),采用干电极、多通道记录设计,采样率达2kHz,噪音低至2.46μVrms,续航超4小时,四种尺寸适配不同腕围[4] - 优化电极布局以精准捕捉手腕、手部和前臂肌肉电信号,可检测单个运动单位动作电位(MUAPs),通过材料测试与结构优化平衡佩戴舒适性与信号稳定性[4] - 构建可扩展数据收集基础设施,从数千参与者获取训练数据,开发通用sEMG解码模型,采用LSTM、1D卷积层加LSTM层、Conformer架构等深度学习技术适应不同交互场景[6] 性能表现 - 连续导航任务中闭环手势解码中位数性能为0.66次/秒,离散手势任务识别速率达0.88次/秒[7][9] - 手写输入速度达20.9字/分钟,个性化调整后解码性能可提升16%[9] - 离线评估中对未训练参与者的手写和手势检测分类准确率超90%,手腕角度速度解码误差小于13°s⁻¹,在不同年龄、性别、身体状况群体中表现稳定[12] 应用前景 - 日常交互:适用于智能手机、智能手表、智能眼镜等移动设备,解决移动场景下传统输入方式的局限性[13] - 辅助技术:为行动不便者提供新交互方式,通过细微肌肉活动控制轮椅、假肢等辅助设备[13] - 医疗康复:用于临床诊断和康复治疗,监测肌肉活动情况,辅助制定个性化康复方案[14] - 工业控制:实现自然方式远程操控复杂设备,减少操作失误,提高生产效率[14] 行业影响 - 技术前期验证通过Meta的Orion AR眼镜原型完成,2025年核心成果发表于Nature期刊[16] - 有望从专业AR设备拓展为通用电子设备交互标准,重新定义下一代人机交互范式[17][18] - 为脑机接口领域提供借鉴,其大规模数据收集和模型训练方法可能解决其他接口的校准问题[15]
为何把脑类器官芯片“送上天”(趣科普)
人民日报· 2025-07-26 06:02
脑类器官芯片技术 - 脑类器官芯片是以人多能干细胞为来源,在信用卡大小的芯片上构建3D微型脑模型,包含脑微血管网络、神经细胞和免疫细胞,能模拟近似大脑的部分结构和功能 [3] - 该技术可模拟脑器官生理和病理响应,为脑疾病建模、机制研究和药物筛选提供新工具,相比传统静态细胞培养更贴近人体真实环境 [3] - 科研人员已能在芯片上构建多种器官模型,包括脑、肝、肾等,拓展了体外仿生研究的应用范围 [3] 太空实验目的与意义 - 国际首次将脑类器官芯片送入空间站,旨在研究太空微重力、辐射环境对人脑健康的影响,揭示航天员神经系统功能异常的机制 [4] - 太空环境可加速机体衰老或功能衰退,为阿尔茨海默病、帕金森病等地面脑疾病研究提供"加速窗口",缩短病理研究周期 [5] - 实验成果有望实现"空—地转移"应用,推动脑疾病早期诊断与治疗评估方法的创新 [5] 与脑机接口的差异 - 脑类器官芯片侧重体外仿生人脑结构与功能,用于脑发育、疾病机制和药物筛选等基础研究 [6] - 脑机接口是脑电信号采集与交互技术,直接实现人脑对机械或计算机的控制,如意念操控假肢等功能扩展 [6] - 两者目标不同:前者为"脑器官模拟",后者为"人机交互",技术路径和应用场景存在本质区别 [6]
Nature:Meta公司开发非侵入式神经运动接口,实现丝滑人机交互
生物世界· 2025-07-24 15:31
人机交互技术革新 - Meta公司现实实验室研发了一款手腕佩戴装置,可通过手写动作实现人机交互,无需个性化校准或侵入性手术[3] - 该装置将手腕肌肉电信号转换为计算机指令,显著提升交互流畅度和可及性规模[3] 技术原理与性能 - 研究团队基于数千名受试者数据开发高灵敏度手环,结合深度学习构建泛型解码模型,性能遵循尺度定律(随模型规模和数据量提升)[5] - 装置通过蓝牙实时识别手势,支持虚拟导航和文本输入(每分钟20.9个单词,手机键盘平均36词/分钟)[6] - 个性化数据可进一步优化解码精度,为生物信号解码器广泛应用提供方向[5] 应用场景与数据共享 - 神经运动手环特别适用于行动受限群体(如肌无力、瘫痪患者),改善其计算机交互能力[8] - 团队公开了包含300名受试者、超100小时表面肌电信号记录的数据库,推动sEMG领域研究[9] 学术成果发布 - 研究成果发表于Nature期刊,标题为《A generic non-invasive neuromotor interface for human-computer interaction》[2][10]
助力人机交互更丝滑!国际最新研发手环能将手势转换成计算机指令
环球网资讯· 2025-07-24 12:12
技术突破 - 研究人员开发出一款手腕佩戴装置(手环),能将手腕处肌肉运动产生的电信号转换成计算机指令,无需个性化校准或侵入性手术[1] - 该手环利用蓝牙接收器与计算机通讯,可识别实时手势,实现虚拟导航、选择任务及每分钟20.9个单词的手写文本输入(手机键盘平均36单词/分钟)[3] - 深度学习创建的泛型解码模型无需个体校准即可翻译用户输入,性能随模型架构扩大和数据增加而优化[3] 应用场景 - 为身体机能受限人群(如行动力下降、肌无力、截肢、瘫痪者)提供可穿戴的计算机通信方式[4] - 神经运动接口技术可改善特殊人群与计算机的交互,适合探索可及性应用[4] 数据支持 - 研究基于数千名受试者的训练数据开发高灵敏度手环[3] - 公开发布数据库包含300名受试者逾100小时的表面肌电信号记录,覆盖三项任务数据[4] 技术优势 - 突破传统交互方式(键盘/鼠标/触屏)的移动场景局限性[3] - 个性化校准可进一步提升解码模型性能,结合尺度定律为高性能生物信号解码器指明方向[3]
神经运动手环通过手势实现人机交互
快讯· 2025-07-24 06:19
神经运动手环技术突破 - Meta公司推出全新神经运动手环,通过手腕肌肉电信号实现手势交互 [1] - 该装置无需个性化校准或侵入性手术,直接转换手写动作为计算机指令 [1] - 技术突破在于高性能生物信号解码器的应用,使人机交互更流畅且可及性扩大 [1] 人机交互领域进展 - 研究成果发表于《自然》杂志,标志着手势识别技术取得重大进展 [1] - 该技术可应用于计算机交互场景,提升操作自然度和用户体验 [1]
具身数采方案一览!遥操作和动捕的方式、难点和挑战(2w字干货分享)
具身智能之心· 2025-07-09 22:38
遥操作技术发展现状 - 遥操作概念起源于太空探索和军事领域,已有数十年历史,早期应用于手术机器人和远程挖掘机等场景[6][10] - 具身智能的兴起使遥操作技术重要性显著提升,主要因其在数据采集方面的关键作用[15][17] - 当前主流遥操作方案包括同构臂控制、VR操控和视觉动捕技术,其中纯视觉IK方案因操作自由度优势获得专家认可[21][29][31] 技术挑战与解决方案 - 系统延迟是核心瓶颈,整体延迟需控制在40毫秒以内以避免眩晕,远程操作普遍面临100毫秒延迟难题[34][118] - 异构映射问题突出,特别是手部操作环节,需设计新型reward函数优化人手到机械手的转换[83] - 动捕系统面临精度与自由度平衡难题,光学方案精度高但设备复杂,纯视觉方案便捷但存在遮挡问题[74][94][96] 行业应用场景 - 医疗领域已实现四手手术机器人系统,医生通过同构操作台完成精密手术[6] - 工程机械领域出现远程遥控挖掘机,操作员可在空调房内完成作业[6] - 人形机器人控制提出驾驶舱概念,通过多功能按钮集成实现移动与关节协同操作[68][71] 技术演进方向 - 未来可能形成纯虚(纯视觉)与纯实(力反馈外骨骼)两种互补方案[38][45] - 智能辅助系统将成为关键,类似汽车ESP的自动补偿机制可提升操作效率[125][126] - 脑机接口被视为终极解决方案,可绕过当前感知-动作转换链条的直接控制[37][144] 行业生态建设 - 标准化缺失制约发展,ALOHA系统首次提供完整硬件算法套件但尚未形成行业标准[103][109] - 机器人操作系统需从功能模块导向转向以人为中心,类似Windows的交互范式变革[146][147] - 封闭生态趋势显现,各厂商自定义中间件导致底层适配工作量大,亟需统一平台[159][160] 商业价值展望 - 遥操作将长期存在,即使实现AGI仍需要保留人类参与感和控制权[134][136] - 分身应用场景潜力巨大,可实现跨空间实体存在,但受限于图传等技术瓶颈[61][122] - 设计理念转向"Teleoperation First",将遥操作作为产品核心而非过渡方案[161][162]
Science Advances发表!南洋理工大学推出头发丝薄度传感器FMEIS,让机器秒懂肌肉「微表情」
机器人大讲堂· 2025-07-06 13:23
柔性多通道肌肉电阻抗传感器(FMEIS)技术突破 - 新加坡南洋理工大学王一凡教授团队开发出柔性多通道肌肉电阻抗传感器(FMEIS),厚度仅220μm,弹性模量212.8kPa,与人体皮肤弹性模量范围(420-850kPa)接近 [2][4] - FMEIS在手势分类任务中实现98.49%准确率,肌肉力量预测任务达到0.98判定系数(R²) [4] - 相比传统肌电(EMG)信号监测,FMEIS通过施加低强度高频电流感知肌肉组织阻抗变化,可捕捉深层肌肉(约30mm内)收缩过程中的阻抗变化 [4][10] FMEIS系统构成与性能 - 系统由4g传感器垫和53g控制单元组成,传感器垫采用超薄(220微米)高柔性(杨氏模量212.8kPa)可重复使用贴片 [6][7] - 传感器垫采用50kHz、0.4mA安全交流电流进行多通道信号注入与采集,可承受50%应变而不影响信号完整性 [7] - 控制单元运用机器学习算法处理多通道阻抗数据,手势识别准确率98.5%,肌肉力量回归拟合优度R²达0.98 [8][10] 应用场景验证 - 人机协作:通过肌肉信号解析操作意图,实现与协作机器人精密同步操作,提升工业组装效率与安全性 [19][20] - 外骨骼控制:驱动外骨骼响应延迟仅756毫秒,在增强握力实验中最大输出提升65%,有效延缓肌肉疲劳 [21][22] - 虚拟手术:精准反馈手势与力量信息控制虚拟手术刀,实现实时响应与拟真操作,未来可与触觉反馈系统联动 [23][26] 技术优势对比 - 相比商用EMG传感器,FMEIS可同时检测肌肉主动收缩和被动拉伸,而EMG仅能检测主动收缩 [17] - 在运动伪影抑制、检测深度、分辨率、兼容性、成本效益及非侵入性等关键指标上表现优异 [11] - 对三位参与者测试显示平均手势分类准确率98.49%,肌肉力量回归平均R²值0.98,显示强稳健性 [16] 产业化前景 - 该技术发表于《Science Advances》期刊,具有皮肤亲和性强、抗干扰能力优异、可重复使用等特性 [5][24] - 革新传统测量范式,为构建自然高效人机交互界面提供关键技术支撑,在康复机器人、智能可穿戴设备、神经接口等领域具广阔应用前景 [24]
赛道Hyper | Meta收购PlayAI谈判:意图与挑战
华尔街见闻· 2025-07-04 12:35
收购谈判进展 - Meta Platforms正与人工智能语音初创公司PlayAI就收购事宜展开深入谈判 [1] - 交易条款尚未最终确定,收购仍存在失败可能性 [2] PlayAI技术价值 - PlayAI专注于将人类语言转换为机器可理解的代码技术,其研发成果已被应用于虚拟助手开发 [1] - 该技术通过对人类语言的语义分析、意图识别,将自然语言转化为机器可执行指令代码,提升人机交互效率与准确性 [2] - 在虚拟助手市场,该技术能解决现有产品(如谷歌助手、苹果Siri、亚马逊Alexa)对复杂语义理解和个性化交互的局限性 [3] Meta战略布局 - 收购PlayAI是Meta在人工智能领域多维布局的举措,可补充其在语音交互技术方面的短板 [4] - PlayAI技术能帮助Meta构建更完整的AI技术栈,特别是在自然语言处理与机器理解细分领域 [4] - 技术整合后,Meta旗下Facebook、Instagram、Oculus等产品可集成更智能的虚拟助手,优化用户体验 [5][6] 人才与研发协同 - 收购PlayAI可帮助Meta吸纳语音技术领域的核心人才,为研发团队注入新思路 [7] - Meta同步推进AI人才布局,聘请OpenAI研究员Trapit Bansal负责AI推理模型研发 [7] - Trapit Bansal在深度学习、自然语言处理等领域有深厚积累,曾推动OpenAI首个AI推理模型O1的开发 [8] 潜在行业影响 - 若收购成功,Meta的语音交互与虚拟助手功能将显著优化,巩固其在社交网络、虚拟现实领域的优势 [9] - 收购可能加剧人工智能语音技术市场竞争,推动行业进入更激烈的创新竞争阶段 [9] - 无论结果如何,此次收购将为AI语音技术领域发展带来新动态 [9]