Workflow
多模态传感
icon
搜索文档
国内首个硅谷科创展团将入驻AWE2026东方枢纽展区
远川研究所· 2026-03-05 21:06
展会核心事件 - AWE2026东方枢纽展区将迎来国内首个硅谷科创企业展团,这是硅谷科技企业首次以规模化展团形式亮相国内展会 [2] - 展团由硅谷科技评论(SVTR)发起,集结15家硅谷前沿科技企业,并同步有近60位硅谷高端企业家、资深科技人士与核心买家组成的参观团参展 [2] - 展团覆盖人工智能、工业机器人、多模态传感、空间智能、企业服务、脑机健康、智能硬件等多个科技创新前沿赛道 [2] 参展企业技术亮点 - **Mantis Robotics**:专注于无围栏工业机器人与人机协作,其“物理智能(Physical AI)”技术重新定义人机协作模式,旗舰产品MR-1机器人用于自动化套件装配 [4] - **Aora**:凭借无创神经传感器技术直接捕捉大脑电生理活动,通过AI算法实时分析认知表现、压力水平、专注度与脑力疲劳,提供个性化报告 [6] - **Toasterz**:致力于打造人工智能驱动的智能厨房生态系统,其智能发酵产品SourFriend结合精密温控与预测式AI算法,实现家庭酸种面包发酵的标准化 [8] - **SpaceWar**:打造全球首个ICT融合的团队无人机竞技平台,融合激光雷达实时定位服务、AI自动计分系统与沉浸式VR直播技术,提供全数字化体育体验 [10] - **Cephia**:基于超表面技术的一体化多模态传感平台,集成视觉、听觉、触觉、力觉等多种感知能力,处理速度比传统电子计算快200倍以上,能耗降低90% [12] - **Orion**:打造分布式边缘AI个人助手,将AI计算能力部署在用户设备本地,实现跨终端无缝协同控制 [14] - **Avea Robotics**:为物理AI提供可扩展数据基础设施和远程操作平台,其统一远程操作平台实现低延迟控制、沉浸式可视化与即插即用连接 [16] - **Atlas Spatial Intelligence**:通过构建数字孪生模拟基础设施,为机器学习提供低成本、高效率且自带精准标注的物理世界动作级数据,用于机器人训练或无人机导航 [18] - **Xronos**:以工业级平台为机器人、自动化与移动设备提供安全可靠的控制,提升开发者效率并在边缘侧实现AI能力落地 [20] - **Griting**:为企业、高校、初创企业提供AI人才审核、孵化服务,其AI评估算法由藤校AI博士团队打造,能深度理解技术人才能力 [23] - **Trace**:为硬件团队提供完整的PCB工作流程支持,涵盖从概念设计到Gerber文件导出的全过程 [26] - **Prosgrow AI**:专注于为AI与科技初创公司提供资源匹配与商业增长服务,利用NVIDIA的GPU和AI开发资源驱动会议GTM代理 [26] - **Sayge**:打造基于“Live AI Agent (LAA™)”的决策智能平台,帮助企业在内容发布前实现毫秒级验证,其模型依托2700万+真人数据构建,细微决策准确率达87.5% [28] - **Spawnlabs**:打造“描述即构建”的软件生成平台,能将创意转化为可自主维护的实时系统 [28] 展会与产业影响 - 硅谷科创展团以“技术+人才+产业”的全面阵容,将在AWE2026东方枢纽展区展开创新基因与市场活力的深度交流 [28] - AWE2026东方枢纽国际商务合作区展区为消费电子前沿科技专业展区,聚焦AI芯片、算力、6G、具身智能、新能源等硬核科技领域 [29] - 展会主要服务行业人士、采购商、媒体等专业观众,采用提前预约审核入场制度,需提前24小时完成线上注册与资质审核 [29][30]
国内首篇仿生触觉新突破!清华丁文伯团队研发“鸽眼”传感器,让机器人感知逼近人类!
机器人圈· 2026-01-21 17:34
文章核心观点 - 清华大学深圳国际研究生院丁文伯团队联合多所机构,受鸽子多光谱视觉与非成像感知机制启发,研发出一种仿生多模态触觉传感器SuperTac及触觉语言模型DOVE,旨在将机器人触觉感知能力提升至“人类水平”,为智能制造、医疗辅助与服务机器人等领域提供新一代解决方案,相关成果发表于Nature Sensors创刊号,是国内机构首次以第一单位在该期刊发表文章 [3][4] 研究背景与现有技术瓶颈 - 当前机器人触觉系统在感知维度、分辨率和信号理解能力上远逊于人类,难以支撑复杂动态的真实场景任务 [3] - 现有主流触觉传感方案存在显著不足:电子皮肤难以兼顾高分辨率与多模态融合;视触觉传感器感知谱段通常局限于可见光,缺乏对温度、材质等非成像模态的融合能力;当前系统普遍缺乏能融合多模态信息并进行语义推理的智能模型,导致机器人“有感无知” [4] 系统核心架构与工作流程 - 研究构建的多模态触觉传感系统包含三大核心组件:仿生多模态触觉传感器SuperTac、数据处理与特征提取模块、以及触觉语言模型理解推理层DOVE [4] - 系统采用分层设计实现全流程闭环处理:物理信号感知层同步采集多光谱视觉、摩擦电和惯性测量信号;数据融合处理层基于深度学习网络进行特征提取和模态融合;语义理解推理层通过DOVE模型将多模态特征映射到语义空间;最终集成至应用交互层支持实际任务 [5][7] - 该架构的核心创新在于实现了物理传感-特征提取-语义理解的端到端一体化设计,将传统分离的传感与解读过程有机融合 [7] 生物灵感来源与传感器设计 - 设计灵感来源于鸽子视网膜中多类型视锥细胞的分工机制,特别是紫外敏感细胞,以拓展传感器的光谱感知范围,并模拟其用于磁场感知的特殊分子机制,将非成像感知能力迁移至触觉领域 [6] - SuperTac通过多光谱成像(紫外、可见光、近红外、中红外波段)、摩擦电传感模块与惯性测量单元集成,实现对纹理、力、颜色、温度、材质、接近感、姿态等多物理量的同步感知 [6] - 传感器采用气压可调的硅胶充气支撑结构,动态调节0-7N力感知范围,并实现对复杂曲面的高保真轮廓重建 [6] - 感知皮肤采用总厚度仅1mm的四层薄膜堆叠结构,具备高透明度、良好导电性、光控透明切换等特性,通过内部光源开关可在触觉模式与视觉模式间智能切换 [9][10] 数据处理、特征提取算法与模型性能 - 力与位置感知采用基于U-Net的编码器-解码器架构,经过86,440组数据训练,达到位置检测均方误差0.056mm、力检测均方误差0.0004N的精度 [12] - 多模态分类任务采用专门化网络设计,在纹理识别、材质分类、颜色识别、滑动检测及碰撞检测上分别达到98%、95%、100%、97%及94%的准确率 [12] - 三维重建与轮廓感知方面,基于紫外荧光标记的位移分析算法实现变形重建,平均均方根误差0.0892、平均绝对误差0.0375,可识别0.07mm细发并实现100%盲文字符识别准确率 [12] - DOVE触觉语言模型采用基于预训练视觉-语言模型的架构,总参数量达8.6B,通过三阶段训练策略实现多模态特征到语义空间的嵌入对齐,能够融合触觉、温度、颜色和材质等信息进行联合推理 [14] - 为训练模型,系统采集了6种颜色、3种温度、10种材质和6种纹理的完整组合物理数据,并基于GPT-4和规则脚本生成了30,000组触觉语言问答对 [14] 系统验证与性能评估 - 系统性能通过多层次实验体系验证,包括基础传感性能精度标定、多属性识别准确率评估、80,000次接触循环的耐久性测试,以及在机器人抓取、物体识别、人机交互等真实场景中的可靠性测试 [17] - 研究进行了对比实验,与传统GelSight等传感器在轮廓感知、纹理识别等关键性能指标上进行系统化比较 [17] 总结与未来展望 - 研究为机器人触觉感知开辟了多个发展方向:硬件层面推动传感器的微型化以集成于机器人指尖;DOVE模型的模态无关框架具有良好的可扩展性,能为多模态触觉系统提供通用软件基础 [18] - 未来工作将重点研发低功耗解码芯片与高集成度封装方案,以减小系统尺寸并解决散热与稳定性问题,同时持续优化DOVE模型在不同传感器设计和专用数据集上的表现,增强其泛化能力与实用性 [18]