报告行业投资评级 - 推荐,维持评级 [8] 报告的核心观点 - 3D 视觉技术应用场景广泛,是工业自动化及众多行业智能化变革的重要驱动力,3D 点云数据在机器人学习中优势显著,为机器人智能化发展提供有力支持,未来应用前景广阔,建议关注 3D 视觉领域领先公司奥比中光 [2][3][106] 根据相关目录分别进行总结 商业应用——3D 视觉工作原理及应用场景 主要任务 - 3D 重建包括深度估计、数字化采样、数据处理展示,有单目、双目等重建方式及大场景、移动端重建类型 [11] - 位姿感知是对相机或物体在三维物理空间中位置和朝向的计算与实时跟踪 [12] - 3D 理解涵盖物体检测、识别、检索及场景或物体的分割和语义标记等 [13] 工作原理 - 飞行时间法(TOF)通过测量光发射与接收时间差计算物体距离,分直接 TOF 和间接 TOF,用于大视野、远距离、低精度、低成本 3D 图像采集及智能无人系统环境感知 [15] - 结构光投影 3D 成像由投影仪投射图案,相机摄取变形图像,通过处理分析计算物体三维坐标,有单次投影和多次投影方法,用于工业检测、3D 建模等领域,不同表面测量需不同技术辅助 [17][21][23] - 扫描 3D 成像方法包括扫描测距、主动三角法、色散共焦法等,不同方法有不同特点和适用场景 [29] - 立体视觉 3D 成像通过不同视点获取图像重构目标物体 3D 结构或深度信息,可通过单目、双目、多目、光场 3D 成像实现,各有原理和应用场景 [37] - 3D 视觉成像方法比较:ToF 相机、光场相机属单相机 3D 成像,有体积小、实时性好优点,但存在精度低、成本高问题;结构光投影 3D 系统精度和成本适中,有应用前景;被动立体视觉 3D 成像在工业领域有应用但场合有限;开发成本低廉、精度适中、被动单目 3D 成像系统是 Eye - In - Hand 系统最佳方案 [48] 应用场景 - 3D 高精度扫描用于精密物件扫描与测量,在工业制造中可检测产品质量,结合其他技术可用于多领域,如先临三维的扫描仪有高效准确扫描反馈和高精度检测能力 [50][52] - 机器人领域智能优化升级:3D 视觉赋予工业机器人强大感知能力,实现高精度操作,提高生产柔性和自动化程度;在人形机器人领域,帮助其识别环境、规划路径、实现人机交互等,如奥比中光助力工业机器人,北京人形机器人创新中心的机器人应用 3D 视觉技术提高感知和安全能力 [58][59][63] - 智能物流与仓储管理:用于货物识别、定位和测量,实现自动化分拣、码垛和存储,合理规划仓库空间,还可用于库存盘点和状态监测,如迈尔微视的视觉解决方案应用于多个关键场景 [64][65] - 生物识别:奥比中光在支付和智能家居安防领域提供解决方案,3D 刷脸支付破解传统 2D 人脸识别安全困境,3D 人脸辨识用于智能门锁/门禁系统 [69] 3D 视觉算法 3D 点云数据在机器人大模型中的优势 - 增强空间推理能力,提升任务成功率:基于点云的方法在成功率和平均排名上超越 RGB 和 RGB - D 方法,注入 3D 点云数据的模型能提供全面空间信息,解决 2D 模型空间感知局限,如 PointVLA 在“place bread”任务中表现优于 2D 模型 [3][73][77] - 提高少样本多任务学习能力:PointVLA 利用少量训练样本完成多个不同任务,降低数据采集和训练成本,在真实世界实验中表现出优势 [79] - 具备实际与照片区分能力:PointVLA 能区分真实物体和照片,避免操作错误,提高系统安全性和可靠性,而传统 2D 模型无法区分 [80] - 增强泛化能力:3D 点云数据在不同相机视角、光照条件、视觉外观变化下鲁棒性强,在相机动态变化、视觉外观变化实验及长时域打包任务中表现优于其他方法 [83] 机器人视觉图像数据获取与 3D 传感器技术应用 - 机器人视觉数据获取方式与形式:数据采集向高精度、多模态方向发展,来源与采集工具包括多模态传感器集成、开源数据集与仿真平台,主流厂商采用多模态传感器捕捉环境信息,开源数据集为算法训练提供测试环境 [88][89] - 主要的数据形式与特征:主要数据形式有 3D 点云与深度图、RGB - D 图像等,3D 视觉传感器生成点云数据可还原物体三维结构,RGB - D 数据是主流输入形式,多模态传感器融合成趋势 [90] - 视觉数据驱动的机器人训练流程:包括数据采集与预处理、算法训练与优化、部署与实时控制阶段,通过合成数据扩充训练集,采用强化学习等训练方法,整合多模态数据优化模型,支持在线学习更新模型 [91] - 3D 视觉传感器在机器人中的核心作用:成为人形机器人“感知 - 决策 - 执行”链路核心,增强环境理解,优化路径规划,确保动作稳定性,市场需求持续增长,多传感器融合成主流 [92][93] 3D 传感器算法框架 - Intel RealSense:以开源 SDK 2.0 为核心,统一管理多模态硬件,有跨平台兼容性与灵活生态,不同技术方案有不同特点和适用场景,但在户外强光和复杂场景有局限性 [94][95][96] - 奥比中光:以自研芯片为核心构建闭环体系,有硬件级深度处理与多模态融合技术,在不同场景有强大环境适应性和高精度表现 [100][101][102] - 核心技术差异与场景适配性分析:两者技术路线和市场定位互补,硬件架构、算法生态和算法实现有差异,影响场景适配性,Intel RealSense 适合轻量场景,奥比中光适合对精度和鲁棒性要求严苛的领域 [104][105] 投资建议 - 关注 3D 视觉领域的领先公司奥比中光 [5][106]
一周解一惑系列:机器人大脑算法迭代对视觉方案的影响
民生证券·2025-05-09 19:52