Workflow
3D视觉技术
icon
搜索文档
人形机器人“视觉”攻克战
机器人大讲堂· 2025-07-06 13:23
行业概述 - 2025RoBoLeague中国机器人足球联赛是国内首个机器人足球3V3 AI赛,参赛机器人完全依靠AI策略自主运行,无需遥控器控制 [1] - 视觉传感器是人形机器人实现环境感知、自主决策与交互的关键技术,其中3D视觉传感器(激光雷达、多目立体视觉、结构光、ToF等)是主流解决方案 [1] 奥比中光 - 主营业务为3D视觉感知产品的设计、研发、生产和销售,产品包括3D视觉传感器、消费级和工业级应用设备,已成为全球3D视觉传感器重要供应商之一 [2] - 构建了覆盖深度相机(单目/双目结构光、iToF)、激光雷达等全技术路线的3D视觉传感器体系,并推出机器人视觉感知产品矩阵 [4] - Femto系列iToF深度相机及Gemini 335/336系列结构光深度相机支持室内外复杂场景下的机器人视觉应用,已与部分人形机器人客户适配 [5] 速腾聚创 - 主营业务为激光雷达及感知解决方案的开发与销售,已与全球超2800家机器人客户合作,覆盖工业仓储、配送机器人等领域 [9] - 发布机器人视觉新品类Active Camera首款产品AC1,实现多传感器硬件级融合,并与全球超10家人形机器人企业建立战略合作 [9][11] - 入选摩根士丹利、高盛等投研机构的人形机器人核心产业图谱 [11] 奥普特 - 主营机器视觉核心软硬件产品,拥有完整的机器视觉核心硬件产品线,覆盖视觉算法库、智能视觉平台、3D传感器等领域 [12] - 正在研发适用于人形机器人的小型化散斑结构光系列和TOF相机系统 [13] 天准科技 - 全球视觉装备核心供应商,产品包括工业视觉装备(视觉测量、检测、制程装备等),服务于电子、半导体、新汽车等领域 [14] - 掌握3D视觉算法、3D点云处理、多传感器融合标定等技术,自主开发工业视觉软件平台ViSpec [15][17] - 发布人形机器人高性能具身智能控制器"星智001",支持实时运行端到端和大语言模型,并与数家主流机器人公司达成合作 [17] 水晶光电 - 国内知名光电元器件制造商,产品包括光学低通滤波器、相机手机滤光片等,应用于消费电子、车载光学及AR/VR领域 [19] - 已具备光学薄膜设计、微纳光学等八大技术能力,少量激光雷达视窗片产品应用于人形机器人 [22] 行业企业列表 - 工业机器人企业:埃斯顿自动化、埃夫特机器人、非夕科技等 [26] - 服务与特种机器人企业:亿嘉和、晶品特装、九号机器人等 [26] - 医疗机器人企业:元化智能、天智航、思哲睿智能医疗等 [26] - 人形机器人企业:优必选科技、宇树、云深处等 [26] - 具身智能企业:跨维智能、银河通用、千寻智能等 [27] - 核心零部件企业:绿的谐波、因时机器人、坤维科技等 [28][29]
奥比中光20250618
2025-06-19 17:46
纪要涉及的公司 奥比中光 纪要提到的核心观点和论据 - **财务表现优异**:2025 年 1 - 5 月总收入 3.6 亿元,同比增长 117%,经营规模扭亏为盈至 5500 万元,一季度净利率 12.7%,四五月份提升至 17.6%;预计 2025 年收入达 10 亿元,对应市值 200 亿元,2026 年收入超 15 亿元,对应市值 300 亿元;今年前五月利润约 5500 万元,全年预估利润接近 1.5 亿元,明年预期收入 15 亿以上,利润接近 3 亿元[2][3][13][15][16][17] - **产品结构与毛利率**:产品分高、低毛利两类,3D 视觉为高毛利产品,占营收 55%左右,毛利率超 60%;生物识别和 NFC 模组为低毛利产品,占营收 45%,生物识别模块预计 2025 年收入 2.4 - 2.5 亿元,毛利率约 30%,NFC 模组预计收入约 2 亿元,毛利率约 25%,低毛利产品综合毛利率 26% - 27%[4][5] - **3D 视觉技术优势**:与 2D 相机技术有显著区别,利用光折射原理,通过激光扫描物体形状和距离,识别精度在 20 米内达亚毫秒级,比激光雷达更精确[6] - **市场供应商格局**:消费级市场主要供应商有苹果、英特尔 RealSense 和奥比中光,苹果用于自身产品,英特尔 RealSense 和奥比中光服务非苹果客户市场[7] - **技术壁垒**:3D 视觉模组生产有技术闭环和商业化闭环两大核心壁垒,技术闭环确保设备准确发射、接收、处理信号,商业化闭环需根据不同环境适配;技术面临“温漂”挑战,核心壁垒在于算法层面的场景适配,测试周期长[2][8][9] - **产业发展情况**:2024 年产业模式差,下游需求有限、缺爆款产品且研发成本高;自 2020 年起,AGV 机器人转向自动避障机器人,人形机器人等领域对 3D 视觉需求增加;2025 年下游市场逐步爬坡,各子分类渗透率低但在提升[2][10][11][12] - **盈利模式与估值**:当前盈利模式优质、格局良好,关注收入增长速度和净利率;3D 视觉行业处于低渗透率、高成长阶段,估值相对合理[14][15] 其他重要但是可能被忽略的内容 - 2025 年第二季度收入保守估计可达 2.4 亿元,同比翻倍;第一季度总收入 1.9 亿元,净利润 2500 万元[13] - 公司相机模组售价 2000 多元,硬件成本仅几百元,研发投入已到位,两三年内不会增加边际成本[13] - 2025 年 AMR 机器人海外自动搬运量增加,人形机器人预计出货量达几千台至万台,3D 打印设备全球出货量从去年几百万台增长至约 700 万台,智能割草机采用 3D 视觉方案[12]
一周解一惑系列:机器人大脑算法迭代对视觉方案的影响
民生证券· 2025-05-09 19:52
报告行业投资评级 - 推荐,维持评级 [8] 报告的核心观点 - 3D 视觉技术应用场景广泛,是工业自动化及众多行业智能化变革的重要驱动力,3D 点云数据在机器人学习中优势显著,为机器人智能化发展提供有力支持,未来应用前景广阔,建议关注 3D 视觉领域领先公司奥比中光 [2][3][106] 根据相关目录分别进行总结 商业应用——3D 视觉工作原理及应用场景 主要任务 - 3D 重建包括深度估计、数字化采样、数据处理展示,有单目、双目等重建方式及大场景、移动端重建类型 [11] - 位姿感知是对相机或物体在三维物理空间中位置和朝向的计算与实时跟踪 [12] - 3D 理解涵盖物体检测、识别、检索及场景或物体的分割和语义标记等 [13] 工作原理 - 飞行时间法(TOF)通过测量光发射与接收时间差计算物体距离,分直接 TOF 和间接 TOF,用于大视野、远距离、低精度、低成本 3D 图像采集及智能无人系统环境感知 [15] - 结构光投影 3D 成像由投影仪投射图案,相机摄取变形图像,通过处理分析计算物体三维坐标,有单次投影和多次投影方法,用于工业检测、3D 建模等领域,不同表面测量需不同技术辅助 [17][21][23] - 扫描 3D 成像方法包括扫描测距、主动三角法、色散共焦法等,不同方法有不同特点和适用场景 [29] - 立体视觉 3D 成像通过不同视点获取图像重构目标物体 3D 结构或深度信息,可通过单目、双目、多目、光场 3D 成像实现,各有原理和应用场景 [37] - 3D 视觉成像方法比较:ToF 相机、光场相机属单相机 3D 成像,有体积小、实时性好优点,但存在精度低、成本高问题;结构光投影 3D 系统精度和成本适中,有应用前景;被动立体视觉 3D 成像在工业领域有应用但场合有限;开发成本低廉、精度适中、被动单目 3D 成像系统是 Eye - In - Hand 系统最佳方案 [48] 应用场景 - 3D 高精度扫描用于精密物件扫描与测量,在工业制造中可检测产品质量,结合其他技术可用于多领域,如先临三维的扫描仪有高效准确扫描反馈和高精度检测能力 [50][52] - 机器人领域智能优化升级:3D 视觉赋予工业机器人强大感知能力,实现高精度操作,提高生产柔性和自动化程度;在人形机器人领域,帮助其识别环境、规划路径、实现人机交互等,如奥比中光助力工业机器人,北京人形机器人创新中心的机器人应用 3D 视觉技术提高感知和安全能力 [58][59][63] - 智能物流与仓储管理:用于货物识别、定位和测量,实现自动化分拣、码垛和存储,合理规划仓库空间,还可用于库存盘点和状态监测,如迈尔微视的视觉解决方案应用于多个关键场景 [64][65] - 生物识别:奥比中光在支付和智能家居安防领域提供解决方案,3D 刷脸支付破解传统 2D 人脸识别安全困境,3D 人脸辨识用于智能门锁/门禁系统 [69] 3D 视觉算法 3D 点云数据在机器人大模型中的优势 - 增强空间推理能力,提升任务成功率:基于点云的方法在成功率和平均排名上超越 RGB 和 RGB - D 方法,注入 3D 点云数据的模型能提供全面空间信息,解决 2D 模型空间感知局限,如 PointVLA 在“place bread”任务中表现优于 2D 模型 [3][73][77] - 提高少样本多任务学习能力:PointVLA 利用少量训练样本完成多个不同任务,降低数据采集和训练成本,在真实世界实验中表现出优势 [79] - 具备实际与照片区分能力:PointVLA 能区分真实物体和照片,避免操作错误,提高系统安全性和可靠性,而传统 2D 模型无法区分 [80] - 增强泛化能力:3D 点云数据在不同相机视角、光照条件、视觉外观变化下鲁棒性强,在相机动态变化、视觉外观变化实验及长时域打包任务中表现优于其他方法 [83] 机器人视觉图像数据获取与 3D 传感器技术应用 - 机器人视觉数据获取方式与形式:数据采集向高精度、多模态方向发展,来源与采集工具包括多模态传感器集成、开源数据集与仿真平台,主流厂商采用多模态传感器捕捉环境信息,开源数据集为算法训练提供测试环境 [88][89] - 主要的数据形式与特征:主要数据形式有 3D 点云与深度图、RGB - D 图像等,3D 视觉传感器生成点云数据可还原物体三维结构,RGB - D 数据是主流输入形式,多模态传感器融合成趋势 [90] - 视觉数据驱动的机器人训练流程:包括数据采集与预处理、算法训练与优化、部署与实时控制阶段,通过合成数据扩充训练集,采用强化学习等训练方法,整合多模态数据优化模型,支持在线学习更新模型 [91] - 3D 视觉传感器在机器人中的核心作用:成为人形机器人“感知 - 决策 - 执行”链路核心,增强环境理解,优化路径规划,确保动作稳定性,市场需求持续增长,多传感器融合成主流 [92][93] 3D 传感器算法框架 - Intel RealSense:以开源 SDK 2.0 为核心,统一管理多模态硬件,有跨平台兼容性与灵活生态,不同技术方案有不同特点和适用场景,但在户外强光和复杂场景有局限性 [94][95][96] - 奥比中光:以自研芯片为核心构建闭环体系,有硬件级深度处理与多模态融合技术,在不同场景有强大环境适应性和高精度表现 [100][101][102] - 核心技术差异与场景适配性分析:两者技术路线和市场定位互补,硬件架构、算法生态和算法实现有差异,影响场景适配性,Intel RealSense 适合轻量场景,奥比中光适合对精度和鲁棒性要求严苛的领域 [104][105] 投资建议 - 关注 3D 视觉领域的领先公司奥比中光 [5][106]
3D高斯泼溅算法大漏洞:数据投毒让GPU显存暴涨70GB,甚至服务器宕机
量子位· 2025-04-22 13:06
3D Gaussian Splatting技术漏洞 - 3D Gaussian Splatting(3DGS)作为新一代高效三维建模技术,其自适应特性存在安全隐患,研究者提出首个专门针对3DGS的攻击方法Poison-Splat,通过输入图像扰动可显著拖慢训练速度、暴涨显存占用甚至导致系统宕机[1] - 3DGS技术已被广泛应用于LumaAI、Spline、Polycam等应用,通过不固定数量的3D高斯点构建逼真三维世界,但其灵活性也带来了安全漏洞[2] - 攻击者只需改动图片细节就能让系统在训练阶段直接崩溃,这一漏洞由新加坡国立大学和昆仑万维的研究者在ICLR 2025论文中首次揭示[2] Poison-Splat攻击机制 - 攻击通过max-min双层优化问题建模,采用三大创新策略:代理模型作为内层近似器、利用图像非光滑性诱导高斯密度增长、约束扰动强度提升隐蔽性[13][15][16][17] - 攻击效果惊人:在无约束攻击下,GPU显存从不到4GB飙升到80GB,训练时间最长可达5倍增长,高斯数量增加至20倍+,渲染速度降至1/10[25] - 即使在隐蔽性约束下(像素扰动不超过16/255),部分场景仍能使显存消耗增高超过8倍,超过常见24GB显卡显存上限[27] 攻击的实际影响 - 攻击对黑盒模型同样有效,如Scaffold-GS,表明其具备跨平台传染性[28][29] - 现实中3D服务商如Polycam、Kiri支持用户自由上传图像,攻击者可伪装成普通用户提交"毒图",在高峰时段导致系统资源被霸占,引发服务瘫痪(DoS)[31][36] - 简单限制高斯点总量的防御方法会严重影响3D重建服务质量,目前尚无理想防御方案[39][40] 研究意义与行业影响 - 该研究首次系统性地揭示3DGS训练阶段的资源安全漏洞,是首个在三维视觉中将"数据投毒"扩展到"训练资源消耗"维度的研究[37] - 研究提出一套通用且具备可迁移性的攻击框架,推动了3D安全领域发展[37] - 研究结果预示3D重建厂商若无相应防护,系统很可能出现显存不足或训练无效,需引起行业重视[40][41]