3D视觉

搜索文档
机械一周解一惑系列:机器人大脑算法迭代对视觉方案的影响
民生证券· 2025-05-09 20:23
报告行业投资评级 - 推荐,维持评级 [8] 报告的核心观点 - 3D 视觉技术应用场景广泛,是工业自动化及众多行业智能化变革的重要驱动力,3D 点云数据在机器人学习中优势显著,为机器人智能化发展提供有力支持,未来应用前景广阔,建议关注 3D 视觉领域领先公司奥比中光 [2][3][106] 根据相关目录分别进行总结 商业应用——3D 视觉工作原理及应用场景 主要任务 - 3D 重建包括 3D 场景深度估计、物体表面数字化采样及数据处理展示,有单目、双目等重建方式及大场景、移动端三维重建 [11] - 位姿感知是对相机或物体在三维物理空间中位置和朝向的计算与实时跟踪 [12] - 3D 理解涵盖物体检测、识别、检索及场景或物体的分割和语义标记等 [13] 工作原理 - 飞行时间法(TOF)通过测量光发射到接收的时间差计算物体距离,分直接 TOF(DTOF)和间接 TOF(I - TOF),用于大视野、远距离、低精度、低成本 3D 图像采集及智能无人系统环境感知 [15] - 结构光投影 3D 成像由投影仪投射特定图案,相机摄取变形图像,通过处理分析计算物体三维坐标信息,有单次投影和多次投影 3D 方法,用于工业检测、3D 建模等领域 [17] - 扫描 3D 成像方法包括扫描测距、主动三角法、色散共焦法等,不同方法有不同特点和适用场景,如单点飞行时间法适合远距离扫描,色散共焦法可扫描多种物体 [30][34] - 立体视觉 3D 成像从不同视点获取图像重构目标物体 3D 结构或深度信息,可通过单目、双目、多目视觉、光场 3D 成像实现,各有其原理和应用场景 [37] - 3D 视觉成像方法比较:ToF 相机、光场相机体积小、实时性好,但存在精度低或成本高问题;结构光投影 3D 系统精度和成本适中,有应用前景;被动立体视觉 3D 成像在工业领域有应用但场合有限;开发成本低廉、精度适中的被动单目 3D 成像系统是 Eye - In - Hand 系统的最佳方案 [48] 应用场景 - 3D 高精度扫描用于精密物件扫描与测量,在工业制造中可检测产品质量,结合三维设计与 3D 打印技术应用于多领域,如先临三维的相关扫描仪有出色表现 [50] - 机器人领域智能优化升级:3D 视觉赋予工业机器人强大感知能力,实现高精度操作,提高生产柔性和自动化程度;在人形机器人领域,帮助机器人实现路径规划、物体抓取与操作、人机交互等功能,如奥比中光的技术助力机器人实现多种功能,北京人形机器人创新中心的“天工 Ultra”配置深度相机提高感知和安全能力 [58][59][63] - 智能物流与仓储管理:3D 视觉技术用于货物识别、定位和测量,实现自动化分拣、码垛和存储,合理规划仓库空间,还可用于库存盘点和货物状态监测,如迈尔微视的视觉解决方案在多个关键场景落地应用 [64] - 生物识别:奥比中光在支付和智能家居安防领域提供 3D 视觉解决方案,如 3D 刷脸支付和 3D 人脸辨识门锁门禁系统 [69] 3D 视觉算法 3D 点云数据在机器人大模型中的优势 - 增强空间推理能力,提升任务成功率:基于点云的方法在成功率和平均排名上超越 RGB 和 RGB - D 方法,注入 3D 点云数据的 VLA 模型能提供更全面空间信息,解决 2D 模型空间感知局限,提高任务成功率 [3][73] - 提高少样本多任务学习能力:PointVLA 利用点云数据丰富信息,在少量训练样本下完成多个不同任务,降低数据采集和训练成本,在真实世界实验中表现出优势 [79] - 具备实际与照片区分能力:PointVLA 基于 3D 点云数据能区分真实物体和照片,避免错误操作,提高系统安全性和可靠性 [80] - 增强泛化能力:3D 点云数据在不同相机视角、光照条件、视觉外观变化下鲁棒性更强,在相关实验中表现优于其他方法,在长时域打包任务中也有良好性能 [83] 机器人视觉图像数据获取与 3D 传感器技术应用 - 机器人视觉数据获取方式与形式:数据采集向高精度、多模态方向发展,主流厂商采用多模态传感器集成,开源数据集为算法训练提供标准化测试环境 [88] - 主要的数据形式与特征:主要数据形式有 3D 点云与深度图、RGB - D 图像等,多模态传感器融合成趋势 [90] - 视觉数据驱动的机器人训练流程:包括数据采集与预处理、算法训练与优化、部署与实时控制几个阶段,通过合成数据扩充训练集,采用 AI 强化学习等方式训练机器人 [91] - 3D 视觉传感器在机器人中的核心作用:成为人形机器人“感知 - 决策 - 执行”链路的核心,体现在环境感知与建模、动作规划与执行、市场驱动与技术趋势几方面,市场需求持续增长,多传感器融合成主流 [92] 3D 传感器算法框架 - Intel RealSense:以开源 SDK 2.0 为核心,统一管理多模态硬件,具有跨平台兼容性与灵活生态,在不同技术方面有不同实现方式和应用场景,但在户外强光环境和复杂场景下有一定局限性 [94] - 奥比中光:以自研 MX 系列芯片为核心构建闭环体系,核心竞争力源于硬件级深度处理与多模态融合技术,在不同技术方面有独特优势,在场景化应用中展现出强大环境适应性 [100] - 核心技术差异与场景适配性分析:两者在技术路线与市场定位上互补,硬件架构和算法生态有差异,影响场景适配性,Intel RealSense 适合轻量场景,奥比中光适合对精度与鲁棒性要求严苛的领域 [104] 投资建议 - 关注 3D 视觉领域的领先公司奥比中光 [5][106]
凯格精机(301338) - 2025年4月28日投资者关系活动记录表
2025-04-28 20:56
投资者关系活动基本信息 - 活动类别为特定对象调研、电话会议及其他 [1] - 参与单位及人员有平安基金等34位投资者 [1] - 活动时间为2025年4月28日下午19:00 - 20:00,地点在公司会议室 [1] - 上市公司接待人员有董事会秘书邱靖琳、投关经理江正才、证券事务代表刘丹 [1] 2025年一季度业绩情况 - 营业收入19,655.83万元,同比增长27.23%;归属于母公司股东的净利润3,320.97万元,同比增长208.34%;扣除非经常性损益的净利润3,146.35万元,同比增长235.72%,且连续4个季度环比增长 [2] - 收入增长原因系下游消费电子需求回暖、AI服务器需求增长、新能源车渗透率提升带来电子装联设备需求增长 [2] - 净利润同比、环比增长较快原因是毛利率提升,包括部分业务收入中高端产品占比提升和高毛利率业务营收结构占比提升 [2] 公司实验室情况 - 成立2025实验室,目的是攻克研发底层需求的算法模型,依靠工艺数据和材料学建立工业AI模型,如关联关系模型和自我补偿模型 [2] 研发进展情况 - 2023年度、2024年度及2025年一季度研发投入营收占比分别为10.06%、9.12%、9.88% [2] - 截至2024年12月31日,已取得各项专利212项,2024年度新增授权发明专利18项、实用新型专利30项 [2] - 2024年度研发中心进行多项技术创新与应用,如AI视觉模型应用、低代码视觉平台开发、3D视觉应用、电气集成开发方式升级、控制驱动产品开发、整线技术研发储备 [2][3] 特定设备情况 - SIC晶圆老化设备用于第三代半导体晶圆在高温环境下测试芯片长时间稳定性,为后段封装提供合格芯片 [3] - SIC KGD分选设备用于第三代半导体芯片测试并分选,满足多领域芯片电性能测试需要,提高产品质量和可靠性,应用于新能源汽车等领域 [3] 2025年经营计划 - 坚持创新,加大研发中心投入,完善共性技术及模块建设,深化人才梯队培养,优化人员结构,完善考核与激励机制 [3] - 面向新应用场景推出新产品,鼓励申报发明专利,参与标准与规范编制,巩固行业地位 [3]
凯格精机:去年净利润同比增逾三成
证券时报网· 2025-04-25 19:30
财务表现 - 2024年营业收入85660.20万元,同比增长15.75% [1] - 归属于母公司股东的净利润7051.62万元,同比增长34.12% [1] - 扣非净利润6358.16万元,同比增长60.25% [1] - 综合毛利率32.21%,同比增加2.38个百分点 [1] - 营业收入连续三个季度环比增长 [1] - 合同负债期末较期初增长87.02%,在手订单饱满 [1] 增长驱动因素 - 下游消费电子需求回暖,AI服务器需求增长,新能源车渗透率提升带动电子装联设备需求 [1] - 高毛利率业务收入结构占比提升 [1] - 封装设备优化设计提升毛利率9.18个百分点 [1] 研发创新 - AI视觉模型应用于封装设备的芯片检测、缺陷检测、点胶机胶点检测、植球机缺陷检测 [2] - 3D视觉应用于五轴点胶机的胶路引导与检测,提高精度和效率 [2] - 储备先进封装领域"印刷+植球+检测+补球"整线技术 [2] - 新增授权发明专利18项、实用新型专利30项 [2] - 与华为联合申请印检贴一体机发明专利 [2] 产品布局 - SIP封装、半导体封测及汽车电子领域交付取得新进展 [2] - 储备第三代半导体领域SIC晶圆老化设备及SICKGD分选设备 [2] - 成功开拓光通讯行业应用场景,推出800G光模块自动化线体 [2] 经营策略 - 践行"提质增效",坚持开源节流 [1] - 通过研发创新、产品拓展、管理优化、人才培养提升经营质量 [1] - 2025年坚持"强攻击抓机会",提升市场份额 [2] - 持续推进精益与高效运营,向流程要效率,向创新要利润,向管理要效益 [2]
剪枝60%不损性能!上海AI Lab提出高斯剪枝新方法,入选CVPR 2025
量子位· 2025-04-09 16:58
3D高斯泼溅技术优化 - 三维高斯泼溅(3D Gaussian Splatting)是当前3D视觉领域最常用的算法之一,可实现实时高质量渲染,但存在冗余高斯点问题,单个重建场景可能包含数百万个高斯点 [1] - 冗余高斯点降低了训练和渲染速度,并导致显著的内存消耗 [2] MaskGaussian创新方法 - 上海AI Lab研究团队提出MaskGaussian,将掩码融合进光栅化过程,首次为被使用和未被使用的高斯同时保留梯度 [2] - MaskGaussian支持从头开始训练和对现有高斯进行微调,在不影响重建质量的情况下减少高斯点数 [3] - 在Mip-NeRF360、Tanks & Temples和Deep Blending数据集上分别剪枝了62.4%、67.7%和75.3%的高斯点,性能损失可忽略不计 [5][28] 技术实现细节 - 传统剪枝方法存在局限性:手工设计的重要性评分方法需要扫描所有训练图像,可学习掩码方法可能导致次优重建效果 [6] - MaskGaussian为每个高斯点学习掩码分布,通过采样生成二值掩码,所有高斯点进行标准溅射并和掩码一起进入渲染计算 [8] - 修改CUDA渲染器使掩码为1和0的高斯都能获取正确梯度,计算其对场景的贡献影响 [9][18] - 掩码光栅化前向过程保留溅射的α完整性,反向过程通过梯度公式更新掩码分布 [14][20][21] 性能表现 - 在Mip-NeRF360数据集上,MaskGaussian的PSNR为27.43,SSIM为0.811,LPIPS为0.227,高斯点数量减少至1.205百万,FPS提升至384.7 [29] - 在Tanks & Temples数据集上,高斯点数量减少至0.590百万,FPS提升至558.3 [29] - 在Deep Blending数据集上,高斯点数量减少至0.694百万,FPS提升至637.1 [29] - 内存消耗显著降低,例如在counter场景中从5.41GB降至3.53GB [30]