Workflow
3D视觉
icon
搜索文档
擂台之上 “慧眼”助力 人形机器人格斗赛 国产“慧眼”如何让机器人精准识敌
广州日报· 2025-05-29 03:01
机器人格斗赛事技术突破 - 宇树G1格斗比赛展现机器人稳定性与瞬间抗冲击能力超预期表现 成为机器人技术发展风向标 有望带动机器人行业新一轮行情 [1] - 比赛机器人采用力传感器 触觉传感器 视觉方案等感知技术 以及谐波减速器 电机等核心传动装置 其中视觉感知技术是理解环境的核心能力 [1] - 参赛G1机器人配备双目深度相机和3D激光雷达 实现360度环境感知 通过多传感器融合技术实时调整姿态完成高强度动作 [2] 机器视觉技术路线对比 - 特斯拉Optimus采用2D摄像头视觉方案 延续车端纯视觉感知技术路线 [2] - 国内厂商主要采用3D视觉(结构光/ToF/双目)结合激光雷达方案 相比2D视觉增加深度信息 提升环境建模与导航精度 [2] - 奥比中光在国内服务机器人视觉市场占有率超70% 为全球少数全面布局六大3D视觉感知技术路线的公司 [2][4] 机器人技术发展阶段 - 当前比赛采用"手动遥控"方式 依赖"机器人选手+真人选手操控"协同配合 [3] - 人形机器人重大进展体现在关节灵活度和平衡运动控制方面 人为指令执行效果超预期 [3] - 未来全自动格斗需机器人具备自动化感知决策能力 视觉传感器感知数据将成为重要基础 [3] 行业发展趋势 - 12月深圳将举办全球首个人形机器人"机甲拳王"自由格斗赛 打造开源竞技联盟 推动跨界融合 [4] - 奥比中光已将双目结构光系列产品送样 适配大部分人形机器人客户 [4] - 机器人格斗竞技将加速技术迭代和场景落地 国产3D视觉感知技术 多维传感技术 精密传动技术等供应链将加速崛起 [4][5]
3D视觉核心优势,物理AI第一步
2025-05-25 23:31
纪要涉及的公司和行业 - 公司:思看科技、行创公司、先临 3D 公司、海克斯康、卡尔蔡司、联赢光、奥普特、铂力特 [1][17][21] - 行业:3D 扫描技术行业、汽车制造、航空航天、工程机械、文物保护、医疗、游戏 [1][10][18] 纪要提到的核心观点和论据 思看科技市场地位和产品特征 - 市场地位:国内市占率第一,全球市占率第二 [2] - 产品特征:产品包括手持式扫描枪、跟踪式扫描设备及一体化质量检测设备,精度可达 0.03 毫米以下,具有高毛利率和高净利率特点,广泛应用于逆向工程、质量检测等高端制造领域 [1][2] 思看科技发展方向 - 深耕工业专业领域和拓展机器人应用,探索新应用场景如 3D 打印,通过与 FDM 3D 打印机结合实现更高效精确建模和打印 [1][3][4] 思看科技重要客户及应用场景 - 重要客户:商飞集团、比亚迪等 [1][5] - 应用场景:客户用跟踪式扫描设备进行大物体、大面积工件扫描,一体化质量检测设备用于高端制造业质量检测,如汽车制造中对车门建模并与理想图纸对比 [5] 思看科技软件算法优势 - 软件算法全部自主研发,能无缝兼容主流 CAD 格式,提供硬件和软件解决方案,在质量检测系统中可快速识别工件误差并实时反馈 [1][6] 思看科技财务状况和收入结构 - 财务状况:过去几年收入稳健增长,毛利率稳定在 76%左右,净利率接近 40%,经营性现金流每年保持 1 亿元以上净流入 [1][7] - 收入结构:海外收入增速显著,目前海外市场贡献约占总收入的 40%,得益于替代海外同类产品和经销模式 [1][7][8] 思看科技国内外市场增速预期 - 海外市场:增速预计保持乐观,得益于直销点落地带来客单价和利润率提升 [1][9] - 国内市场:增速可能放缓,因 2022 年汽车行业资本开支高峰已过,采购周期进入相对平缓期 [1][9] 思看科技产品结构 - 产品包括手持式 3D 扫描仪(价格 10 万元以上)、大型跟踪式 3D 扫描产品、工业级自动化检测系统,新发布消费级产品价格约 2000 美元,正在拓展专业级及消费级市场,增长潜力大 [1][11] 思看科技技术优势 - 体现在识别重建、立体延伸和立体标定三个方面,通过 FPGA 和 SoC 模块进行端侧计算,实现无线状态和多波段复合扫描,在 3D 重建领域有显著竞争优势 [3][13] 扫描技术发展趋势 - 非接触式扫描精度提升,有望替代接触式扫描,未来占据 80%市场份额,思看科技非接触式产品具显著竞争力 [3][14] 思看科技未来驱动力 - 全球高端制造业出海,产品渗透率和市占率稳步提升;物理计算 AI 的应用,在机器人及工业侧有更多应用场景 [15][16] 全球 3D 扫描仪市场参与者 - 主要参与者有行创公司、先临 3D 公司、海克斯康、卡尔蔡司,市场规模目前不大但未来发展潜力大 [17] 3D 扫描技术应用 - 工业领域用于高精度设备如焊缝质量检测;专业级领域用于文物保护、医疗、游戏场景等 [18] 物理 AI 与 3D 扫描技术结合 - 构建完整物理场和生成更多场景,避免传统测试问题,确保数据质量,适用于家居和工业级机器人视觉系统 [19] 思看科技消费级产品及机器人视觉优势 - 消费级产品不断拓展,结合算法有望相同精度下实现更低成本,进入更多机器人场景,在工业级机器人视觉模块输出上表现突出 [20] 思看科技未来盈利预测 - 专业级领域预计翻倍以上增速,工业级预计维持 25% - 30%增速,增速快且盈利水平高,市盈率有提升空间 [21] 其他重要但是可能被忽略的内容 - 思看科技股东结构稳定,由三位浙大系创始人组成一致行动人,还有员工持股平台 [12] - 余杭区政府曾推送思看科技与斯泰科技合作,通过脑机接口捕捉电信号实现截面 1:1 复刻 [18]
奥普特(688686):2024年报及2025年一季报点评:业绩短期承压,研发高度重视
国元证券· 2025-05-21 23:16
报告公司投资评级 - 维持“增持”评级 [1] 报告的核心观点 - 奥普特2024年业绩短期承压但重视研发,2025Q1营收因产品结构优化及AI算法升级推动3C电子领域需求回暖而增长 [2] - 技术突破驱动应用深化,在锂电、3C电子、半导体和汽车领域有显著进展 [3] - 预计公司2025 - 2027年营收和归母净利润增长,维持“增持”评级 [4] 根据相关目录分别进行总结 业绩情况 - 2024年营收9.11亿元,同比 - 3.44%;归母净利1.36亿元,同比 - 29.66%;扣非净利润1.16亿元,同比 - 28.62%;毛利率63.57%,同比 - 0.66pct;净利率14.95%,同比 - 5.57pct;研发投入2.17亿元,同比增长7.28%,研发投入占比达23.81% [2] - 2025Q1营收2.68亿元,同比 + 18.09%;归母净利0.58亿元,同比 + 0.97% [2] 各领域业务进展 - 锂电领域:高精度成像技术及AI检测方案在核心工艺突破,模型与数据共享使项目实施效率提高50%,XG系列相机检测率达99.8%,覆盖头部厂商 [3] - 3C电子领域:2024年营收58,478万元,同比增长0.74%,10GigE相机成像一致性提升约10% [3] - 半导体和汽车领域:半导体行业收入5,081万元,同比增长44.08%;汽车行业收入3,210万元,同比增长89.95%,晶圆缺陷检测达亚微米级精度,芯片缺陷检测精度达0.2μm [3] 投资建议与盈利预测 - 预计2025 - 2027年营收分别为10.99/13.21/15.74亿元,归母净利润分别为1.96/2.45/2.97亿元,对应EPS为1.60/2.01/2.43元/股,对应PE估值分别为54/43/36倍 [4] 财务数据 - 2023 - 2027年营业收入分别为9.44/9.11/10.99/13.21/15.74亿元,收入同比分别为 - 17.27%、 - 3.44%、20.62%、20.17%、19.11% [6] - 归母净利润分别为1.94/1.36/1.96/2.45/2.97亿元,同比分别为 - 40.37%、 - 29.66%、43.66%、25.34%、21.00% [6] - ROE分别为6.73%、4.67%、6.35%、7.49%、8.47% [6] - 每股收益分别为1.58/1.11/1.60/2.01/2.43元 [6] - 市盈率分别为54.89/78.04/54.32/43.34/35.82倍 [6]
机械一周解一惑系列:机器人大脑算法迭代对视觉方案的影响
民生证券· 2025-05-09 20:23
报告行业投资评级 - 推荐,维持评级 [8] 报告的核心观点 - 3D 视觉技术应用场景广泛,是工业自动化及众多行业智能化变革的重要驱动力,3D 点云数据在机器人学习中优势显著,为机器人智能化发展提供有力支持,未来应用前景广阔,建议关注 3D 视觉领域领先公司奥比中光 [2][3][106] 根据相关目录分别进行总结 商业应用——3D 视觉工作原理及应用场景 主要任务 - 3D 重建包括 3D 场景深度估计、物体表面数字化采样及数据处理展示,有单目、双目等重建方式及大场景、移动端三维重建 [11] - 位姿感知是对相机或物体在三维物理空间中位置和朝向的计算与实时跟踪 [12] - 3D 理解涵盖物体检测、识别、检索及场景或物体的分割和语义标记等 [13] 工作原理 - 飞行时间法(TOF)通过测量光发射到接收的时间差计算物体距离,分直接 TOF(DTOF)和间接 TOF(I - TOF),用于大视野、远距离、低精度、低成本 3D 图像采集及智能无人系统环境感知 [15] - 结构光投影 3D 成像由投影仪投射特定图案,相机摄取变形图像,通过处理分析计算物体三维坐标信息,有单次投影和多次投影 3D 方法,用于工业检测、3D 建模等领域 [17] - 扫描 3D 成像方法包括扫描测距、主动三角法、色散共焦法等,不同方法有不同特点和适用场景,如单点飞行时间法适合远距离扫描,色散共焦法可扫描多种物体 [30][34] - 立体视觉 3D 成像从不同视点获取图像重构目标物体 3D 结构或深度信息,可通过单目、双目、多目视觉、光场 3D 成像实现,各有其原理和应用场景 [37] - 3D 视觉成像方法比较:ToF 相机、光场相机体积小、实时性好,但存在精度低或成本高问题;结构光投影 3D 系统精度和成本适中,有应用前景;被动立体视觉 3D 成像在工业领域有应用但场合有限;开发成本低廉、精度适中的被动单目 3D 成像系统是 Eye - In - Hand 系统的最佳方案 [48] 应用场景 - 3D 高精度扫描用于精密物件扫描与测量,在工业制造中可检测产品质量,结合三维设计与 3D 打印技术应用于多领域,如先临三维的相关扫描仪有出色表现 [50] - 机器人领域智能优化升级:3D 视觉赋予工业机器人强大感知能力,实现高精度操作,提高生产柔性和自动化程度;在人形机器人领域,帮助机器人实现路径规划、物体抓取与操作、人机交互等功能,如奥比中光的技术助力机器人实现多种功能,北京人形机器人创新中心的“天工 Ultra”配置深度相机提高感知和安全能力 [58][59][63] - 智能物流与仓储管理:3D 视觉技术用于货物识别、定位和测量,实现自动化分拣、码垛和存储,合理规划仓库空间,还可用于库存盘点和货物状态监测,如迈尔微视的视觉解决方案在多个关键场景落地应用 [64] - 生物识别:奥比中光在支付和智能家居安防领域提供 3D 视觉解决方案,如 3D 刷脸支付和 3D 人脸辨识门锁门禁系统 [69] 3D 视觉算法 3D 点云数据在机器人大模型中的优势 - 增强空间推理能力,提升任务成功率:基于点云的方法在成功率和平均排名上超越 RGB 和 RGB - D 方法,注入 3D 点云数据的 VLA 模型能提供更全面空间信息,解决 2D 模型空间感知局限,提高任务成功率 [3][73] - 提高少样本多任务学习能力:PointVLA 利用点云数据丰富信息,在少量训练样本下完成多个不同任务,降低数据采集和训练成本,在真实世界实验中表现出优势 [79] - 具备实际与照片区分能力:PointVLA 基于 3D 点云数据能区分真实物体和照片,避免错误操作,提高系统安全性和可靠性 [80] - 增强泛化能力:3D 点云数据在不同相机视角、光照条件、视觉外观变化下鲁棒性更强,在相关实验中表现优于其他方法,在长时域打包任务中也有良好性能 [83] 机器人视觉图像数据获取与 3D 传感器技术应用 - 机器人视觉数据获取方式与形式:数据采集向高精度、多模态方向发展,主流厂商采用多模态传感器集成,开源数据集为算法训练提供标准化测试环境 [88] - 主要的数据形式与特征:主要数据形式有 3D 点云与深度图、RGB - D 图像等,多模态传感器融合成趋势 [90] - 视觉数据驱动的机器人训练流程:包括数据采集与预处理、算法训练与优化、部署与实时控制几个阶段,通过合成数据扩充训练集,采用 AI 强化学习等方式训练机器人 [91] - 3D 视觉传感器在机器人中的核心作用:成为人形机器人“感知 - 决策 - 执行”链路的核心,体现在环境感知与建模、动作规划与执行、市场驱动与技术趋势几方面,市场需求持续增长,多传感器融合成主流 [92] 3D 传感器算法框架 - Intel RealSense:以开源 SDK 2.0 为核心,统一管理多模态硬件,具有跨平台兼容性与灵活生态,在不同技术方面有不同实现方式和应用场景,但在户外强光环境和复杂场景下有一定局限性 [94] - 奥比中光:以自研 MX 系列芯片为核心构建闭环体系,核心竞争力源于硬件级深度处理与多模态融合技术,在不同技术方面有独特优势,在场景化应用中展现出强大环境适应性 [100] - 核心技术差异与场景适配性分析:两者在技术路线与市场定位上互补,硬件架构和算法生态有差异,影响场景适配性,Intel RealSense 适合轻量场景,奥比中光适合对精度与鲁棒性要求严苛的领域 [104] 投资建议 - 关注 3D 视觉领域的领先公司奥比中光 [5][106]
凯格精机(301338) - 2025年4月28日投资者关系活动记录表
2025-04-28 20:56
投资者关系活动基本信息 - 活动类别为特定对象调研、电话会议及其他 [1] - 参与单位及人员有平安基金等34位投资者 [1] - 活动时间为2025年4月28日下午19:00 - 20:00,地点在公司会议室 [1] - 上市公司接待人员有董事会秘书邱靖琳、投关经理江正才、证券事务代表刘丹 [1] 2025年一季度业绩情况 - 营业收入19,655.83万元,同比增长27.23%;归属于母公司股东的净利润3,320.97万元,同比增长208.34%;扣除非经常性损益的净利润3,146.35万元,同比增长235.72%,且连续4个季度环比增长 [2] - 收入增长原因系下游消费电子需求回暖、AI服务器需求增长、新能源车渗透率提升带来电子装联设备需求增长 [2] - 净利润同比、环比增长较快原因是毛利率提升,包括部分业务收入中高端产品占比提升和高毛利率业务营收结构占比提升 [2] 公司实验室情况 - 成立2025实验室,目的是攻克研发底层需求的算法模型,依靠工艺数据和材料学建立工业AI模型,如关联关系模型和自我补偿模型 [2] 研发进展情况 - 2023年度、2024年度及2025年一季度研发投入营收占比分别为10.06%、9.12%、9.88% [2] - 截至2024年12月31日,已取得各项专利212项,2024年度新增授权发明专利18项、实用新型专利30项 [2] - 2024年度研发中心进行多项技术创新与应用,如AI视觉模型应用、低代码视觉平台开发、3D视觉应用、电气集成开发方式升级、控制驱动产品开发、整线技术研发储备 [2][3] 特定设备情况 - SIC晶圆老化设备用于第三代半导体晶圆在高温环境下测试芯片长时间稳定性,为后段封装提供合格芯片 [3] - SIC KGD分选设备用于第三代半导体芯片测试并分选,满足多领域芯片电性能测试需要,提高产品质量和可靠性,应用于新能源汽车等领域 [3] 2025年经营计划 - 坚持创新,加大研发中心投入,完善共性技术及模块建设,深化人才梯队培养,优化人员结构,完善考核与激励机制 [3] - 面向新应用场景推出新产品,鼓励申报发明专利,参与标准与规范编制,巩固行业地位 [3]
凯格精机:去年净利润同比增逾三成
证券时报网· 2025-04-25 19:30
财务表现 - 2024年营业收入85660.20万元,同比增长15.75% [1] - 归属于母公司股东的净利润7051.62万元,同比增长34.12% [1] - 扣非净利润6358.16万元,同比增长60.25% [1] - 综合毛利率32.21%,同比增加2.38个百分点 [1] - 营业收入连续三个季度环比增长 [1] - 合同负债期末较期初增长87.02%,在手订单饱满 [1] 增长驱动因素 - 下游消费电子需求回暖,AI服务器需求增长,新能源车渗透率提升带动电子装联设备需求 [1] - 高毛利率业务收入结构占比提升 [1] - 封装设备优化设计提升毛利率9.18个百分点 [1] 研发创新 - AI视觉模型应用于封装设备的芯片检测、缺陷检测、点胶机胶点检测、植球机缺陷检测 [2] - 3D视觉应用于五轴点胶机的胶路引导与检测,提高精度和效率 [2] - 储备先进封装领域"印刷+植球+检测+补球"整线技术 [2] - 新增授权发明专利18项、实用新型专利30项 [2] - 与华为联合申请印检贴一体机发明专利 [2] 产品布局 - SIP封装、半导体封测及汽车电子领域交付取得新进展 [2] - 储备第三代半导体领域SIC晶圆老化设备及SICKGD分选设备 [2] - 成功开拓光通讯行业应用场景,推出800G光模块自动化线体 [2] 经营策略 - 践行"提质增效",坚持开源节流 [1] - 通过研发创新、产品拓展、管理优化、人才培养提升经营质量 [1] - 2025年坚持"强攻击抓机会",提升市场份额 [2] - 持续推进精益与高效运营,向流程要效率,向创新要利润,向管理要效益 [2]
剪枝60%不损性能!上海AI Lab提出高斯剪枝新方法,入选CVPR 2025
量子位· 2025-04-09 16:58
3D高斯泼溅技术优化 - 三维高斯泼溅(3D Gaussian Splatting)是当前3D视觉领域最常用的算法之一,可实现实时高质量渲染,但存在冗余高斯点问题,单个重建场景可能包含数百万个高斯点 [1] - 冗余高斯点降低了训练和渲染速度,并导致显著的内存消耗 [2] MaskGaussian创新方法 - 上海AI Lab研究团队提出MaskGaussian,将掩码融合进光栅化过程,首次为被使用和未被使用的高斯同时保留梯度 [2] - MaskGaussian支持从头开始训练和对现有高斯进行微调,在不影响重建质量的情况下减少高斯点数 [3] - 在Mip-NeRF360、Tanks & Temples和Deep Blending数据集上分别剪枝了62.4%、67.7%和75.3%的高斯点,性能损失可忽略不计 [5][28] 技术实现细节 - 传统剪枝方法存在局限性:手工设计的重要性评分方法需要扫描所有训练图像,可学习掩码方法可能导致次优重建效果 [6] - MaskGaussian为每个高斯点学习掩码分布,通过采样生成二值掩码,所有高斯点进行标准溅射并和掩码一起进入渲染计算 [8] - 修改CUDA渲染器使掩码为1和0的高斯都能获取正确梯度,计算其对场景的贡献影响 [9][18] - 掩码光栅化前向过程保留溅射的α完整性,反向过程通过梯度公式更新掩码分布 [14][20][21] 性能表现 - 在Mip-NeRF360数据集上,MaskGaussian的PSNR为27.43,SSIM为0.811,LPIPS为0.227,高斯点数量减少至1.205百万,FPS提升至384.7 [29] - 在Tanks & Temples数据集上,高斯点数量减少至0.590百万,FPS提升至558.3 [29] - 在Deep Blending数据集上,高斯点数量减少至0.694百万,FPS提升至637.1 [29] - 内存消耗显著降低,例如在counter场景中从5.41GB降至3.53GB [30]