Workflow
视觉
icon
搜索文档
视觉感知技术机器人龙头冲刺港股,割草机器人已卖出15000台
证券时报网· 2025-06-02 21:13
公司概况 - 深圳乐动机器人股份有限公司正式向港交所递交招股书拟在香港主板挂牌上市 [1] - 公司成立于2017年是一家以感知智能为基础的全栈式智能机器人公司 [1] - 公司打造了以视觉感知为核心的智能机器人基础设施并赋能于各类智能机器人应用场景 [1] - 2024年按营业收入计公司是全球最大的以视觉感知技术为核心的智能机器人公司 [1] - 2024年搭载公司视觉感知技术的智能机器人数量超过600万台 [1] - 2024年公司DTOF激光雷达出货量超过72万台位居行业第一 [1] 技术发展 - 视觉感知技术和产品是公司的第一增长曲线 [1] - 2018年公司推出第一代激光雷达和第一代SLAM算法并应用于扫地机器人 [1] - 公司开发了全球首款消费级Mini DTOF雷达 [1] - 智能割草机器人成为公司第二增长曲线 [2] - 2024年公司实现第一代智能割草机器人量产首年销量突破10000台 [2] - 2025年实现第二代智能割草机器人量产融合AI大模型算法 [2] - 截至2025年5月23日割草机器人总销量已超过15000台 [2] 财务表现 - 2022年至2024年营业收入分别为2.34亿元2.77亿元和4.67亿元 [2] - 2022年至2024年净亏损分别为7313.2万元6849.1万元和5648.3万元 [2] 融资与股权 - 公司获得华业天成源码资本铭石投资等知名机构投资 [2] - 阿里CEO吴泳铭控制的圆璟鼎恒持股1.79% [2] 募资用途 - 加强智能机器人视觉感知技术研发 [3] - 品牌建设与国际拓展 [3] - 优化生产能力和扩充产能 [3] - 探索潜在投资和收购机会 [3] - 用作营运资金及一般公司用途 [3]
CVPR 2025 | 解决XR算力瓶颈,FovealSeg框架实现毫秒级IOI分割
机器之心· 2025-06-02 13:22
本文共同第一作者为纽约大学研究生 Hongyi Zeng 和Wenxuan Liu。合作作者为 Tianhua Xia、Jinhui Chen、Ziyun Li。通讯作者为纽约大学电子工程系和计算 机系教授 Sai Qian Zhang,研究方向为高效人工智能,硬件加速和增强现实。 在 XR 正逐步从概念走向落地的今天,如何实现 "按用户所视,智能计算" 的精准理解,一直是视觉计算领域的核心挑战之一。 最近,一项来自 纽约大学和 Meta Reality Labs 的联合研究引发了行业关注:Foveated Instance Segmentation —— 一种结合眼动追踪信息进行实例分割的新方法, 已被 CVPR 2025 正式接收 。 论文连接:https://arxiv.org/pdf/2503.21854 1. 从算力瓶颈谈起 在当下主流的 AR / VR 头显中,内置相机往往具备 720 P、1080 P 乃至 1440 P 的拍摄能力,但要想在如此高分辨率的画面上做实例分割,推理延迟常常飙升至数 百毫秒甚至秒级,远超人眼在交互中对时延(50–100 ms)所能接受的舒适阈值。论文 Foveated ...
5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文
量子位· 2025-06-02 12:13
视觉语言大模型的空间推理能力 - 当前视觉语言大模型(VLMs)在大规模图文数据中学习到的空间信息是片段化的,仅限于静态视角的理解,缺乏多维度、多视角的空间推理能力 [1] - 面对需要多视角空间推理的任务时,模型表现不佳,缺乏空间感与换位思考能力 [2][20] - 具备稳健的空间推理能力与视角理解能力的AI系统才能成为与人类协作的智能体 [3] ViewSpatial-Bench基准体系 - 研究团队提出首个系统评估VLM多视角多任务下空间定位能力的基准体系ViewSpatial-Bench,涵盖五种任务类型,覆盖相机和人类双重视角 [4][7] - 基准包含5700个问答对,通过自动化3D标注流水线生成精确方向标签,覆盖丰富3D场景 [4][16] - 五大任务包括:物体相对方向识别、人物视线方向识别(相机视角),以及从人类视角出发的三类任务(物体相对方向识别、人物视线方向识别、场景模拟的相对方向识别) [9][10][11][12][13][14] 主流模型的表现评估 - 评估显示GPT-4o、Gemini 2.0等主流模型在空间关系理解上表现不足,整体准确率不高 [19] - 模型在摄像头视角下的人物面朝方向判断任务平均准确率仅为25.6%,远低于物体相对方向判断的38.9%,但在人物视角下趋势反转 [22] - 大多数模型在人物视角任务上表现略优于摄像头视角,如GPT-4o在人物视角平均准确率为36.29%,高于摄像头视角的33.57% [25] Multi-View Spatial Model(MVSM) - 研究团队开发MVSM专门用于跨视角空间理解优化,采用自动化空间标注框架生成约43000个高质量样本 [27][28] - MVSM相比骨干模型Qwen2.5-VL实现46.24%的绝对性能提升,验证针对性训练的有效性 [5][28] - 在VSI-App评估中,MVSM在室内场景表现提升20%,户外场景提升4.00%,展示处理动态轨迹和人机交互场景的能力 [32] 研究意义与未来方向 - ViewSpatial-Bench和MVSM为多模态模型空间理解能力提供系统评估工具,重构视角采择建模方式 [33] - 研究揭示当前训练语料在视角分布上存在结构性不平衡,为未来数据构建和模型优化指明方向 [26] - 更聪明的空间感知是下一代机器人与多模态助手的关键一步 [34]
一线调研丨从4小时到20分钟 青岛港科技升级货物“秒通关”
央视新闻· 2025-06-02 11:01
港口运营与吞吐量增长 - 青岛港一季度集装箱吞吐量同比增速达7.4% [1] - 前湾港区26个泊位靠满货轮,装卸效率提升,集装箱轮提前4小时离港 [1][3] - 航线从每两周一班调整至每周一班,货代公司业务量暴增 [1] 外贸市场动态与策略调整 - 中美关税落地后,青岛港对美出口货运订单增加,6-9月为美国传统进货旺季 [3] - 外贸企业加速开拓欧洲、非洲、东南亚市场,减少对单一市场依赖 [5] - 青岛口岸对共建"一带一路"国家出口值达2780.7亿元,增速15.5%,对中东国家出口增速20.4% [24] 港口服务与效率提升 - 青岛港优化船舶、货物手续流程,货物集港时间提前1天,开辟快速通道 [10] - 线上化服务将进口提箱业务办理时间从4小时压缩至20分钟 [12] - 自动化码头通过AI技术迭代,装卸时间缩短20秒/次,每日多释放3小时作业窗口 [14][16] 新航线拓展与区域联动 - 5月开通三条外贸航线,覆盖南美主要经济体及中东枢纽港口,预计年新增吞吐量超20万标箱 [18] - 新航线增强外贸供应链韧性,带动物流仓储、加工贸易等临港产业发展 [20] - 青岛港至秘鲁直达航线累计开行135航次,带动对秘鲁出口增速54.5% [22][24] 区域经济与物流网络 - 黄河流域9省区1-4月进出口总额2.05万亿元,同比增长8.8% [24] - 沿黄九省区布局52个内陆港,实现"出海口搬到内陆企业家门口" [26] - 内陆与海洋经济联动加强,如青海出口班列与陕西进口矿石运输 [26]
新石器余恩源:无人配送车竞争刚刚开始,唯有竞争才能构建高效生态系统
每日经济新闻· 2025-06-01 14:54
行业增长 - 2025年无人配送车行业迎来爆发式增长,发展速度达到去年的10倍 [1] - 新石器目前每月交付无人车超1000辆,预计二季度至三季度单月交付量将突破2000辆 [1] - 4月份单月交付量已超过2024年的全年总和 [1] 应用场景拓展 - 无人配送车已覆盖城市密集区域至乡村地区,运行范围从非机动车道拓展至机动车道 [3] - 除3立方米小型车、6立方米中型车外,更大容积车型正在研发中 [3] - 配送距离显著提升,单程70公里至80公里的线路已大量出现,突破早期3公里左右的局限 [3] 技术路线 - 新石器自2021年起选择视觉技术路线,目前已将BEV和OCC算法应用于无人车 [3] - 今年下半年将基于视觉算法实现无图技术 [3] - 应用场景从快递行业的计划性物流向实时调度物流延伸 [3] 业务规划 - 预计到今年底,新石器在快递以外场景的无人车铺设量将达4000至5000辆 [3] - 大部分用于实时物流调度 [3] - 未来将在快递、产业集群、乡村等更多场景中释放价值,最终实现全球化规模运营 [3] 行业竞争 - 美团、京东、阿里等巨头及白犀牛等创业公司已入局 [3] - 行业竞争刚开始,通过竞争构建高效生态系统,实现成本与效率的最优解 [3]
SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
机器之心· 2025-06-01 11:30
核心观点 - 研究发现监督微调(SFT)在多模态推理中可能阻碍学习,导致伪推理路径,而强化学习(RL)则促进真正的多模态推理 [3][9] - 传统两阶段训练范式(SFT+RL)在视觉语言模型(LVLM)中可能导致性能下降,7B模型相对性能下降47% [11][13] - 纯RL训练方案更具优势,VLAA-Thinker-Qwen2.5VL-3B模型在Open LMM推理榜单4B量级模型中位列第一,以1.8%优势刷新纪录 [15] 数据集构建 - 研究者构建了首个支持SFT与RL的全方位高质量图文推理数据集VLAA-Thinking,包含203,182条原始数据和144,895条处理后的数据 [4][5] - 数据集包含基于R1模型"先思考后回答"范式生成的完整推理链条,SFT分支包含多模态思维链样本,RL分支筛选更具挑战性的样本 [5] - 数据处理流程分为六阶段:元数据收集→图像描述生成→基于R1的知识蒸馏→答案重写→人工验证→数据划分 [6] SFT与RL对比研究 - SFT提高了模型在标准任务中的性能,但在增强复杂推理方面能力欠缺,可能诱发"伪推理路径"和"伪aha moment" [9] - 对已对齐模型使用SFT+GRPO会导致平均12.7%的性能下降,且模型规模差异影响甚微 [13] - SFT虽可帮助未对齐模型遵循指令,但其模仿式推理会限制RL阶段的探索空间 [15] GRPO训练优势 - 强化学习在增强推理能力方面表现出色,GRPO在文本数学推理任务中比其他方法更有效、更高效 [17] - 研究者提出了混合奖励框架,包含五种可验证的奖励类型,涵盖视觉感知和视觉推理任务 [19] - 直接使用GRPO训练的模型在视觉语言推理任务中显著优于其基础模型 [31] SFT对GRPO的影响 - SFT与多模态推理中的GRPO不兼容,在GRPO训练前进行SFT的模型性能比仅使用GRPO训练的模型更差,平均下降8.9% [21] - SFT对指令模型的性能损害比对没有指令跟随能力的基础模型更大,Qwen2VL-Inst性能比Qwen2VL-Base下降7.7% [21] - 较小的SFT数据集仍然会影响GRPO的性能 [23] 模型性能分析 - 响应长度、奖励分数与性能表现无显著相关性,SFT模型虽能获得更高初始奖励和更长响应,但实际表现逊于纯RL训练模型 [15][24] - SFT仅提供了RL训练的一个更高的"下限",但可能会降低"上限",限制了模型的探索路径 [26] - 经过更好指令调优的模型在GRPO训练后表现更佳,说明高质量的指令调优能够增强模型在强化学习后的推理能力 [31]
奥普特:机器视觉领域领先企业,拓展人工智能视觉算法软件-20250530
国信证券· 2025-05-30 17:48
报告公司投资评级 - 首次覆盖给予“优于大市”评级 [1][57] 报告的核心观点 - 公司立足机器视觉技术,是机器视觉光源制造业单项冠军,积极布局人工智能视觉算法,未来有望显著受益于具身智能产业发展 [4][6] - 预计 2025 - 2027 年归属母公司净利润分别为 1.81/2.42/3.00 亿元,对应 PE 57/43/35 倍,一年期合理估值为 103.91 - 118.75 元(对应 2025 年 PE 70 - 80x) [6][55][57] 公司概况 - 奥普特成立于 2006 年,是国内较早进入机器视觉领域的企业之一,拥有完整的机器视觉核心软硬件产品,自主产品线覆盖视觉算法库、智能视觉平台等多个方面,产品定位于中高端市场,应用于多个领域,已建立稳定客户群体 [9][10][29] - 公司发展重心包括拓展自动化核心零部件布局、推动工业 AI 应用场景和方案落地、拓展人形机器人等新兴行业需求 [2] 财务情况 - 2019 - 2024 年公司收入从 5.3 亿元增长至 9.1 亿元,CAGR 11.68%,2025 年一季度收入 2.7 亿元,同比增长 18.09%;2019 - 2024 年公司净利润从 2.1 亿元下滑至 1.4 亿元,CAGR - 8.0%,2025 年一季度净利润 0.58 亿元,同比增长 0.97% [32] - 2019 - 2024 年公司毛利率在 64% - 74%区间,2021 年以来企稳;净利率在 15 - 39%范围内波动,整体呈下滑趋势,主要因研发和销售费用率增长 [36] - 公司研发投入整体呈上升趋势,研发费用率从 2019 年的 11.09%增长至 2024 年的 23.81%;ROE 有所下滑但仍维持在合理水平,2025 年一季度公司 ROE 2.0%,较去年同期持平 [38] 业务布局 传统主业 - 核心技术包括工业 AI 算法、传统视觉算法等,产品线拓展完善,持续强化光源及其控制技术等,拓展传感器技术和高端超精密运动部件驱动及驱控一体技术,加强自动化核心零部件领域产品竞争力 [2] AI 技术 - 推出 DeepVision 3 与 Web 版 AI 平台,突破底层算法等,构建高效视觉生态平台,降低 AI 项目实施门槛和成本,提高开发效率 [3][20][22] - 基于海量工业数据和行业经验打造高精度轻量化 AI 模型,在低算力设备上运行流畅,拓宽应用边界,自研高可信检测算法降低漏检与误检率,小样本学习与数据生成技术解决工业数据稀缺难题 [21] - AI 产品与解决方案覆盖锂电、3C 电子、半导体等领域,2024 年实施规模以上项目数百项,检测产品数十亿件 [3] 人形机器人领域 - 发挥工业机器人领域经验和技术优势,着手研发面向人形机器人等新型终端的视觉模组和解决方案,规划了小型化的散斑结构光系列和 TOF 相机系统 [4][30] - 计划加大在精密运动和机器人关键部件的研发投入,形成“视觉 + 传感 + 运动控制”的综合能力 [4][31] 盈利预测 - 假设 2025 - 2027 年机器视觉核心部件收入分别为 9.13/10.95/13.69 亿元,毛利率均为 65.08%;机器视觉配件收入逐年增长,分别为 1.28/1.47/1.77 亿元,毛利率均为 53.73% [44] - 预计 2025 - 2027 年公司营收为 10.42/12.44/15.47 亿元,同比增长 14.33%/19.35%/24.37%,毛利率 63.63%/63.69%/63.75%,毛利 6.63/7.92/9.86 亿元;归母净利润分别为 1.81/2.42/3.00 亿元,同比增速 33.16%/33.11%/24.41% [45][47] 估值与投资建议 绝对估值 - 假设无杠杆 Beta 为 1.00,无风险利率 2.65%,股票风险溢价 6.50%,债务成本 4.50%,永续增长率 2.00%,测算得出加权平均资本成本 WACC 为 9.15%,采用 FCFF 估值法得出公司合理估值为 51.73 - 65.18 元 [50] 相对估值 - 选取凌云光、奥比中光为可比公司,预计 2025 - 2027 年归属母公司净利润分别为 1.81/2.42/3.00 亿元,对应 PE 57/43/35 倍,一年期合理估值为 103.91 - 118.75 元(对应 2025 年 PE 70 - 80x),以相对估值法为主对公司进行估值 [55] 投资建议 - 首次覆盖给予“优于大市”评级 [57] 行业情况 - 我国机器视觉行业启蒙于 20 世纪 90 年代,目前处于快速发展阶段,应用范围涵盖 3C 电子、锂电等各个领域,2023 年市场规模 185.12 亿元,同比增长 8.49%,至 2028 年有望超过 395 亿元 [26][29]
具身进化·无界未来:这场论坛引领具身智能模型革命新浪潮
机器之心· 2025-05-30 17:33
具身智能技术发展 - 具身AI模型与人形机器人结合为AGI进入物理世界提供新可能,多模态大模型和世界模型推动具身智能进化 [1] - 新型大物理模型(如CoA行动链)在泛化性、端到端训练和统一大小脑功能上优于传统思维链(CoT),并已开发世界模型、仿真平台等工具 [6] - 脉冲神经网络实现机械臂类脑仿生控制,通过仿生算法和计算神经结构达成复杂环境下的自适应与灵巧操作 [10] 产业应用与商业化路径 - 智能机器人需满足V(感知)-L(理解)-A(行动)闭环,产品化需聚焦用户场景划分、技术交叉点及低失效成本场景 [8] - 视觉大模型(VLM)通过开源强化学习框架提升机器人环境感知与决策能力,联汇科技展示VLM-R1框架及终端联动案例 [12] - 模块化关节设计颠覆传统机器人开发,星际光年开源方案使灵巧手成本与周期显著降低 [12] 行业生态与未来展望 - 张江依托"一中心、两基地"布局推动人形机器人产业加速,集聚科研资源完善政策环境 [4] - 世界模型和Scaling Law被视为具身智能算法潜力方向,生成式AI可缩小虚拟与现实差距 [13] - 工业搬运、商超展厅为优先落地场景,预计5-10年内或进入C端家庭市场 [13] - 合成数据可百倍放大真实数据价值,解决训练数据稀缺问题,仿真数据在泛化性和采集效率上优势显著 [14]
奥普特(688686):机器视觉领域领先企业,拓展人工智能视觉算法软件
国信证券· 2025-05-30 16:16
报告公司投资评级 - 首次覆盖给予“优于大市”评级 [1][57] 报告的核心观点 - 公司立足机器视觉技术,是机器视觉光源制造业单项冠军,积极布局人工智能视觉算法,未来有望显著受益于具身智能产业发展 [4] 公司概况 - 奥普特成立于2006年,是国内较早进入机器视觉领域的企业之一,拥有完整的机器视觉核心软硬件产品,自主产品线覆盖视觉算法库、智能视觉平台等,以核心光学技术为基础,加大在先进工业传感器领域研发投入,在运动产品领域布局,能为客户提供自动化核心零部件产品及解决方案 [9] - 公司主营业务为机器视觉核心软硬件产品的研发、生产、销售,以机器视觉软硬件产品为主,向传感器、运动产品线延伸,助力客户精益生产、降本增效 [8] 财务情况 - 2019 - 2024年公司收入从5.3亿元增长至9.1亿元,CAGR 11.68%,2025年一季度收入2.7亿元,同比增长18.09%;2019 - 2024年公司净利润从2.1亿元下滑至1.4亿元,CAGR -8.0%,2025年一季度净利润0.58亿元,同比增长0.97% [32] - 2019 - 2024年公司毛利率在64% - 74%区间,2021年以来企稳;净利率在15 - 39%范围内波动,整体呈下滑趋势,主要因拓展新技术和新产品,研发和销售费用率呈增长趋势 [36] - 公司研发投入整体呈上升趋势,研发费用率从2019年的11.09%增长至2024年的23.81%;ROE有所下滑但仍维持在合理水平,2025年一季度ROE 2.0%,较去年同期持平 [38] 业务发展 传统主业 - 发展重心包括拓展自动化核心零部件布局、推动工业AI应用场景和方案落地、拓展人形机器人等新兴行业需求;核心技术有工业AI算法等,产品线拓展完善,强化多项技术,拓展传感器技术和高端超精密运动部件驱动及驱控一体技术,加强自动化核心零部件领域产品竞争力 [2] AI技术 - 推出两款基于人工智能工业视觉软件DeepVision 3与Web版AI平台,突破底层算法等,构建高效视觉生态平台,降低AI项目实施门槛和成本、提高开发效率;AI产品与解决方案覆盖锂电、3C电子、半导体等领域,2024年实施规模以上项目数百项,检测产品数十亿件 [3] 新兴领域 - 发挥工业机器人领域经验和技术优势,拓展人形机器人等新兴热点领域对机器视觉的需求,着手研发面向人形机器人等新型终端的视觉模组和解决方案;在消费级机器人领域规划小型化的散斑结构光系列和TOF相机系统;计划加大精密运动和机器人关键部件研发投入,形成“视觉 + 传感 + 运动控制”综合能力 [4] 盈利预测 - 假设2025 - 2027年机器视觉核心部件收入分别为9.13/10.95/13.69亿元,毛利率均为65.08%;机器视觉配件收入分别为1.28/1.47/1.77亿元,毛利率均为53.73% [44] - 预计2025 - 2027年公司营收为10.42/12.44/15.47亿元,同比增长14.33%/19.35%/24.37%,毛利率63.63%/63.69%/63.75%,毛利6.63/7.92/9.86亿元;归母净利润分别为1.81/2.42/3.00亿元,同比增速33.16%/33.11%/24.41% [45][47] 估值与投资建议 绝对估值 - 假设无杠杆Beta为1.00,无风险利率2.65%,股票风险溢价6.50%,债务成本4.50%,永续增长率2.00%,测算得出加权平均资本成本WACC为9.15%,采用FCFF估值法得出公司合理估值为51.73 - 65.18元 [50] 相对估值 - 选取凌云光、奥比中光为可比公司,预计2025 - 2027年归属母公司净利润分别为1.81/2.42/3.00亿元,对应PE 57/43/35倍,一年期合理估值为103.91 - 118.75元(对应2025年PE 70 - 80x),以相对估值法为主对公司进行估值 [55] 投资建议 - 预计2025 - 2027年归属母公司净利润分别为1.81/2.42/3.00亿元,对应PE 57/43/35倍,一年期合理估值为103.91 - 118.75元(对应2025年PE 70 - 80x),首次覆盖给予“优于大市”评级 [57]
多方联动 潘家园眼镜发力双节消费
北京商报· 2025-05-30 16:01
活动概况 - 第二届潘家园眼镜节于5月30日至6月2日举办,覆盖端午假期和儿童节,以北京眼镜城为主会场,联动6个分会场[1] - 活动通过多会场联动模式让消费者实现不同品牌、款式眼镜的挑选与对比,完善购镜体验[1] - 开幕式推出潘家园眼镜吉祥物IP金丝雀"镜镜",为品牌注入科技感形象,旨在拉近与消费者距离[1] 政企医合作 - 潘家园眼镜行业联盟与北京爱尔英智眼科医院签署《视觉健康共建合作协议》,将在眼部健康检查、公益救助、科普教育等领域深度合作[1] - 医院将为眼镜节提供专业眼部健康检查服务,帮助消费者科学选购眼镜,并计划开展特殊群体公益救助活动[1] - 未来将定期举办讲座、线上科普等活动普及科学用眼知识,提升全民视觉健康意识[1] - 政企医三方联动模式是潘家园眼镜产业发展创新之举,政府引导规范市场,行业联盟整合资源,医疗机构提供专业支持[2] 产业发展 - 潘家园已成为中国眼镜行业重要地标和商贸核心集散地,是中国眼镜产业转型升级的"缩影"与"窗口"[2] - 去年成立眼镜行业联盟通过引导各方参与消费环境治理、规范市场秩序,有效促进消费增长[2] - 本届眼镜节进一步发挥产业聚集优势,结合前沿技术展示与趣味消费场景,为消费者带来实惠[2] - 潘家园不仅是文化消费聚集地,更是北京配眼镜首选地,活动汇聚全球优质品牌促进传统行业与数字化、时尚化融合[2] 未来规划 - 潘家园街道将以眼镜节为契机持续优化营商环境,强化消费者权益保障,推动商圈能级提升[2] - 计划打造视觉产业生态链,吸引上下游企业入驻形成产业集群效应,推动眼镜行业蓬勃发展[2] - 目标是通过产业发展引领行业潮流,为朝阳区经济高质量发展注入新动能[2]