视觉

搜索文档
一线调研丨从4小时到20分钟 青岛港科技升级货物“秒通关”
央视新闻· 2025-06-02 11:01
港口运营与吞吐量增长 - 青岛港一季度集装箱吞吐量同比增速达7.4% [1] - 前湾港区26个泊位靠满货轮,装卸效率提升,集装箱轮提前4小时离港 [1][3] - 航线从每两周一班调整至每周一班,货代公司业务量暴增 [1] 外贸市场动态与策略调整 - 中美关税落地后,青岛港对美出口货运订单增加,6-9月为美国传统进货旺季 [3] - 外贸企业加速开拓欧洲、非洲、东南亚市场,减少对单一市场依赖 [5] - 青岛口岸对共建"一带一路"国家出口值达2780.7亿元,增速15.5%,对中东国家出口增速20.4% [24] 港口服务与效率提升 - 青岛港优化船舶、货物手续流程,货物集港时间提前1天,开辟快速通道 [10] - 线上化服务将进口提箱业务办理时间从4小时压缩至20分钟 [12] - 自动化码头通过AI技术迭代,装卸时间缩短20秒/次,每日多释放3小时作业窗口 [14][16] 新航线拓展与区域联动 - 5月开通三条外贸航线,覆盖南美主要经济体及中东枢纽港口,预计年新增吞吐量超20万标箱 [18] - 新航线增强外贸供应链韧性,带动物流仓储、加工贸易等临港产业发展 [20] - 青岛港至秘鲁直达航线累计开行135航次,带动对秘鲁出口增速54.5% [22][24] 区域经济与物流网络 - 黄河流域9省区1-4月进出口总额2.05万亿元,同比增长8.8% [24] - 沿黄九省区布局52个内陆港,实现"出海口搬到内陆企业家门口" [26] - 内陆与海洋经济联动加强,如青海出口班列与陕西进口矿石运输 [26]
新石器余恩源:无人配送车竞争刚刚开始,唯有竞争才能构建高效生态系统
每日经济新闻· 2025-06-01 14:54
行业增长 - 2025年无人配送车行业迎来爆发式增长,发展速度达到去年的10倍 [1] - 新石器目前每月交付无人车超1000辆,预计二季度至三季度单月交付量将突破2000辆 [1] - 4月份单月交付量已超过2024年的全年总和 [1] 应用场景拓展 - 无人配送车已覆盖城市密集区域至乡村地区,运行范围从非机动车道拓展至机动车道 [3] - 除3立方米小型车、6立方米中型车外,更大容积车型正在研发中 [3] - 配送距离显著提升,单程70公里至80公里的线路已大量出现,突破早期3公里左右的局限 [3] 技术路线 - 新石器自2021年起选择视觉技术路线,目前已将BEV和OCC算法应用于无人车 [3] - 今年下半年将基于视觉算法实现无图技术 [3] - 应用场景从快递行业的计划性物流向实时调度物流延伸 [3] 业务规划 - 预计到今年底,新石器在快递以外场景的无人车铺设量将达4000至5000辆 [3] - 大部分用于实时物流调度 [3] - 未来将在快递、产业集群、乡村等更多场景中释放价值,最终实现全球化规模运营 [3] 行业竞争 - 美团、京东、阿里等巨头及白犀牛等创业公司已入局 [3] - 行业竞争刚开始,通过竞争构建高效生态系统,实现成本与效率的最优解 [3]
SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
机器之心· 2025-06-01 11:30
核心观点 - 研究发现监督微调(SFT)在多模态推理中可能阻碍学习,导致伪推理路径,而强化学习(RL)则促进真正的多模态推理 [3][9] - 传统两阶段训练范式(SFT+RL)在视觉语言模型(LVLM)中可能导致性能下降,7B模型相对性能下降47% [11][13] - 纯RL训练方案更具优势,VLAA-Thinker-Qwen2.5VL-3B模型在Open LMM推理榜单4B量级模型中位列第一,以1.8%优势刷新纪录 [15] 数据集构建 - 研究者构建了首个支持SFT与RL的全方位高质量图文推理数据集VLAA-Thinking,包含203,182条原始数据和144,895条处理后的数据 [4][5] - 数据集包含基于R1模型"先思考后回答"范式生成的完整推理链条,SFT分支包含多模态思维链样本,RL分支筛选更具挑战性的样本 [5] - 数据处理流程分为六阶段:元数据收集→图像描述生成→基于R1的知识蒸馏→答案重写→人工验证→数据划分 [6] SFT与RL对比研究 - SFT提高了模型在标准任务中的性能,但在增强复杂推理方面能力欠缺,可能诱发"伪推理路径"和"伪aha moment" [9] - 对已对齐模型使用SFT+GRPO会导致平均12.7%的性能下降,且模型规模差异影响甚微 [13] - SFT虽可帮助未对齐模型遵循指令,但其模仿式推理会限制RL阶段的探索空间 [15] GRPO训练优势 - 强化学习在增强推理能力方面表现出色,GRPO在文本数学推理任务中比其他方法更有效、更高效 [17] - 研究者提出了混合奖励框架,包含五种可验证的奖励类型,涵盖视觉感知和视觉推理任务 [19] - 直接使用GRPO训练的模型在视觉语言推理任务中显著优于其基础模型 [31] SFT对GRPO的影响 - SFT与多模态推理中的GRPO不兼容,在GRPO训练前进行SFT的模型性能比仅使用GRPO训练的模型更差,平均下降8.9% [21] - SFT对指令模型的性能损害比对没有指令跟随能力的基础模型更大,Qwen2VL-Inst性能比Qwen2VL-Base下降7.7% [21] - 较小的SFT数据集仍然会影响GRPO的性能 [23] 模型性能分析 - 响应长度、奖励分数与性能表现无显著相关性,SFT模型虽能获得更高初始奖励和更长响应,但实际表现逊于纯RL训练模型 [15][24] - SFT仅提供了RL训练的一个更高的"下限",但可能会降低"上限",限制了模型的探索路径 [26] - 经过更好指令调优的模型在GRPO训练后表现更佳,说明高质量的指令调优能够增强模型在强化学习后的推理能力 [31]
奥普特:机器视觉领域领先企业,拓展人工智能视觉算法软件-20250530
国信证券· 2025-05-30 17:48
报告公司投资评级 - 首次覆盖给予“优于大市”评级 [1][57] 报告的核心观点 - 公司立足机器视觉技术,是机器视觉光源制造业单项冠军,积极布局人工智能视觉算法,未来有望显著受益于具身智能产业发展 [4][6] - 预计 2025 - 2027 年归属母公司净利润分别为 1.81/2.42/3.00 亿元,对应 PE 57/43/35 倍,一年期合理估值为 103.91 - 118.75 元(对应 2025 年 PE 70 - 80x) [6][55][57] 公司概况 - 奥普特成立于 2006 年,是国内较早进入机器视觉领域的企业之一,拥有完整的机器视觉核心软硬件产品,自主产品线覆盖视觉算法库、智能视觉平台等多个方面,产品定位于中高端市场,应用于多个领域,已建立稳定客户群体 [9][10][29] - 公司发展重心包括拓展自动化核心零部件布局、推动工业 AI 应用场景和方案落地、拓展人形机器人等新兴行业需求 [2] 财务情况 - 2019 - 2024 年公司收入从 5.3 亿元增长至 9.1 亿元,CAGR 11.68%,2025 年一季度收入 2.7 亿元,同比增长 18.09%;2019 - 2024 年公司净利润从 2.1 亿元下滑至 1.4 亿元,CAGR - 8.0%,2025 年一季度净利润 0.58 亿元,同比增长 0.97% [32] - 2019 - 2024 年公司毛利率在 64% - 74%区间,2021 年以来企稳;净利率在 15 - 39%范围内波动,整体呈下滑趋势,主要因研发和销售费用率增长 [36] - 公司研发投入整体呈上升趋势,研发费用率从 2019 年的 11.09%增长至 2024 年的 23.81%;ROE 有所下滑但仍维持在合理水平,2025 年一季度公司 ROE 2.0%,较去年同期持平 [38] 业务布局 传统主业 - 核心技术包括工业 AI 算法、传统视觉算法等,产品线拓展完善,持续强化光源及其控制技术等,拓展传感器技术和高端超精密运动部件驱动及驱控一体技术,加强自动化核心零部件领域产品竞争力 [2] AI 技术 - 推出 DeepVision 3 与 Web 版 AI 平台,突破底层算法等,构建高效视觉生态平台,降低 AI 项目实施门槛和成本,提高开发效率 [3][20][22] - 基于海量工业数据和行业经验打造高精度轻量化 AI 模型,在低算力设备上运行流畅,拓宽应用边界,自研高可信检测算法降低漏检与误检率,小样本学习与数据生成技术解决工业数据稀缺难题 [21] - AI 产品与解决方案覆盖锂电、3C 电子、半导体等领域,2024 年实施规模以上项目数百项,检测产品数十亿件 [3] 人形机器人领域 - 发挥工业机器人领域经验和技术优势,着手研发面向人形机器人等新型终端的视觉模组和解决方案,规划了小型化的散斑结构光系列和 TOF 相机系统 [4][30] - 计划加大在精密运动和机器人关键部件的研发投入,形成“视觉 + 传感 + 运动控制”的综合能力 [4][31] 盈利预测 - 假设 2025 - 2027 年机器视觉核心部件收入分别为 9.13/10.95/13.69 亿元,毛利率均为 65.08%;机器视觉配件收入逐年增长,分别为 1.28/1.47/1.77 亿元,毛利率均为 53.73% [44] - 预计 2025 - 2027 年公司营收为 10.42/12.44/15.47 亿元,同比增长 14.33%/19.35%/24.37%,毛利率 63.63%/63.69%/63.75%,毛利 6.63/7.92/9.86 亿元;归母净利润分别为 1.81/2.42/3.00 亿元,同比增速 33.16%/33.11%/24.41% [45][47] 估值与投资建议 绝对估值 - 假设无杠杆 Beta 为 1.00,无风险利率 2.65%,股票风险溢价 6.50%,债务成本 4.50%,永续增长率 2.00%,测算得出加权平均资本成本 WACC 为 9.15%,采用 FCFF 估值法得出公司合理估值为 51.73 - 65.18 元 [50] 相对估值 - 选取凌云光、奥比中光为可比公司,预计 2025 - 2027 年归属母公司净利润分别为 1.81/2.42/3.00 亿元,对应 PE 57/43/35 倍,一年期合理估值为 103.91 - 118.75 元(对应 2025 年 PE 70 - 80x),以相对估值法为主对公司进行估值 [55] 投资建议 - 首次覆盖给予“优于大市”评级 [57] 行业情况 - 我国机器视觉行业启蒙于 20 世纪 90 年代,目前处于快速发展阶段,应用范围涵盖 3C 电子、锂电等各个领域,2023 年市场规模 185.12 亿元,同比增长 8.49%,至 2028 年有望超过 395 亿元 [26][29]
具身进化·无界未来:这场论坛引领具身智能模型革命新浪潮
机器之心· 2025-05-30 17:33
机器之心报道 机器之心编辑部 具身智能持续进化的浪潮下, "具身 AI 模型 +人形机器人"为 AGI 走进物理世界提供了更多可能。多模态大模型的兴起为具身 AI 注入强劲动力,世界模型 的出现也为具身智能训练和测试提供了新范式。如何让机器智能不仅「看懂」物理世界,更能像人类一样理解、规划并操作,是当下学术和业界共同面临的 挑战和机遇。 5 月 29 日,2025 张江具身智能开发者大会暨国际人形机器人技能大赛在上海浦东张江科学会堂顺利举行。作为大会重要组成模块, "具身·无界:智能模 型的范式创新与架构革命"论坛(以下简称"论坛")在上海市经济和信息化委员会、上海市浦东新区人民政府指导下,由上海张江(集团)有限公司主办, 上海张江数智经济发展有限公司、机器之心承办,上海市浦东新区工商联张江人工智能商会协办。 本场论坛汇聚顶尖技术专家、知名高校学者、具身智能明星厂商代表等 10 余位重磅嘉宾,行业领袖深度洞察,技术大咖同台论道,深入探讨具身 AI 与世 界模型、分层决策与端到端路线、具身智能 Scaling Law 等业界热点话题,带来 五 场精彩的主题演讲与一场高质量圆桌对话,论坛由机器之心副主编谢文 菲主 ...
奥普特(688686):机器视觉领域领先企业,拓展人工智能视觉算法软件
国信证券· 2025-05-30 16:16
报告公司投资评级 - 首次覆盖给予“优于大市”评级 [1][57] 报告的核心观点 - 公司立足机器视觉技术,是机器视觉光源制造业单项冠军,积极布局人工智能视觉算法,未来有望显著受益于具身智能产业发展 [4] 公司概况 - 奥普特成立于2006年,是国内较早进入机器视觉领域的企业之一,拥有完整的机器视觉核心软硬件产品,自主产品线覆盖视觉算法库、智能视觉平台等,以核心光学技术为基础,加大在先进工业传感器领域研发投入,在运动产品领域布局,能为客户提供自动化核心零部件产品及解决方案 [9] - 公司主营业务为机器视觉核心软硬件产品的研发、生产、销售,以机器视觉软硬件产品为主,向传感器、运动产品线延伸,助力客户精益生产、降本增效 [8] 财务情况 - 2019 - 2024年公司收入从5.3亿元增长至9.1亿元,CAGR 11.68%,2025年一季度收入2.7亿元,同比增长18.09%;2019 - 2024年公司净利润从2.1亿元下滑至1.4亿元,CAGR -8.0%,2025年一季度净利润0.58亿元,同比增长0.97% [32] - 2019 - 2024年公司毛利率在64% - 74%区间,2021年以来企稳;净利率在15 - 39%范围内波动,整体呈下滑趋势,主要因拓展新技术和新产品,研发和销售费用率呈增长趋势 [36] - 公司研发投入整体呈上升趋势,研发费用率从2019年的11.09%增长至2024年的23.81%;ROE有所下滑但仍维持在合理水平,2025年一季度ROE 2.0%,较去年同期持平 [38] 业务发展 传统主业 - 发展重心包括拓展自动化核心零部件布局、推动工业AI应用场景和方案落地、拓展人形机器人等新兴行业需求;核心技术有工业AI算法等,产品线拓展完善,强化多项技术,拓展传感器技术和高端超精密运动部件驱动及驱控一体技术,加强自动化核心零部件领域产品竞争力 [2] AI技术 - 推出两款基于人工智能工业视觉软件DeepVision 3与Web版AI平台,突破底层算法等,构建高效视觉生态平台,降低AI项目实施门槛和成本、提高开发效率;AI产品与解决方案覆盖锂电、3C电子、半导体等领域,2024年实施规模以上项目数百项,检测产品数十亿件 [3] 新兴领域 - 发挥工业机器人领域经验和技术优势,拓展人形机器人等新兴热点领域对机器视觉的需求,着手研发面向人形机器人等新型终端的视觉模组和解决方案;在消费级机器人领域规划小型化的散斑结构光系列和TOF相机系统;计划加大精密运动和机器人关键部件研发投入,形成“视觉 + 传感 + 运动控制”综合能力 [4] 盈利预测 - 假设2025 - 2027年机器视觉核心部件收入分别为9.13/10.95/13.69亿元,毛利率均为65.08%;机器视觉配件收入分别为1.28/1.47/1.77亿元,毛利率均为53.73% [44] - 预计2025 - 2027年公司营收为10.42/12.44/15.47亿元,同比增长14.33%/19.35%/24.37%,毛利率63.63%/63.69%/63.75%,毛利6.63/7.92/9.86亿元;归母净利润分别为1.81/2.42/3.00亿元,同比增速33.16%/33.11%/24.41% [45][47] 估值与投资建议 绝对估值 - 假设无杠杆Beta为1.00,无风险利率2.65%,股票风险溢价6.50%,债务成本4.50%,永续增长率2.00%,测算得出加权平均资本成本WACC为9.15%,采用FCFF估值法得出公司合理估值为51.73 - 65.18元 [50] 相对估值 - 选取凌云光、奥比中光为可比公司,预计2025 - 2027年归属母公司净利润分别为1.81/2.42/3.00亿元,对应PE 57/43/35倍,一年期合理估值为103.91 - 118.75元(对应2025年PE 70 - 80x),以相对估值法为主对公司进行估值 [55] 投资建议 - 预计2025 - 2027年归属母公司净利润分别为1.81/2.42/3.00亿元,对应PE 57/43/35倍,一年期合理估值为103.91 - 118.75元(对应2025年PE 70 - 80x),首次覆盖给予“优于大市”评级 [57]
多方联动 潘家园眼镜发力双节消费
北京商报· 2025-05-30 16:01
活动概况 - 第二届潘家园眼镜节于5月30日至6月2日举办,覆盖端午假期和儿童节,以北京眼镜城为主会场,联动6个分会场[1] - 活动通过多会场联动模式让消费者实现不同品牌、款式眼镜的挑选与对比,完善购镜体验[1] - 开幕式推出潘家园眼镜吉祥物IP金丝雀"镜镜",为品牌注入科技感形象,旨在拉近与消费者距离[1] 政企医合作 - 潘家园眼镜行业联盟与北京爱尔英智眼科医院签署《视觉健康共建合作协议》,将在眼部健康检查、公益救助、科普教育等领域深度合作[1] - 医院将为眼镜节提供专业眼部健康检查服务,帮助消费者科学选购眼镜,并计划开展特殊群体公益救助活动[1] - 未来将定期举办讲座、线上科普等活动普及科学用眼知识,提升全民视觉健康意识[1] - 政企医三方联动模式是潘家园眼镜产业发展创新之举,政府引导规范市场,行业联盟整合资源,医疗机构提供专业支持[2] 产业发展 - 潘家园已成为中国眼镜行业重要地标和商贸核心集散地,是中国眼镜产业转型升级的"缩影"与"窗口"[2] - 去年成立眼镜行业联盟通过引导各方参与消费环境治理、规范市场秩序,有效促进消费增长[2] - 本届眼镜节进一步发挥产业聚集优势,结合前沿技术展示与趣味消费场景,为消费者带来实惠[2] - 潘家园不仅是文化消费聚集地,更是北京配眼镜首选地,活动汇聚全球优质品牌促进传统行业与数字化、时尚化融合[2] 未来规划 - 潘家园街道将以眼镜节为契机持续优化营商环境,强化消费者权益保障,推动商圈能级提升[2] - 计划打造视觉产业生态链,吸引上下游企业入驻形成产业集群效应,推动眼镜行业蓬勃发展[2] - 目标是通过产业发展引领行业潮流,为朝阳区经济高质量发展注入新动能[2]
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
量子位· 2025-05-30 15:10
机器狗羽毛球技术突破 - 基于强化学习的全身视觉运动控制策略同步控制18个自由度的腿部移动和手臂挥拍动作[4] - 最高挥拍速度达12米/秒,与人类业余选手协作时实现单回合连续击球10次[5][6][23] - 在发球区拦截成功率接近100%,但正上方/后方来球拦截仍存在挑战[29][30][31] 硬件与感知系统配置 - 采用ANYmal-D四足底座+DynaArm动态手臂组合,配备ZED X立体相机(400Hz控制频率/100Hz策略更新)[13][16] - 球拍45°腕关节定向经仿真验证为最优配置,感知模块平均轨迹判断耗时0.357秒[15][20] - Jetson AGX Orin模块以60Hz异步运行轨迹预测系统,击球位置误差0.117米(12m/s挥拍时)[17][37] 运动控制性能 - 10m/s指令速度下跟踪精准,超10m/s时精度下降,实测最高执行速度12.06m/s(指令19m/s)[34][35] - 动态调整步态:短距微调/中距不规则步态/长距类疾驰步态,远距拦截采用快跑模式[38][39] - 击球后自动回位中心的行为涌现,模拟人类球员站位调整策略[25][26] 算法创新与局限 - 统一强化学习策略解决18自由度协同控制问题,突破传统固定基座方案局限[47][48] - 感知噪声模型缩小仿真与部署差距,较基准降低28%感知误差(无显式视野奖励)[51][56] - 当前依赖单一立体相机EKF估计,未来可通过扭矩/声音/RGB-D等多模态传感升级[58][59] 学术价值与场景拓展 - 苏黎世联邦理工学院团队成果发表于《Science Robotics》,验证足式机器人在动态体育场景的可行性[8][10][11] - 系统在电流/关节速度极限下运行,为复杂环境中的移动操作任务建立新基准[35][47] - 技术框架可扩展至其他需要动态协调的运动场景,如应急响应或服务业[47][58]
速递|Buildots完成4500万美元D轮融资,用AI模型+计算机视觉破解建筑业“信息脱节”难题
Z Potentials· 2025-05-30 11:23
公司概况 - Buildots是一家成立于2018年的芝加哥初创公司 由Roy Danon、Aviv Leibovici和Yakir Sudry联合创立 专注于通过人工智能和计算机视觉技术改善建筑行业管理效率 [3] - 公司已完成D轮4500万美元融资 由Qumra Capital领投 总融资额达1 66亿美元 [3] - 目前拥有230多名员工 计划重点扩充研发团队并拓展北美业务 [4] 核心技术 - 平台通过管理人员安全帽上的360度摄像头采集图像 实时追踪施工进度 [3] - 系统具备监测和预测功能 通过AI聊天机器人提供项目状态查询和延误风险预警 [4] - 计划利用历史数据训练AI模型 建立基准并优化建筑项目表现 [4] 市场定位 - 客户包括英特尔和约50家建筑企业 服务对象涵盖现场管理人员、建筑高管等多方利益相关者 [4] - 差异化优势在于以运营为核心的平台及建筑行业绩效管理的独特方法 [5] - 主要竞争对手包括BeamUp和Versatile等AI建筑科技公司 [4] 行业痛点 - 建筑行业存在管理人员与现场实际情况脱节的问题 需同时处理成本动态、多方沟通和承包商风险评估等复杂任务 [2] - 传统决策依赖碎片化信息 缺乏真实可衡量的数据支持 [4]
人形机器人格斗赛现 “人机协作” 全自动时代需更强视觉感知能力
证券时报网· 2025-05-29 14:23
人形机器人格斗赛技术进展 - 全球首个人形机器人格斗赛在杭州举行 采用手动遥控方式操控机器人进行比赛 由机器人选手和真人选手共同完成 [1] - 参赛机器人配置双目深度相机和3D激光雷达 能360°感知环境 通过多传感器融合技术实时调整姿态完成高强度动作 [1] - 机器视觉是人形机器人感知环境的关键技术 国内厂商多采用3D视觉结合激光雷达方案提升环境建模与导航精度 [1] 机器视觉技术应用 - 奥比中光在国内服务机器人视觉市场占有率超过70% 占据主导地位 [1] - 深度相机具备三维空间视觉能力 帮助机器人覆盖环境和对手动态范围 为软件算法处理提供重要基础 [1] - 机器人格斗需在极短时间内完成检测、跟踪和决策 考验视觉系统的数据感应能力、抗干扰能力及多传感器同步融合能力 [1] 人形机器人技术发展方向 - 目前人形机器人重大进展集中在关节灵活度和平衡运动控制方面 动作执行效果超预期 [2] - 实现全自动格斗需从被动执行升级至主动执行 视觉传感器的感知数据将成为更重要的基础 [2] - 全自动格斗需视觉系统感知环境构建地图 并感知对手位置、速度、动作意图等信息以规划决策 [2] 行业动态与公司布局 - 奥比中光是全球少数全面布局六大3D视觉感知技术路线的公司 已将双目结构光系列产品送样适配大部分人形机器人客户 [2] - 12月深圳将举办首个全尺寸类人身高人形机器人格斗赛事"机甲拳王" 机器人产业或迎来科技竞技新风潮 [2]