Workflow
视觉
icon
搜索文档
多方联动 潘家园眼镜发力双节消费
北京商报· 2025-05-30 16:01
活动概况 - 第二届潘家园眼镜节于5月30日至6月2日举办,覆盖端午假期和儿童节,以北京眼镜城为主会场,联动6个分会场[1] - 活动通过多会场联动模式让消费者实现不同品牌、款式眼镜的挑选与对比,完善购镜体验[1] - 开幕式推出潘家园眼镜吉祥物IP金丝雀"镜镜",为品牌注入科技感形象,旨在拉近与消费者距离[1] 政企医合作 - 潘家园眼镜行业联盟与北京爱尔英智眼科医院签署《视觉健康共建合作协议》,将在眼部健康检查、公益救助、科普教育等领域深度合作[1] - 医院将为眼镜节提供专业眼部健康检查服务,帮助消费者科学选购眼镜,并计划开展特殊群体公益救助活动[1] - 未来将定期举办讲座、线上科普等活动普及科学用眼知识,提升全民视觉健康意识[1] - 政企医三方联动模式是潘家园眼镜产业发展创新之举,政府引导规范市场,行业联盟整合资源,医疗机构提供专业支持[2] 产业发展 - 潘家园已成为中国眼镜行业重要地标和商贸核心集散地,是中国眼镜产业转型升级的"缩影"与"窗口"[2] - 去年成立眼镜行业联盟通过引导各方参与消费环境治理、规范市场秩序,有效促进消费增长[2] - 本届眼镜节进一步发挥产业聚集优势,结合前沿技术展示与趣味消费场景,为消费者带来实惠[2] - 潘家园不仅是文化消费聚集地,更是北京配眼镜首选地,活动汇聚全球优质品牌促进传统行业与数字化、时尚化融合[2] 未来规划 - 潘家园街道将以眼镜节为契机持续优化营商环境,强化消费者权益保障,推动商圈能级提升[2] - 计划打造视觉产业生态链,吸引上下游企业入驻形成产业集群效应,推动眼镜行业蓬勃发展[2] - 目标是通过产业发展引领行业潮流,为朝阳区经济高质量发展注入新动能[2]
机器狗能当羽毛球搭子了!仅靠强化学习从0自学,还涌现出类人回位行为 | Science子刊
量子位· 2025-05-30 15:10
机器狗羽毛球技术突破 - 基于强化学习的全身视觉运动控制策略同步控制18个自由度的腿部移动和手臂挥拍动作[4] - 最高挥拍速度达12米/秒,与人类业余选手协作时实现单回合连续击球10次[5][6][23] - 在发球区拦截成功率接近100%,但正上方/后方来球拦截仍存在挑战[29][30][31] 硬件与感知系统配置 - 采用ANYmal-D四足底座+DynaArm动态手臂组合,配备ZED X立体相机(400Hz控制频率/100Hz策略更新)[13][16] - 球拍45°腕关节定向经仿真验证为最优配置,感知模块平均轨迹判断耗时0.357秒[15][20] - Jetson AGX Orin模块以60Hz异步运行轨迹预测系统,击球位置误差0.117米(12m/s挥拍时)[17][37] 运动控制性能 - 10m/s指令速度下跟踪精准,超10m/s时精度下降,实测最高执行速度12.06m/s(指令19m/s)[34][35] - 动态调整步态:短距微调/中距不规则步态/长距类疾驰步态,远距拦截采用快跑模式[38][39] - 击球后自动回位中心的行为涌现,模拟人类球员站位调整策略[25][26] 算法创新与局限 - 统一强化学习策略解决18自由度协同控制问题,突破传统固定基座方案局限[47][48] - 感知噪声模型缩小仿真与部署差距,较基准降低28%感知误差(无显式视野奖励)[51][56] - 当前依赖单一立体相机EKF估计,未来可通过扭矩/声音/RGB-D等多模态传感升级[58][59] 学术价值与场景拓展 - 苏黎世联邦理工学院团队成果发表于《Science Robotics》,验证足式机器人在动态体育场景的可行性[8][10][11] - 系统在电流/关节速度极限下运行,为复杂环境中的移动操作任务建立新基准[35][47] - 技术框架可扩展至其他需要动态协调的运动场景,如应急响应或服务业[47][58]
速递|Buildots完成4500万美元D轮融资,用AI模型+计算机视觉破解建筑业“信息脱节”难题
Z Potentials· 2025-05-30 11:23
公司概况 - Buildots是一家成立于2018年的芝加哥初创公司 由Roy Danon、Aviv Leibovici和Yakir Sudry联合创立 专注于通过人工智能和计算机视觉技术改善建筑行业管理效率 [3] - 公司已完成D轮4500万美元融资 由Qumra Capital领投 总融资额达1 66亿美元 [3] - 目前拥有230多名员工 计划重点扩充研发团队并拓展北美业务 [4] 核心技术 - 平台通过管理人员安全帽上的360度摄像头采集图像 实时追踪施工进度 [3] - 系统具备监测和预测功能 通过AI聊天机器人提供项目状态查询和延误风险预警 [4] - 计划利用历史数据训练AI模型 建立基准并优化建筑项目表现 [4] 市场定位 - 客户包括英特尔和约50家建筑企业 服务对象涵盖现场管理人员、建筑高管等多方利益相关者 [4] - 差异化优势在于以运营为核心的平台及建筑行业绩效管理的独特方法 [5] - 主要竞争对手包括BeamUp和Versatile等AI建筑科技公司 [4] 行业痛点 - 建筑行业存在管理人员与现场实际情况脱节的问题 需同时处理成本动态、多方沟通和承包商风险评估等复杂任务 [2] - 传统决策依赖碎片化信息 缺乏真实可衡量的数据支持 [4]
人形机器人格斗赛现 “人机协作” 全自动时代需更强视觉感知能力
证券时报网· 2025-05-29 14:23
人形机器人格斗赛技术进展 - 全球首个人形机器人格斗赛在杭州举行 采用手动遥控方式操控机器人进行比赛 由机器人选手和真人选手共同完成 [1] - 参赛机器人配置双目深度相机和3D激光雷达 能360°感知环境 通过多传感器融合技术实时调整姿态完成高强度动作 [1] - 机器视觉是人形机器人感知环境的关键技术 国内厂商多采用3D视觉结合激光雷达方案提升环境建模与导航精度 [1] 机器视觉技术应用 - 奥比中光在国内服务机器人视觉市场占有率超过70% 占据主导地位 [1] - 深度相机具备三维空间视觉能力 帮助机器人覆盖环境和对手动态范围 为软件算法处理提供重要基础 [1] - 机器人格斗需在极短时间内完成检测、跟踪和决策 考验视觉系统的数据感应能力、抗干扰能力及多传感器同步融合能力 [1] 人形机器人技术发展方向 - 目前人形机器人重大进展集中在关节灵活度和平衡运动控制方面 动作执行效果超预期 [2] - 实现全自动格斗需从被动执行升级至主动执行 视觉传感器的感知数据将成为更重要的基础 [2] - 全自动格斗需视觉系统感知环境构建地图 并感知对手位置、速度、动作意图等信息以规划决策 [2] 行业动态与公司布局 - 奥比中光是全球少数全面布局六大3D视觉感知技术路线的公司 已将双目结构光系列产品送样适配大部分人形机器人客户 [2] - 12月深圳将举办首个全尺寸类人身高人形机器人格斗赛事"机甲拳王" 机器人产业或迎来科技竞技新风潮 [2]
特写:在新疆国际农业机械博览会觅商机
新华社· 2025-05-29 09:49
展会概况 - 2025新疆国际农业机械博览会汇集12国近200名境外采购商及中外800多家企业参展 [2] - 展会主题为"智能农机赋能新质生产力,科技引领农业现代化",吸引凯斯纽荷兰、约翰迪尔等国际巨头参展 [2] - 新疆农机合作社及大户积极参与实地考察与采购,反映区域市场需求旺盛 [2] 参展企业动态 - 凯斯纽荷兰展示400马力和330马力两款智能化新产品,2024年新疆市场贡献其中国区销售额25%(23亿元总销售额) [2] - 凯斯纽荷兰已获新疆客户25台设备订单,总金额2400万元 [2] - 韩国农业装备公司首次参展,计划通过展会拓展新疆经销商网络 [4] 智能农机技术突破 - 深圳科技公司推出"棉花智能打顶机器人",采用AI视觉技术实现棉花顶叶精准识别与摘除 [3] - 新款自走式机器人打顶效率达每小时30亩,较前代提升3倍 [3] 新疆农业机械化现状 - 2024年新疆农作物综合机械化水平达90.28%,农林牧渔综合机械化水平74.62% [4] - 棉花机采率稳定超90%,粮食单产524.8公斤/亩居全国首位 [4] - 2024年新疆棉花产量568.6万吨占全国92.2%,粮食总产466亿斤 [4]
AI连电路图都看不懂?SeePhys新基准暴击多模态短板,正确率低至55%
量子位· 2025-05-29 09:08
SeePhys团队 投稿 量子位 | 公众号 QbitAI 当前顶尖AI模型是否真能"看懂"物理图像? 全谱系多模态物理推理新基准来了,结果 SO TA级模型准 确率都不足55% 。 新基准名为 SeePhys ,强调了图形感知对于模型认识和理解物理世界的重要性。 内容涵盖经典与现代物理的各个知识等级和领域,包括 从初中到博士资格考试的全谱系多模态物理问题 。 它由中山大学、苏黎世联邦理工学院、华为诺亚方舟实验室和香港大学的研究团队联合推出,于近日 正式开源 。 团队在实验中系统性评估了LLM/MLLM在复杂科学图表与理论推导耦合任务中的表现。 结果表明即使是Gemini-2.5-Pro和o4-mini等SOTA模型准确率都不足55%,暴露出多模态推理的巨大挑战。 团队表示,目前该基准正在ICML 2025 AI for MATH Workshop中开放评估,欢迎学界与工业界的团队来挑战。 为什么需要SeePhys? 近年来,数学在大语言模型 (LLMs) 的推理能力评估中大放异彩,而物理学由于其具有与真实场景的强相关性和更复杂的图像信息,正在 多模态测评中得到越来越多的重视。 物理学不仅知识体系庞大、逻辑链 ...
擂台之上 “慧眼”助力 人形机器人格斗赛 国产“慧眼”如何让机器人精准识敌
广州日报· 2025-05-29 03:01
机器人格斗赛事技术突破 - 宇树G1格斗比赛展现机器人稳定性与瞬间抗冲击能力超预期表现 成为机器人技术发展风向标 有望带动机器人行业新一轮行情 [1] - 比赛机器人采用力传感器 触觉传感器 视觉方案等感知技术 以及谐波减速器 电机等核心传动装置 其中视觉感知技术是理解环境的核心能力 [1] - 参赛G1机器人配备双目深度相机和3D激光雷达 实现360度环境感知 通过多传感器融合技术实时调整姿态完成高强度动作 [2] 机器视觉技术路线对比 - 特斯拉Optimus采用2D摄像头视觉方案 延续车端纯视觉感知技术路线 [2] - 国内厂商主要采用3D视觉(结构光/ToF/双目)结合激光雷达方案 相比2D视觉增加深度信息 提升环境建模与导航精度 [2] - 奥比中光在国内服务机器人视觉市场占有率超70% 为全球少数全面布局六大3D视觉感知技术路线的公司 [2][4] 机器人技术发展阶段 - 当前比赛采用"手动遥控"方式 依赖"机器人选手+真人选手操控"协同配合 [3] - 人形机器人重大进展体现在关节灵活度和平衡运动控制方面 人为指令执行效果超预期 [3] - 未来全自动格斗需机器人具备自动化感知决策能力 视觉传感器感知数据将成为重要基础 [3] 行业发展趋势 - 12月深圳将举办全球首个人形机器人"机甲拳王"自由格斗赛 打造开源竞技联盟 推动跨界融合 [4] - 奥比中光已将双目结构光系列产品送样 适配大部分人形机器人客户 [4] - 机器人格斗竞技将加速技术迭代和场景落地 国产3D视觉感知技术 多维传感技术 精密传动技术等供应链将加速崛起 [4][5]
4万多名作者挤破头,CVPR 2025官方揭秘三大爆款主题, 你卷对方向了吗?
机器之心· 2025-05-28 11:02
计算机视觉领域热门方向 - CVPR 2025基于全球4万多名作者的13008份投稿统计出三大热门方向 投稿数量同比增长13% 最终接收2878篇论文 接收率22.1% [3] - 研究群体呈现指数级增长趋势 AI领域重要性提升带动相关学位攻读人数增加 [3] 多视角与传感器3D技术 - 该方向投稿量激增 研究重点从单幅图像2D渲染转向复杂3D评估 2020年NeRF技术突破推动领域发展 [4][5] - 高斯泼溅(Gaussian splatting)技术进一步促进计算机视觉与图形学融合 神经渲染研究显著提升3D相关论文数量 [5] 图像与视频合成 - 成为CVPR 2025最大论文类别之一 多模态商业聊天机器人已实现图像/视频生成能力 正朝交互式世界生成演进 [6] - 会议展示的合成方法为生成完整虚拟环境奠定技术基础 [6] 多模态学习 - 视觉、语言和推理合并为投稿量最大类别之一 可能预示新研究趋势 [7][8] - CVPR坚持学术公平原则 每篇论文评审标准独立于作者机构背景 维护领域生态平衡 [8] 行业动态 - CVPR 2025会议即将召开 投稿竞争加剧反映AI研究热度持续攀升 [8] - 机器之心将同步举办论文分享会 提供学术交流平台 [8]
小红书高级副总裁汤维维: 从“文字转换”到“文化解码”的跨越
深圳商报· 2025-05-28 04:29
小红书国际文化交流与技术突破 - 2025年1月大量海外用户涌入小红书平台,引发跨文化交流现象,包括宠物互动、语言学习、中餐教学等内容 [1] - 语言障碍成为核心挑战,用户高频提出翻译需求,如"一键翻译"功能和文字识别需求 [1] - 公司迅速响应,数天内通过技术迭代上线"一键翻译"功能,实现英语评论自动转中文,减少用户跨应用操作 [1] 技术实现与文化解码 - 翻译功能采用多模态AI模型,整合NLP、OCR、CV技术,能解析文字及表情包谐音梗等非结构化内容 [1] - 建立动态学习机制,用户对译文的编辑行为持续优化模型,尤其在宗教符号、历史典故等文化敏感领域实现渐进式改进 [1] - 技术目标从"文字转换"升级至"文化适配",覆盖千年历史的阿姆哈拉语和网络热梗等多样性内容 [1] 平台战略与行业意义 - 公司将跨语言能力定位为基础设施级服务("水电煤"),通过技术+人文驱动构建无国界社交平台 [2] - 实践验证技术融合人文可突破文化边界,案例体现行业在AI社交领域的创新方向 [2]
泽景电子冲刺港股IPO 主要产品均价持续下跌
每日经济新闻· 2025-05-27 21:51
公司IPO及主营业务 - 江苏泽景汽车电子股份有限公司正冲刺港股IPO [1] - 公司主营产品为HUD(抬头显示器)解决方案,包括挡风玻璃HUD解决方案"CyberLens"和增强现实HUD解决方案"CyberVision" [2] - 公司是中国创新智能座舱视觉、交互解决方案的先行者和领军者 [2] 财务表现 - 2022~2024年公司毛利率分别为22.6%、25.6%和27.3%,其中HUD解决方案毛利率分别为20.8%、26.5%和27.6% [2] - HUD解决方案销量从2022年17.57万套增至2024年62.46万套,增长2.55倍 [3] - HUD解决方案平均价格从2022年974.31元/套降至2024年865.47元/套 [2] - 2024年人工成本2533.1万元,同比下降12.82% [3] - 2024年收入增速从2023年156.6%大幅放缓至5.1% [3] - 2024年对前五大客户销售收入4.68亿元,较2023年5.15亿元下降9.13% [5] 市场份额与竞争 - 以2024年销量计,公司在中国HUD解决方案供应商中排名第二位,市场份额16.2% [3] - 主要竞争对手华阳集团(002906)2024年HUD产品销售收入大幅增长 [5] - 华阳集团预计未来HUD产品仍将保持较高增长态势 [5] 经营挑战 - 公司报告期内未能实现盈利 [5] - 截至2024年末资产负债率215.6%,流动比率41.2% [5] - 2024年末贸易应收账款及应收票据之和达2.96亿元 [6] - 贸易应收账款周转天数从2022年102.2天升至2024年140.5天 [6] - 客户信贷期延长,如第一大客户A公司信贷期从2022年60天延长至2024年90天 [6] - 面临来自下游客户的持续降价压力 [7] 成本控制与增长策略 - 2023年毛利率提升主要来自销量激增带来的规模经济 [3] - 2024年毛利率提升得益于有效成本控制和规模经济 [3] - 2022~2024年原材料成本从1.44亿元上升至3.65亿元,增长1.53倍,低于销量增长幅度 [3] - 2023年采取更谨慎方法竞争定点项目,导致2024年收入增速放缓 [4]