视觉

搜索文档
天准科技(688003)每日收评(06-10)
和讯财经· 2025-06-10 17:02
公司股价表现 - 综合得分46.44分,评级偏弱 [1] - 当前股价47.46元,低于5日主力成本47.98元、20日主力成本48.40元和60日主力成本49.80元 [1] - 过去一年内涨停1次,跌停0次 [1] 主力资金动向 - 当日主力资金净流出1244.31万元,占总成交额-8% [2] - 超大单净流出933.86万元,大单净流出310.45万元 [2] - 散户资金净流入246.92万元 [2] 技术面分析 - 短期压力位49.17元,支撑位47.30元 [2] - 中期压力位52.72元,支撑位45.45元 [2] - 短线和中线趋势均不明朗,等待主力资金选择方向 [2][3] 财务数据 - 每股收益-0.168元,营业利润-0.43亿元 [2] - 净利润-3239.28万元 [2] - 销售毛利率30.439% [2] 行业表现 - 所属通用设备板块下跌1.16% [2] - 机器视觉概念下跌1.46%,边缘计算下跌2.49%,人工智能下跌1.22% [2] 北向资金 - 北向资金持股量31.83万股,占流通比0.16% [1] - 昨日净买入0.17万股,增仓比0.001% [1] - 5日增仓比0.02%,20日增仓比-0.033% [1]
英伟达港大联手革新视觉注意力机制!GSPN高分辨率生成加速超84倍
量子位· 2025-06-10 13:16
GSPN团队 投稿 量子位 | 公众号 QbitAI 二维线性传播:从行列并行到密集连接 视觉注意力机制 ,又有新突破,来自香港大学和英伟达。 Transformer的自注意力在NLP和计算机视觉领域表现出色——它能捕捉远距离依赖,构建深度上下文。然而,面对高分辨率图像时,传统自 注意力有两个大难题: 虽然线性注意力和Mamba等方法能把复杂度降到O(N),但它们还是把图像当作一维序列处理,无法真正利用二维空间信息。 为此,香港大学与英伟达联合推出了 广义空间传播网络(GSPN) 。 GSPN采用二维线性传播,结合"稳定性–上下文条件",将计算量从 O(N²) 或 O(N) 再降到√N级别,并完整保留图像的空间连贯性。这样,不 仅大幅提升了效率,还在多个视觉任务上刷新了性能纪录。 兼具空间连贯性和计算效率 GSPN的核心技术是 二维线性传播 与 稳定性-上下文条件 ,基于此,现有注意力机制与GSPN的对比如下: 作为GSPN的核心组件,二维线性传播包括两个关键点: 线扫描机制 对于二维图像,二维线性传播通过逐行或逐列的顺序处理进行其遵循线性循环过程,隐藏层通过前一行的隐藏状态和当前输入计算得出: 计算量巨大: ...
乐动机器人冲刺H股:机器人激光雷达开启“三国杀”
21世纪经济报道· 2025-06-09 21:24
公司概况 - 乐动机器人是一家以"视觉感知技术"为核心的机器人企业,主要业务为激光雷达模组销售,产品聚焦家用、商用、工业等机器人运用场景 [1] - 公司2024年合计赋能智能机器人600万台,其中DTOF激光雷达出货量72万台,全球第一 [3] - 产品覆盖全球50个国家,服务下游客户300家,包括全球十大服务机器人中的七家以及全球五大商用机器人企业 [3] - 国内两大清扫机器人品牌科沃斯、云鲸均为公司客户 [4] 业务发展 - 2018年推出第一代激光雷达产品和SLAM算法,应用于扫地机器人行业 [4] - 近年拓展至家用、商业、工业、医疗、教育领域,并进入智能割草机行业,2024年割草机出货量超1万台 [4] - 2024年割草机业务收入2327.2万元,较2023年的6.3万元显著放量 [5] - 禾赛、速腾聚创等激光雷达巨头加大机器人领域布局,与公司形成直接竞争 [10][11] 财务表现 - 2022-2024年营业总收入从2.33亿增长至4.673亿元,年复合增长率41.4% [5] - 视觉感知产品收入从2022年2.287亿增长至2024年4.393亿元 [5] - 连续三年亏损,但亏损额从7313.2万降至5648.3万元 [5] - 2024年行政开支3692.5万元,研发开支9485.7万元,营销支出3142.7万元 [7] - 毛利从2022年6394.7万增长至2024年9131.7万,但毛利率从27.3%降至19.5% [7] 行业竞争 - 禾赛科技2025年Q1机器人领域交付量4.9万台,同比增长649.1%,预计全年出货20万台 [10][11] - 速腾聚创2025年Q1机器人业务激光雷达销量11900台,同比增长183.3%,收入7340.3万元 [11] - 东吴证券预计2030年机器人激光雷达市场规模达280亿元,年复合增长率67.9% [11] - 行业竞争加剧导致公司毛利率下滑,产品结构变化也是重要原因 [7][8]
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
量子位· 2025-06-09 17:27
视觉语言模型(VLM)技术突破 - 视觉语言模型正经历从「感知」到「认知」的关键跃迁,实现多模态交互的全新可能 [1][2] - 传统VLM依赖文本token间接翻译视觉信息,导致在高清图像微小物体、视频动态细节等场景中表现不足 [2] - 研究团队提出「像素空间推理」范式,将推理战场从文本空间拓展到像素空间,实现原生视觉操作 [2][3] 像素空间推理的核心优势 - 模型可自主触发视觉变焦、时空标记等原生操作,在像素矩阵上直接完成闭环推理,避免信息衰减 [6] - 视觉主导推理机制使模型能捕捉传统方法难以处理的空间关系与动态细节,如具身视觉导航、复杂视频理解等场景 [6] - 打破文本对视觉语义的「翻译牢笼」,实现与人类视觉认知同构的推理能力 [7] 学习陷阱与激励机制 - 指令微调模型面临「认知惰性」挑战,表现为负面反馈循环和路径依赖惯性 [8] - 研究团队设计内在好奇心激励配合外在正确性激励的强化学习方案,鼓励模型练习视觉操作 [9][10] - 通过像素推理率约束和操作效率约束,在探索与计算成本间找到平衡 [10][11] 性能表现与行业影响 - 基于Qwen2.5-VL-7B构建的Pixel-Reasoner在四大视觉推理基准测试中表现优异:V* Bench 84.3%准确率,超越GPT-4o和Gemini-2.5-Pro [13][15] - 在TallyQA-Complex、InfographicsVQA、MVBench等测试中均实现显著性能提升,展现「小模型大能力」特性 [19][20] - 像素空间推理为VLM开启「第二思维通道」,推动多模态模型真正理解世界复杂性 [21]
凝视的革命:《戴珍珠耳环的少女》的艺术史坐标
经济观察报· 2025-06-09 14:02
艺术史背景 - 17世纪荷兰艺术经历从宗教神坛到世俗人间的视觉革命,肖像画主角转变为商人、女仆等普通市民[2][3] - 《戴珍珠耳环的少女》体现荷兰东印度公司全球贸易的视觉投射,异域元素如土耳其头巾与珍珠成为市民阶层的文化资本[3] - 维米尔作品介于肖像与角色画之间,去个性化处理为18世纪肖像画向心理凝视转向埋下伏笔[3] 创作技术与科学影响 - 维米尔使用透镜、暗箱装置及光学投影技术,少女鼻梁阴影角度与暗箱成像几何计算高度吻合[4] - 画作遵循自然主义光影分布,少女右脸颊明暗交界线精确,色彩处理体现17世纪科学革命影响[4] - 人造珍珠的128个刻面严格遵循光学反射定律,成为纯粹光影载体[4] 艺术形式与历史地位 - 画作构图从原计划的士兵头像改为纯色背景,形成简洁的三角构图与单点聚焦,与现代艺术形式呼应[5] - 维米尔对材料如群青多层叠绘、人造珍珠光学实验的探索,体现对绘画物质性的超前关注[5] - 作品从19世纪二流风俗画定位到20世纪成为全球化文化符号,展现艺术形式的跨时代阐释弹性[5] 文化与社会意义 - 作品标记荷兰黄金时代的物质文明与精神追求,记录艺术家在商业压力与艺术理想间的平衡[6] - 画作以精准光影、神秘凝视和极致材料,在艺术史中刻下普通人永恒形象[6] - 维米尔通过日常凝视挑战视觉习惯,体现对艺术本质的执着追寻[6]
85后天大老师创业,净利润暴增295%,冲刺IPO
创业邦· 2025-06-09 10:58
公司概况 - 易思维是深耕交通领域的机器视觉设备提供商,产品覆盖产业链上中下游,包括视觉传感器、光源、控制系统及汽车制造等应用集成方案 [4] - 在中国汽车制造和整车制造的机器视觉市场市占率分别为13 7%和22 5%,均位居行业第一 [5] - 业务已拓展至轨道交通和航空领域,形成"检测+磨抛"整体解决方案 [15] 创始人背景 - 创始人郭寅39岁,曾为天津大学精密仪器与光电子工程学院讲师,拥有精密仪器学术研究背景 [7][10] - 2016年与课题组同事共同创立易思维,团队技术源于叶声华院士和邾继贵教授的精密测量与计算机视觉融合研究成果 [11] - 创业动机源于观察到汽车制造机器视觉市场被伊斯拉、伯赛等国际巨头垄断,决心实现国产替代 [11] 发展历程 - 2017年将总部从天津迁至杭州,利用长三角汽车产业集聚优势和人才生态 [12] - 2019年并购德国EHR公司,完善产品布局并拓展客户资源 [13] - 2022年并购杭州禹奕,形成"检测+磨抛"整体解决方案 [13] - 产品已应用于一汽大众、比亚迪、蔚来等国内主机厂,并进入沃尔沃、Rivian等国际车企供应链 [13][15] 财务表现 - 2022-2024年营业收入分别为2 2亿元、3 6亿元和3 9亿元,年均复合增长率32 6% [26] - 同期净利润从538 7万元增长至8433 2万元,年均复合增长率295 7% [26] - 综合毛利率持续提升,近三年分别为62 7%、64 7%和65 5% [27] - 2024年汽车制造领域收入3 7亿元,视觉检测系统和引导系统分别贡献1 7亿元和1 6亿元 [29] 融资与股权 - 已完成4轮融资,投资方包括方广资本、银杏谷资本、杭州高新投等 [19] - 最新估值27亿元,创始人郭寅通过直接持股和持股平台合计控制56 1%股份 [21][22] - A轮投资方国投基金已退出,股份由其他7名股东接盘 [20] 业务拓展 - 轨道交通领域营收从2023年788 2万元增长23倍 [29] - 计划募资12 1亿元,重点投向机器视觉产品产业化基地(7 1亿元)和研发中心 [29] - 通过德国子公司EHR积累的客户资源拓展海外市场 [31]
计算机之“眼”研究迈出重要一步 人工突触成功模仿人类彩色视觉
科技日报· 2025-06-09 07:24
技术突破 - 日本东京理科大学团队成功开发出具有极高颜色分辨能力的自供电人工突触 其颜色识别能力已接近人眼水平 [1] - 该人工突触系统集成了两种不同类型的染料敏化太阳能电池 能够对不同波长的光产生不同响应 实现真正的自供电 [2] - 实验显示该系统能以10纳米分辨率区分可见光范围内的颜色 并展现出双极响应特性 蓝光照射产生正电压 红光照射产生负电压 [2] 性能表现 - 该系统仅用单个器件就能准确分类多达18种颜色与动作组合 识别准确率达到82% [2] - 该装置能够执行复杂逻辑运算 而这些操作通常需要多个传统光电元件才能完成 [2] 应用前景 - 该技术有望应用于自动驾驶领域 医疗健康设备和消费电子领域 [2] - 特别适合用于对能源效率要求极高的边缘计算场景 [2] 行业背景 - 人工智能快速发展对机器视觉提出更高要求 但处理大量视觉数据需要消耗大量电力 存储空间和计算资源 [1] - 人类视觉系统具有高效节能优点 仅选择性提取关键特征 大幅降低能耗 [1] - 神经形态计算作为模仿生物神经系统的新型计算方式 被认为在突破传统机器视觉限制方面极具潜力 [1]
拆解特斯拉机器人供应链:30 多位从业者看到的泡沫和希望
阿尔法工场研究院· 2025-06-08 21:36
核心观点 - 特斯拉人形机器人Optimus的研发带动了全球产业链投入超1000亿元,但当前量产仍面临高成本、低效率问题,硬件技术尚未突破瓶颈[2][25][30] - 行业出货量预计2024年仅2万台,单台成本6万美元,效率仅为人工20%-30%,远未达到替代蓝领工人的经济性[2][35][40] - 软件端采用VLA模型训练机器人,但数据采集成本高(单条10元),真机数据不足制约模型泛化能力[52][54] 技术路径 硬件设计 - 采用行星滚柱丝杠(单价超4000元/根)替代传统旋转关节,单腿承重达半吨,精度误差小于6微米[10][36] - 灵巧手复刻22个自由度,绳驱结构模拟肌肉组织,但耐用性差(3个月需更换),双手更换成本10万元[18][20][42] - 传感器方案包含六维力传感器(误差<0.2%)、电子皮肤(单指节100+力传感器),但感知精度仍落后人类[15][16][22] 软件系统 - 放弃波士顿动力的规则控制路线,转向VLA模型训练端到端动作,需1000万条真机数据(当前不足100万条)[45][52][54] - 数据采集依赖物理交互仿真,如开冰箱门需建模质量/摩擦力等参数,通过Real-to-Sim生成多场景训练数据[56] 产业链现状 供应商格局 - 核心部件由舍弗勒(滚柱丝杠)、哈默纳科(RV减速器)、ATI(六维传感器)等国际龙头主导[10][11][16] - 中国供应商如三花智控、拓普集团累计投入超50亿元,特斯拉提供技术图纸扶持代工厂[27][28] - 行星滚柱丝杠产能严重受限(月产仅300根),迫使特斯拉降低精度标准至C3级[36][37] 商业化进展 - 特斯拉2024年目标产量5600台,实际应用仅数十台用于搬运电池,效率不及工业机械臂[30][59] - 中国公司宇树/智元预计出货5000台,但主要场景转向车展模特、情绪价值产品[59][60] - 行业估值分化明显:具身智能公司Physical Intelligence成立15个月估值超20亿美元[57] 性能参数 - 第三代Optimus身高1.72米/重55公斤,50+自由度,双臂负载20公斤,续航5小时[30][34] - 行走速度8-10公里/小时,但60%概率1.5公里内摔倒,关节温度超70℃会降频[35][39] - 硬件成本中执行器占比55%,灵巧手复杂度超其余部件总和[6][18]
乐动机器人:2024 年净亏 0.56 亿,割草机业务待突围
和讯财经· 2025-06-08 19:31
公司概况 - 深圳乐动机器人股份有限公司向港交所递交IPO申请,主攻激光雷达等视觉感知类产品 [1] - 2024年公司收入3.41亿元,其中视觉感知产品占比超7成 [1] - 以2024年收入计,公司是全球最大的以视觉感知技术为核心的智能机器人公司 [1] - 2024年搭载公司技术的智能机器人超600万台 [1] 财务表现 - 2024年视觉感知产品收入3.41亿元,同比增长超1倍,但毛利率仅15.2% [1] - 算法模组毛利率相对较高,2024年达31.3%,但收入较2022年下滑超20% [1] - 2024年整体毛利率降至19.5% [1] - 2024年净亏损0.56亿元 [1] 业务发展 - 公司加码智能割草机器人业务,2024年推出量产首代产品,收入0.23亿元 [1] - 2025年初迄今智能割草机器人销量超1.5万台,已超2024年全年销量 [1] - 智能割草机器人毛利率达33.6%,有助于稳住整体毛利率 [1] 行业竞争 - 视觉感知产品面临终端企业加码算法自研的挑战,如追觅、石头科技等 [1] - 智能割草机器人市场竞争激烈,九号、追觅、石头科技、优必选等纷纷入局 [1] - 智能割草机市场预计2029年渗透率达17%,规模约476亿元 [1] 股东结构 - 阿里巴巴CEO吴泳铭旗下圆璟鼎恒参投,持股1.79% [1]
阿里CEO押注、主攻传感器的乐动机器人,港股IPO募资去“割草”
华尔街见闻· 2025-06-08 16:09
公司概况 - 乐动机器人向港交所递交IPO申请,主攻激光雷达等视觉感知类产品,2024年收入3.41亿元,其中视觉感知产品占比超7成 [2] - 公司是全球最大的以视觉感知技术为核心的智能机器人公司,2024年搭载其技术的智能机器人数量超600万台 [3] - 阿里巴巴CEO吴泳铭旗下投资机构圆璟鼎恒持股1.79%,为明星股东之一 [4] 核心业务分析 视觉感知产品 - 视觉感知产品包括激光雷达、摄像头、超声波传感器及算法模组,覆盖DTOF激光雷达、三角测量激光雷达等多种类型,适配各类移动机器人场景 [8][10] - 2024年视觉感知产品收入3.41亿元,同比增长超1倍,但毛利率仅15.2%,显著低于同业奥普特(42%)、奥比中光(64%) [11][12] - 低毛利率源于产品集中在消费级服务机器人(如扫地机器人),缺乏议价力,公司采取降价策略维持市场份额 [13][14][15] 算法模组业务 - 算法模组涉及SLAM、路径规划等技术,2024年毛利率31.3%,但收入0.99亿元(占比20%),较2022年下滑超20% [16][17][18] - 收入萎缩因终端企业(如追觅、石头科技)加码算法自研,削弱对外部供应商依赖 [18] 新业务拓展:智能割草机器人 - 2024年推出首代智能割草机器人,销量超1万台,收入0.23亿元;2025年初销量已超1.5万台,超2024年全年 [24][25] - 该业务毛利率33.6%,显著高于传感器业务,有助于稳定整体毛利率(2024年整体毛利率19.5%,较2022年下滑8个百分点) [26][20] - 全球智能割草机市场渗透率不足2%(2024年销量38.35万台,规模61亿元),预计2029年渗透率将达17%,规模476亿元 [27] 行业竞争格局 - 国内竞争对手九号公司2024年割草机器人收入8.61亿元,追觅2025年出货量突破10万台,石头科技、优必选等亦纷纷入局 [29][30][31] - 乐动机器人2024年净亏损0.56亿元,计划通过IPO募资升级割草机器人技术,转型为全场景智能园林养护系统 [33][34][35]