视觉 - 财报，业绩电话会，研报，新闻

视觉

搜索文档

建筑装饰行业专题研究：国产替代系列：富煌钢构拟收购中科视界布局第二曲线，看好高速视觉领域需求成长及国产替代加速

天风证券· 2025-05-23 18:23

报告行业投资评级 - 行业评级为强于大市（维持评级） [4] 报告的核心观点 - 高速摄像机市场高速增长，国产替代需求进一步提升，预计2023 - 2028年中国高速机器视觉行业年均复合增速约为22%，到2028年市场规模或将突破330亿元 [1] - 中科视界市场份额快速提升，在国产替代、自主可控背景下有望实现较高速增长 [2] - 富煌钢构拟收购中科视界，转型高速视觉领域打开第二成长曲线，且钢结构主业景气度边际改善 [2][3] 根据相关目录分别进行总结中科视界：布局高速视觉新赛道，国内少有的万帧高速相机厂商 - 中科视界2006年在中科大实验室开始技术孵化，2011年正式成立，2017年发布国产首台万帧级高速相机，拥有自主知识产权核心技术，打破国外技术垄断实现国产替代 [10] - 富煌建设通过一致行动人协议控制中科视界76.27%股份，2024年12月20日富煌钢构公告拟收购其100%股份，交易完成后中科视界将成全资子公司 [13] - 中科视界主营高速图像采集等仪器及系统研发销售，主推高速摄像机系列，包括高灵敏超高速摄像机NEO25等多种产品 [16][18] - 2020 - 2024年11月中科视界营业收入分别为0.41亿、0.77亿、1.52亿、1.91亿、1.79亿元，2022 - 2024年11月净利润为0.33亿、0.14亿、0.22亿元，参考可比公司，收购成功或提升富煌钢构市值 [21][25] 需求侧：下游应用场景广泛，国产替代进一步催生需求 - 高速视觉上游为光学成像和图像处理器件，下游应用于工业自动化等多领域，中科视界客户分科研和工业客户，提供综合解决方案具先发优势 [27][29] - 下游需求推动中国高速摄像仪市场规模增长，2022年高速机器视觉行业规模近100亿，高速摄像机整机占32亿，预计2023 - 2028年年均增长率约22%，2028年规模或超330亿 [30] - 中美贸易摩擦使高速视觉仪器国产替代进程加快，美国出口管制下中科视界部分产品可缓解进口受限压力 [33] 供给侧：国内市场份额稳步提升，已跻身高速视觉领域头部品牌 - 高速视觉行业头部多为海外品牌，中科视界“千眼狼”品牌知名度提升，是国内唯一长期自研自产自销的国产高速摄像机企业，属全球第二梯队 [37] - 中科视界市场份额稳步提升，2022年高速摄像机品牌产品市场占有率提升98%，2024年12月全球高速相机中标份额占58%，中标金额占49%，美国出口限制下市占率有望提升 [38] 富煌钢构：钢结构传统主业，积极布局产业升级转型 - 富煌钢构1987年创立，2015年上市，2017年并购君达高科，有三大智能制造基地，与山东华茂合作建基地，总产能预计60万吨 [39] - 富煌钢构股权结构稳定，实控人为杨俊斌，2024年钢结构业务收入占比87.6%，收入34.5亿，产量27.5万吨，销售主要在华东区域 [42][45] - 2025年1 - 3月新签销售合同额约13.3亿，同比增长57.32%，24Q3、24Q4、25Q1新签订单分别同比增长26.8%、76.1%、57.3%，下游需求有望回暖 [51] - 2019 - 2021年公司收入利润增长，2022年以来受下游需求疲软和减值拖累，2024年营业收入39.37亿，同比下滑15.06%，归母净利润0.51亿，同比下滑46.51% [56] - 2024年公司毛利率2.02%，同比下滑0.67pct，期间费用率有升有降，资产及信用减值损失约3千万，占收入比重0.77%，同比提升0.46pct [58] - 2024年公司经营性现金净流入0.63亿，同比多流入0.43亿，收付现比分别为83%、74%，同比-26pct、-24pct [64]

国产替代系列：富煌钢构拟收购中科视界布局第二曲线，看好高速视觉领域需求成长及国产替代加速

天风证券· 2025-05-23 16:41

报告行业投资评级 - 行业评级为强于大市（维持评级）[4] 报告的核心观点 - 高速摄像机市场高速增长国产替代需求提升 2022 年中国高速机器视觉行业市场规模约 100 亿元预计 2023 - 2028 年年均复合增速约为 22% 到 2028 年或将突破 330 亿元[1] - 中科视界技术壁垒高市场份额快速提升产品市占率由 2019 年 8.6%提升至 2022 年的 22.2% 有望在国产替代背景下实现较高速增长[2] - 富煌钢构拟收购中科视界转型高速视觉领域有望打开第二成长曲线且钢结构主业景气度边际改善 24Q3、24Q4、25Q1 新签订单分别同比增长 26.8%、76.1%、57.3%[2][3] 根据相关目录分别总结中科视界：布局高速视觉新赛道，国内少有的万帧高速相机厂商 - 中科视界 2006 年开始技术孵化 2011 年正式成立 2017 年发布国产首台万帧级高速相机拥有自主知识产权核心技术打破国际技术垄断[10] - 富煌建设通过一致行动人协议控制中科视界 76.27%股份 2024 年 12 月 20 日富煌钢构拟收购其 100%股份[13] - 中科视界主营高速图像采集等仪器及系统研发等产品适用于多领域主推高速摄像机系列有多款产品及性能参数[16][18][19] - 2020 年度至 2024 年 11 月中科视界营业收入分别为 0.41 亿元、0.77 亿元、1.52 亿元、1.91 亿元、1.79 亿元 2022 年至 2024 年 11 月净利润为 0.33 亿元、0.14 亿元、0.22 亿元[21] - 参考可比公司若收购成功或提升富煌钢构市值[25] 需求侧：下游应用场景广泛，国产替代进一步催生需求 - 高速视觉上游为光学成像等器件下游应用于多领域中科视界客户分科研和工业客户提供综合解决方案获认可[27][29] - 下游需求推动中国高速摄像仪市场规模增长 2022 年高速机器视觉行业市场规模近 100 亿元预计 2023 - 2028 年年均增长率约 22% 2028 年或突破 330 亿元[30] - 中美贸易摩擦使高速视觉仪器国产替代进程加快中科视界部分产品可缓解进口受限压力[33] 供给侧：国内市场份额稳步提升，已跻身高速视觉领域头部品牌 - 高速视觉行业头部多为海外品牌中科视界"千眼狼"品牌知名度提升是国内唯一长期自研自产自销的国产高速摄像机企业属第二梯队[37] - 中科视界市场份额稳步提升 2022 年高速摄像机品牌产品市场占有率提升 98% 2024 年 12 月全球高速相机中标份额占 58% 中标金额占 49% 市占率有望进一步提升[38] 富煌钢构：钢结构传统主业，积极布局产业升级转型 - 富煌钢构 1987 年创立 2015 年上市有三大智能制造基地与山东合作基地总产能预计 60 万吨[39] - 富煌钢构股权结构稳定实控人为杨俊斌第一大股东是富煌建设持股 33.22%[42] - 公司产品有重型钢结构等 2024 年钢结构业务收入占比 87.6% 收入 34.5 亿同比 - 16.4% 产量 27.5 万吨同比下滑 31.33% 销售主要在华东区域[45] - 新签订单连续三个季度正增长 25Q1 累计新签合同额约 13.3 亿同比增长 57.32% 预计下游需求回暖[51] - 近年来公司收入、利润下滑 2024 年营业收入 39.37 亿元同比下滑 15.06% 归母净利润 0.51 亿同比下滑 46.51%[56] - 2024 年毛利率为 2.02% 同比下滑 0.67pct 期间费用率有变化资产及信用减值损失约 3 千万占收入比重 0.77% 同比提升 0.46pct[58] - 2024 年经营性现金流小幅改善净流入 0.63 亿同比多流入 0.43 亿收付现比分别为 83%、74% 同比 - 26pct、 - 24pct[64]

多模态长文本理解测评首发：46款模型无一攻克128K难关

量子位· 2025-05-23 14:14

多模态长文本理解评估基准MMLongBench - 香港科技大学、腾讯西雅图AI Lab等机构联合推出首个综合性多模态长文本评估基准MMLongBench，覆盖5大类型任务的16个数据集，包含13,331个长文本样本[1][2] - 基准涵盖Visual RAG、大海捞针、many-shot in-context learning、长文档摘要和长文档VQA五大任务，兼顾自然图像与合成图像[2][8] - 采用跨模态长度控制技术，统一以image patch和text token计算输入长度，标准化8K/16K/32K/64K/128K五种上下文长度[3][11] 模型性能评估结果 - 测试46个领先多模态大模型（含GPT-4o、Gemini-2.5-Pro等闭源模型和Qwen2.5-VL-72B等开源模型），所有模型在长上下文任务中表现均未超过80分[5][6][14] - 128K长度下顶尖开源模型InternVL3-38B、Qwen2.5-VL-72B平均分仅49.8和48.7，闭源模型GPT-4o平均分62.9[14] - 推理能力增强的模型（如Gemini-2.0-Flash-T）在summarization任务上表现提升25.3%，DocVQA任务提升10.1%[15] 关键发现与技术瓶颈 - 不同任务间Spearman相关系数低于0.85，证明单一任务评估无法全面反映模型长文本理解能力[17] - OCR能力成为处理长文档的主要瓶颈：Qwen2.5-VL系列更擅长处理图像PDF，Gemma3-27B在≤32K长度时偏好OCR纯文本[19][20] - 跨模态检索能力不足：将Visual RAG任务图像替换为实体名称后，Gemma3-27B在128K长度下表现提升26.4[22] 数据集与技术细节 - 基于16个公开多模态数据集重构，通过拼接/截断控制上下文长度（如Visual RAG任务拼接Wikipedia段落）[9] - 采用Llama2分词器计算文本token，图片划分为14×14 patch并应用2×2 pixel unshuffle压缩视觉token[11] - 评测代码与数据集已开源，包含评测框架、数据处理工具和标准化评估协议[4][22]

巧妙！一个传统技术让国产视觉基础模型直接上大分

量子位· 2025-05-23 14:14

金磊发自凹非寺量子位 | 公众号 QbitAI 咱就是说啊，视觉基础模型这块儿，国产AI真就是上了个大分—— Glint-MVT ，来自格灵深瞳的最新成果。先来看下成绩—— 线性探测（LinearProbing）：简单来说，线性探测是一种测试预训练模型效果的小技巧，测的就是基本功扎不扎实。它的做法是：把模型最后一部分换成简单的线性层，其他部分全部保持原样不动；然后只训练这个新加的线性层，通过它的表现来判断模型之前学到的特征好不好用。再来看应用效果。如果说视觉基础模型是一个底座，那么它的下游任务，像 "图像理解+分割一切" ，便是更为直观的效果展现。例如下面这张图片，然后我们可以问一下AI：你能提供一个分割掩膜给这个图像中触摸篮球的人吗？很显然，这个任务的难点在于拿篮球的人被其他人的手、身体等部位挡住，分割难度也大幅增加。然而，国产AI是不在怕的，啪的一下，超精细地把要求的人物给抠了出来：我们再来看下更加复杂的案例：这个测试是在26个分类测试集中跟CLIP和OpenCLIP做了对比，结果显示，国产视觉基础模型平均准确率比OpenCLIP高2.3%，比CLIP高 1.1%。面 ...

格灵深瞳(SH:688207)

视觉基础模型

具身智能

Artificial Intelligence

Artificial Intelligence

Glint - MVT

Glint - RefSeg模型

MVT - VLM模型

宝马视平线全景显示年内上车，将搭载在首款新世代SAV车型上

凤凰网· 2025-05-23 13:19

技术突破 - 宝马集团研发的视平线全景显示技术即将在新世代车型中应用将整个挡风玻璃转化为显示界面超越现有HUD体验 [1] - 该技术采用超近距离投影方案实现从A柱到A柱的全景显示效果成像面积达40英寸支持4K级画质和100,000:1图像对比度 [1] - 核心技术为专利纳米黑色涂层可消除反射和炫光干扰确保复杂光线环境下的显示效果 [1] 技术发展历程 - 宝马在HUD领域布局始于2003年是首个在量产车中引入平视显示技术的欧洲制造商 [1] - 2021年申请全景显示技术发明专利 2023年推出BMW全景视域桥概念验证技术路线基于长期战略系统性推进 [1] 用户体验验证 - 宝马中国研发团队自2020年启动可用性研究累计1180名用户参与测试访谈研究时长超4700小时 [1] - SkyLab人机交互研究中心进行三年数字验证基于600万中国用户脱敏数据完成算法训练 [1] 技术设计特点 - 采用"视觉锥"设计概念将驾驶、导航、警示等关键信息按人眼自然视线分层排布减少视觉焦点切换时间和频率 [2] - 系统不仅优化驾驶者体验副驾驶和后排乘客也能清晰获取信息 [2] 行业影响 - 全景显示技术反映汽车行业智能座舱领域技术竞争加剧传统HUD局限小范围显示全景技术显著扩大信息展示空间 [2] - 宝马首款搭载全景iDrive系统的新世代SAV车型计划2025年内推出基于技术成熟度和市场对智能座舱创新需求预期 [2]

CVPR 25 |全面提升视觉感知鲁棒性，生成模型快速赋能三维检测

机器之心· 2025-05-23 12:17

自动驾驶技术发展 - 新能源汽车产业持续发展推动智能驾驶辅助技术广泛应用，基于纯视觉的自动驾驶方案因成本低、效率高备受关注 [1] - 行业领先者Waymo近期召回1200辆自动驾驶车辆，因算法识别道路障碍物存在潜在风险，凸显系统鲁棒性挑战 [3][4] - 视觉感知模型泛化能力不足是行业痛点，分布偏移（如天气变化）导致性能显著下降，制约实际应用 [5][6] 技术难点与解决方案 - 自动驾驶面临数据分布不均衡问题，特殊天气（大雪、沙尘暴）数据采集成本高且稀缺 [6][7] - 无训练可控生成（Training-free Controllable Image Generation）成为新兴范式，通过文本指令快速生成新场景图像，成本低效率高 [8][10] - DriveGEN方法通过两阶段策略（自注意力物体原型提取+原型引导生成）实现三维信息保留，代码已开源 [14][16][17] DriveGEN技术突破 - 在KITTI-C数据集测试中，DriveGEN在6种增广场景（雪、雨、雾等）下平均性能达37.98%，显著优于传统增广方法（如Color Jitter仅26.45%）[24] - 多目三维检测实验中，仅用500个场景生成的3000张雪天图像即提升模型性能，验证方法在nuScenes-C等真实场景的有效性 [26][27] - 消融实验证实物体原型提取和浅层特征对齐对保留小物体信息至关重要，如行人框下采样后仍能准确保留 [28][29] 行业应用前景 - 该方法可快速生成恶劣天气等罕见场景数据，解决传统机器学习依赖理想训练数据的局限性 [6][8] - 实验表明DriveGEN能提升单目/多目三维检测模型在噪声、模糊、天气变化等域外场景的鲁棒性，推动自动驾驶落地 [24][26] - 可视化结果展示生成图像保留原始三维标注信息，为感知模型提供高质量训练数据 [30][31]

机器视觉赋能视光眼科产品智能生产，「平方和科技」获近亿元B+轮融资｜36氪首发

36氪· 2025-05-23 08:31

文｜胡香赟编辑｜海若镜 36氪获悉，平方和（北京）科技有限公司（下称"平方和科技"）已于近期完成近亿元B+轮融资。本轮融资由北京市先进制造和智能装备产业投资基金独家投资。资金主要用于研发、拓展和落地新的行业应用。值得一提的是，2024年10月，平方和科技刚刚完成过一轮数亿元融资，该轮融资的新投资方包括同创伟业、元禾璞华、雅惠投资和相城金控，老股东云晖资本、博行资本及熵一资本持续加持。这也成为公司在一年内完成的又一轮大额融资。平方和科技成立于2018年，专注于提供基于计算机视觉系统的智能化解决方案。创始人蔡仲伦博士曾任职于库博光学，在工业视觉系统领域拥有10余年开发经验。现阶段，公司的主要服务领域以视光眼科行业、高端医疗器械和医药行业为主，合作客户既包括CooperVision、海昌集团、蒂螺集团、爱博诺德集团、康视达集团等头部隐形眼镜生产企业，也涵盖国药集团、诺华制药、第一三共、扬子江药业、科伦药业、健帆、威高等国内外药/械公司。 2024年，平方和科技已实现数亿元收入。其中，隐形眼镜以及视光耗材相关业务占大多数。公司预计，未来2到3年内，隐形眼镜业务仍将是主营业务，但医药和其他医疗器 ...

科技日报· 2025-05-23 07:51

研究人员用三色正交上转换纳米颗粒取代了传统的上转换纳米颗粒，制备出了三色上转换隐形眼镜，可以将三种不同光谱的近红外光转换成红、绿、蓝三基色的可见光。实验证明，通过佩戴三色上转换隐形眼镜，人类志愿者可有效识别三种波长的近红外光，感知多种近红外色彩。研究人员表示，该技术在医疗、信息处理及视觉辅助技术领域具有广泛应用前景。 22日，记者从中国科学技术大学获悉，该校生命科学与医学部薛天、马玉乾团队与国内外科研机构合作，制备出高透明、高转化效率的上转换隐形眼镜，可实现人类近红外时空色彩图像视觉能力。相关研究成果5月22日在线发表在国际期刊《细胞》上。人类肉眼可感知的可见光仅占电磁波谱很小的一部分。此前，研究团队与合作者将一种可以把近红外光转换为可见光的上转换纳米颗粒注射到动物视网膜中，首次实现哺乳动物的裸眼近红外图像视觉能力，研究成果于2019年发表在《细胞》。但该研究的眼内注射在人体应用中受限，如何通过非侵入性方式实现近红外视觉，是该技术实用化的关键挑战。高分子聚合材料制备的软性透明隐形眼镜提供了一个可佩戴式解决方案。为此，研究人员对上转换纳米颗粒进行表面修饰，提高它们在高分子聚合材料中的均匀分 ...

Cell：突破人类视觉极限，我国学者开发红外隐形眼镜，闭眼也能“看见”红外世界

生物世界· 2025-05-23 07:46

核心观点 - 研究团队开发了一种可穿戴近红外上转换隐形眼镜（UCL），通过非侵入性方式实现人类近红外时空色彩图像视觉 [3][5][6] - 该技术突破了传统红外探测工具的局限性，无需额外能量支持且具备高透明度与生物相容性 [2][5][6] - 通过三色正交上转换纳米颗粒（trichromatic UCNP）实现多光谱近红外光向红、绿、蓝三基色的转换，首次验证人类近红外色彩视觉 [7][9] 技术突破材料与设计 - 采用表面修饰的上转换纳米颗粒（UCNP）与折射率匹配的高分子聚合材料，实现7-9%高掺杂比例，可见光透明度超90% [5] - 开发内置UCL的可穿戴框架眼镜系统，优化光学设计后使近红外图像分辨率达到可见光水平 [6] - 三色正交UCNP（tUCL）可区分三种近红外波长并转换为三基色，避免光谱干扰 [7][9] 性能验证 - UCL具备力学柔性、亲水性和生物相容性，小鼠实验证实其可感知时间频率与方位信息 [6] - 人类志愿者能识别近红外光强、时间编码及复杂图形，tUCL进一步实现多维度色彩信息解码 [6][7][9] 应用前景 - 为医疗（如色盲治疗）、信息处理及视觉辅助技术提供新解决方案 [9] - 未来需提升上转换效率并优化发射光定向输出，以摆脱红外光源辅助依赖 [12]

奥比中光：让机器人从“看得清”到“看得懂”

证券时报· 2025-05-23 01:27

财务表现 - 2025年第一季度营收达1.91亿元同比增长10563% [2] - 归母净利润约2432万元实现扭亏为盈 [2] - 2024年3D视觉传感器生产量达8884万台同比增长171% [5] 技术实力 - 累计申请专利1868件 [2] - 完成五代深度引擎芯片三款dToF感光芯片两款iToF感光芯片的开发和量产 [2] - 具备结构光 iToF 双目 dToF Lidar 工业三维测量等全领域技术路线布局 [3] - 深度相机Femto Bolt被斯坦福大学李飞飞教授团队用于"空间智能"研究 [3] 市场地位 - 国内服务机器人视觉市场占据主导地位 [4] - 与超百家机器人企业达成业务合作 [2] - 为全球超1000家客户与开发者提供一站式产品和服务 [2] 产品应用 - 工业机器人领域实现精准测距智能避障等功能应用于智能工厂仓储物流等场景 [4] - 人形机器人领域Femto系列iToF深度相机和Gemini系列双目结构光深度相机达到行业领先 [4] - 已与部分人形机器人客户进行适配 [4] 生态合作 - 接入Mac生态接入NVIDIA Isaac平台 [2] - 与微软 NVIDIA AMD等国际巨头建立稳定生态合作 [2] - 发布多款开发者生态套件与解决方案 [2] 产能建设 - 顺德基地2023年10月投产 [5] - 佛山顺德3D视觉感知产业智能制造基地建筑面积超10万平方米 [5] - 一期已顺利投产 [5]