视觉 - 财报，业绩电话会，研报，新闻

视觉

搜索文档

思看科技（688583）：3D视觉核心优势，物理AI第一步（“智”造TMT系列之三十二暨空间智能系列之二）

申万宏源证券· 2025-05-21 19:18

报告公司投资评级 - 首次覆盖，给予“买入”评级 [1][7][8][129] 报告的核心观点 - 思看科技是全球竞争力的3D扫描仪领军厂商，产品面向高端制造，3D算法、结构设计是核心优势 [7] - 公司有两大发展驱动，一是工业领域纵深、专业领域拓展，二是成为物理AI第一步、后续成为机器人的“眼睛” [7] - 预计公司25 - 27年分别实现收入4.3、5.5、7.3亿元，实现归母净利润1.6、2.1、2.7亿元，给予公司可比公司平均的25年PE 69x，对应“买入”评级 [7][8][120][129] 根据相关目录分别进行总结高精度3D扫描仪领军厂商 - 思看科技是3D视觉数字化综合解决方案提供商，以3D扫描仪为主，核心竞争力是算法、结构设计和3D软件技术 [18] - 公司产品矩阵丰富，从2015年推出手持式三维扫描仪开始不断拓展，应用于逆向工程、3D检测、3D打印等工业场景 [19][23] - 公司业绩稳健增长，标准化能力强，经营质量高，境外收入持续高增，覆盖多行业核心客户 [40][42][45][51] - 公司管理层年轻化，学术背景深厚，创始人团队长期共同创业且为实际控制人 [54][55] 硬件是载体，算法及结构是核心 - 公司核心是成像算法和光学结构能力，形成三大核心技术集群，掌握18项核心技术，在算法及软件方面有自主研发能力 [58] - 三维识别重建技术包括快速高精度边缘计算、内置摄影测量复合扫描、多波段扫描技术，可提升扫描效率和精度 [61][66][69] - 三维立体延伸技术包括跟踪范围扩展、孔测量、自动化三维扫描技术，可全方位获取真实三维数据 [70][74][76] - 立体视觉标定技术包括多波段扫描标定和自动标定技术，可自动化完成标定及3D扫描 [81][85] 驱动一：全球竞争力，产品渗透率提升 - 纵向来看，非接触扫描式测量有望取代传统接触式测量，国产扫描仪有价格优势，思看科技国内领先、全球第二，市占率有提升空间 [86][92][94] - 横向来看，三维视觉数字化产品分工业级、专业级和商业级，公司从工业精度下沉至专业级产品优势显著、空间广阔，如在医疗领域与强脑科技合作 [95][96][97] 驱动二：物理AI第一步，长期发挥视觉算法优势 - 物理AI是机器人重要实现基础，可完成与现实世界交互、生成物理数据以供训练 [103] - 公司3D高精度扫描可构建真实物理环境，从“万物数字化”到“虚拟物理世界”逻辑一致，长期有望成为人形机器人的“眼睛” [111][114][117] 盈利预测及估值分析 - 预计公司25 - 27年分别实现收入4.3、5.5、7.3亿元，工业级产品增速维持在25%，专业级产品增速维持在100% [120][121][122] - 预计公司25 - 27年实现归母净利润1.6、2.1、2.7亿元，工业级领域25 - 27年毛利率为77%/78%/80%，专业级领域为74%/75%/76% [125][127] - 选取凌云光、奥普特、铂力特为可比公司，给予公司可比公司平均的25年PE 69x，对应“买入”评级 [128][129]

DefinSight - AM自动化扫描软件

DefinSight - AM自动化扫描软件

iReal 3D彩色扫描软件

纯靠“脑补”图像，大模型推理准确率狂飙80%丨剑桥谷歌新研究

量子位· 2025-05-21 12:01

核心观点 - 剑桥、伦敦大学学院和谷歌的研究团队推出首个纯粹依靠图像进行推理的新范式——基于强化学习的视觉规划（VPRL），不再依赖语言中介 [1] - VPRL在多个视觉导航任务中准确率高达80%，性能超文本推理至少40%，首次验证视觉规划显著优于文本规划 [4][27] - 新框架利用GRPO对大型视觉模型进行后训练，性能表现远超基于文本的推理方法 [3][9] 技术框架 - VPRL分为两个阶段：策略初始化阶段通过随机游走轨迹初始化模型并最小化监督损失，强化学习优化阶段通过GRPO计算组内相对优势并最大化目标函数 [10][11][14][15] - 框架通过奖励函数评估动作有效性，奖励进展动作、零奖励非进展动作、惩罚无效动作 [16] - 选用VPFT和SFT作为基线比较，VPFT用最佳规划轨迹取代随机轨迹，SFT用文本描述取代中间视觉结果 [17] 实验设计 - 选取FrozenLake、Maze和MiniBehavior三个完全以视觉方式表达和执行的代表性任务 [19][20][21] - 采用LVM-3B作为视觉模型，Qwen 2.5VL-Instruct、Gemini 2.0 Flash和Gemini 2.5 Pro作为文本和多模态参考模型 [23] - 评估指标采用精确匹配率（EM）和进展率（PR），衡量模型生成规划轨迹的准确性和连续性 [25] 实验结果 - VPRL在三个任务中平均EM高达80.6%，远超文本基线（Gemini 2.5 Pro平均EM为43.7%） [27] - VPRL相比监督基线VPFT提升超20%，在复杂任务MiniBehavior中EM高达75.8% [28] - 随着网格尺寸增大，VPRL性能下降平缓（EM从97.6%降至82.4%），而Gemini 2.5 Pro从98.0%骤降至38.8% [31] - VPRL将无效失败率降低了24%，在FrozenLake、Maze和MiniBehavior任务中分别降至36.9%、25.1%和29.6% [32][33] 行业影响 - 首次验证纯视觉推理的可行性，推动多模态推理向更直观的图像化方向发展 [34] - 相关代码已开源，可供行业进一步研究和应用 [5] - 团队成员长期致力于视觉推理研究，曾研究通过多模态思维可视化（MVoT）生成视觉"思想" [34]

纯视觉推理

Artificial Intelligence

基于强化学习的视觉规划（VPRL）

纯视觉推理

Artificial Intelligence

基于强化学习的视觉规划（VPRL）

国内首个移动端视觉生成大模型“橘洲”V1端侧版在长沙上线

快讯· 2025-05-21 11:08

行业动态 - 国内首个基于国产算力预训练的视觉基座大模型"橘洲"V1端侧版在长沙正式上线 [1] - 该模型能在手机端实现1024×1024分辨率图像的秒级生成 [1] - 模型具有成本低、质量高、速度快、轻量级、可离线等特点 [1] 公司技术 - "橘洲"大模型由湖南汇视威智能科技有限公司自主研发 [1] - 依托中科曙光（603019）算力完成开发 [1] - 在较短时间内完成了近4000万张图片训练 [1] 行业突破 - 成为全国首个在国产算力上完成整体训练和推理过程的视觉基座大模型 [1] - 实现移动端部署的视觉基座大模型 [1]

中科曙光(SH:603019)

视觉生成大模型

Artificial Intelligence

橘洲V1端侧版

视觉生成大模型

Artificial Intelligence

橘洲V1端侧版

手机能畅玩，“橘洲”有多硬核？

长沙晚报· 2025-05-21 08:20

产品发布 - 湖南汇视威智能科技有限公司发布纯国产视觉基座大模型"橘洲"V1端侧版本适配智能手机端可实现1024×1024分辨率图像的秒级生成 [1] - "橘洲"是国内首个基于国产算力预训练的视觉基座大模型能在移动端实现部署和推理 [1] - 公司计划每月迭代一个版本并在开发者社区开源对应推理模型逐步扩展至文生视频、视频理解等功能 [10] 技术优势 - "橘洲"采用轻量化架构生成同样质量图片的体积和时间仅为国外主流开源模型的1/20 [8] - 模型参数量为云端解码模型的1/50 训练时间压缩至20小时速度提升5倍 [14] - 使用跨模型结构极限蒸馏技术在移动端保持图像生成质量出图步数压缩至4步 [13][14] - 在安卓和IOS端均实现秒级生成图片 IOS端256像素图片生成仅需2.5秒 [14] 市场定位 - "橘洲"定位为面向开发者的B端大模型底座旨在降低视觉大模型边端推理成本 [9] - 公司计划与生态合作伙伴共同打造多模态视觉模型服务矩阵赋能虚拟换衣、企业海报制作等行业场景 [9][10] - 目标是用大模型赋能千行百业未来三年瞄准万亿级大模型产业 [14] 研发背景 - 公司前身专注于视觉算法开发已完成智慧园区、智慧社区等12大行业板块布局突破数十项关键技术 [7] - 2024年下半年启动"橘洲"项目入选湖南省100个标志性数字新基建项目 [7] - 与中科曙光达成战略合作使用近70P国产算力进行模型训练 [12][13] 基础设施 - 采用中科曙光浸没液冷计算机技术数据中心能耗降低30% [12][13] - 构建了包含4000万张图片的高质量图文数据集采用高效能并行分布式训练策略 [13] - 嵌入了独特的中国文化基因库更符合国人使用需求 [14]

中科曙光(SH:603019)

视觉生成大模型

端侧部署

Artificial Intelligence

Artificial Intelligence

橘洲（V1端侧版本）

曙光浸没液冷计算机

奥比中光连跌6天，兴证全球基金旗下1只基金位列前十大股东

搜狐财经· 2025-05-20 22:46

奥比中光股价表现 - 5月20日连续6个交易日下跌，区间累计跌幅达-8 79% [1] - 近1周阶段涨幅-0 48%，近1月涨幅4 22%，近3月跌幅-6 03%，近6月跌幅-1 74%，今年以来涨幅0 33% [2] - 同类基金平均今年来涨幅3 71%，沪深300指数同期涨幅-0 93% [2] - 今年以来收益率在3936只同类基金中排名2732位 [1][2] 公司业务定位 - 奥比中光(688322 SH)是机器人视觉及AI视觉科技领域的领先企业 [1] - 核心业务方向为构建机器人与AI视觉产业中台，定位为打造机器人的"眼睛" [1] 基金持仓变动 - 兴证全球基金旗下兴全合润混合A一季度对奥比中光进行减持，该基金为前十大股东 [1] - 兴全合润混合A当前规模397 12亿元，基金经理谢治宇累计任职12年又114天，最佳任期回报503 14% [4] 基金管理人背景 - 基金经理谢治宇为经济学硕士，现任兴证全球基金副总经理兼研究部总监 [3][4] - 管理兴全合润混合型基金超9年，同时管理兴全合宜灵活配置混合等产品 [4] - 兴证全球基金成立于2003年9月，股东为兴业证券(持股51%)和全球人寿保险(持股49%) [4]

虹软科技: 关于部分募投项目结项并注销相关募集资金专户及理财产品专用结算账户的公告

证券之星· 2025-05-20 21:48

募集资金基本情况 - 公司首次公开发行股票共募集资金总额人民币1,328,480,000元，每股发行价28.88元，发行数量46,000,000股 [1] - 扣除保荐承销费53,000,000元后，募集资金初始金额为1,275,480,000元，实际到账金额1,254,550,834.47元 [1] - 因印花税减免308,405.42元，最终募集资金净额为1,254,859,239.89元 [1] 募集资金管理情况 - 公司制定了《募集资金管理制度》，对募集资金的存储、使用、投向变更等进行规范 [2] - 公司与中信银行杭州分行、上海浦东发展银行静安支行签订《募集资金专户存储三方监管协议》 [2] - 募集资金专户用于IoT领域AI视觉解决方案产业化项目、研发中心建设项目等 [3] 募投项目执行情况 - 公司募投项目包括智能手机AI视觉解决方案能力提升项目、IoT领域AI视觉解决方案产业化项目、光学屏下指纹解决方案开发及产业化项目、研发中心建设项目 [4] - IoT领域AI视觉解决方案产业化项目于2025年5月达到预定可使用状态并结项 [5] - 光学屏下指纹解决方案开发及产业化项目已终止，剩余资金转入IoT领域AI视觉解决方案产业化项目 [5][6] 项目结项及资金处理 - IoT领域AI视觉解决方案产业化项目结项后，节余募集资金将永久补充公司流动资金 [7] - 公司已完成中信银行杭州平海支行募集资金专户及杭州银行科技支行等理财产品专用结算账户的注销手续 [8] - 节余资金产生原因包括合理控制项目费用、闲置资金现金管理收益等 [7]

凌云光: 关于部分募集资金投资项目延期的公告

证券之星· 2025-05-20 21:15

募集资金基本情况 - 公司首次公开发行人民币普通股（A股）9,000万股，每股发行价格为21.93元，募集资金总额为人民币197,370.00万元，扣除发行费用（不含增值税）人民币16,841.67万元，募集资金净额为人民币180,528.33万元 [1] - 保荐机构全额行使超额配售选择权，超额配售募集资金净额为27,526.23万元 [2] - 募集资金已全部到位并存放于专项账户，与保荐机构、银行签署了监管协议 [2] 募投项目延期情况 - 工业人工智能算法与软件平台研发项目拟延期，原定2025年5月达到预定可使用状态，调整至2025年11月 [3] - 该项目总投资29,000.00万元，拟使用募集资金29,000.00万元，截至2025年4月30日累计投入募集资金21,465.12万元 [2] 延期原因 - AI技术快速迭代升级，公司需延长研发时间以提升算法模型的精准度和效能，保持技术领先优势 [3] - 延期旨在促进技术水平与行业前沿同步发展，满足日益提升的客户需求 [3] 延期影响 - 延期仅涉及项目完成时间调整，未改变投资内容、实施主体，不会对项目实施造成重大不利影响 [4] - 符合监管规定，不影响公司正常经营，符合长期发展规划 [4] 专项意见 - 监事会认为延期符合公司战略要求，不存在损害股东利益的情形 [4] - 保荐机构认为延期履行了必要程序，符合法律法规，不影响募集资金投资计划 [4]

爱威科技：5月19日召开业绩说明会，投资者参与

证券之星· 2025-05-20 17:35

公司业务与技术 - AI图像识别技术已拓展至血液检验、体液检验、病理检验、微生物检验等领域，致力于成为医疗检验实验室设备及配套产品一体化综合服务提供商 [2] - 原创性将机器视觉技术应用于显微镜检验自动化领域，解决了关键共性技术难题，实现了临床标本有形成分显微镜检验的自动化 [4] - 拥有20余年积累的临床标本显微图像数据库，包含多条件下各类标本图谱和特征模型库，形成了行业领先的数据优势 [4] - 通过深度学习、神经网络等AI技术实现显微镜有形成分分析全自动化，检验准确率和效率显著提升 [5] - 正在向非医疗领域拓展AI技术应用，如水生物检测、选矿检测等，相关产品处于样机阶段 [9] 财务表现 - 2024年归母净利润2284.12万元，同比增长6.07%，扣非净利润1559.93万元，同比增长24.99% [10] - 2025年一季度归母净利润632.1万元，同比增长24.63%，扣非净利润500.71万元，同比增长48.77% [10][13] - 2025年一季度主营收入5329.53万元，同比增长13.85%，毛利率55.59% [13] - 负债率10.17%，财务费用-12.44万元，投资收益147.68万元 [13] 行业前景与战略 - 高端医疗器械行业在国家进口替代政策、技术创新及全球化战略推动下具有广阔前景 [3] - 医疗检验医学正朝着集成化、全实验室自动化、智能化方向发展，AI技术与检验医学的深度融合是重要趋势 [12] - DRG/DIP政策实施使医疗机构更重视低成本高临床价值的检验项目，常规检验项目重要性凸显 [9] - 镜检作为三大常规检验之一，在临床诊断中具有不可替代性，相关产品需求广泛 [11] 增长驱动因素 - 产品方面：持续研发投入推动新产品推出和老产品迭代，保持技术竞争力 [8] - 市场方面：从三级医院向基层、民用、海外市场拓展，扩大客户群体 [8] - 团队方面：引进高素质研发和营销人员，优化团队结构 [8] - 成本控制：通过采购、生产制造等环节降本增效，产品成本下降 [13] 投资者关系 - 公募基金进入前十大股东，反映专业机构对公司基本面的认可 [7] - 计划通过合法合规渠道加强与专业投资者沟通，及时传达经营动态 [7]

手绘草图一键变3D游戏形象！腾讯出手AI游戏视觉设计

量子位· 2025-05-20 15:44

腾讯混元游戏视觉生成平台核心功能 - 公司发布一站式AIGC游戏内容生产引擎Hunyuan-Game，定位为工业级游戏资产生成的AIGC系列大模型[4][40] - 平台已上线四大能力：AI美术管线、实时画布、AI 2D美术（文生图/图生图）、专业角色多视图生成[6] - 支持手绘草图实时生成游戏角色形象，并输出透明图层和黑白稿上色功能[8][10][12] - 可快速修改材质和生成各种特效风格，提升美术设计效率[14][16] - 角色多视图生成保持99%主体一致性，已应用于头部游戏项目使效率提升300%[38][39] 技术架构与模型矩阵 - 包含四大游戏图像模型：生图大模型底座/特效生成模型/透明图生成模型/角色原画生成模型[42] - 特效生成模型覆盖17种特效类型和5大类风格，达到头部游戏标准[42] - 五大视频模型包括：图生视频基座模型/角色360°生成模型/动态立绘模型/视频超分模型/交互式视频模型[43][45][47][51][54] - 视频超分模型支持2K高清转换，交互式模型可实现开放世界游戏场景的实时内容生成[52][54] 工作流程创新 - 提供"灵感获取-绘制概念-生成多视图"全流程一站式服务[21] - AI 2D美术灵感功能基于百万级游戏数据训练，具备中文Prompt深度解析能力[22][23] - 实时画布采用自研全球首个实时生成引擎，支持边绘制边渲染精修[32][33] - 多视图生成环节自动衔接前序步骤，可输出A/T pose标准视图和360°旋转视频[35][36] 行业应用与开放计划 - 技术报告详细披露模型能力矩阵，面向游戏行业设计师开放体验入口[41][55] - 生图模型已开放API端口，视频交互模型计划下个月开源[56][57] - 动态立绘模型已应用于《王者荣耀》皮肤循环微动效果[49]

Robot猎场备忘录· 2025-05-20 13:01

具身智能的核心观点 - 具身智能为机器人领域注入新活力，有望突破性能上限，需保持开放态度避免派别之争 [1] - 具身智能是跨学科产物，依赖材料科学、生物力学等多领域协同突破，而非单一技术路径 [2][6] - 当前具身智能处于早期阶段，人形机器人能力仅相当于自动驾驶"L0"水平，硬件和算法均未成熟 [7] 学科与技术发展 - 传统机器人学的"特殊任务研究"对具身智能有间接贡献，如波士顿动力动态平衡算法、蛇形机器人柔性驱动技术 [2] - 技术迭代呈现沉积效应，如GAN框架仍影响当前AI领域，VLA模型可能被更高效方案取代但会留下技术遗产 [5] - 纯软件算法难以构建长期壁垒，需结合工程实践、材料工艺等"脏活累活"形成护城河 [12] 通用性与具体性 - 通用智能需建立在具体问题钻研基础上，如达芬奇手术机器人亚毫米级操作依赖生物组织参数积累 [3] - 产业需求如汽车线束整理、半导体封装高精度要求等"不性感"的工程细节是锤炼智能的关键场景 [3] - 人形机器人形态优势仅限于人类环境适配，物流/农业等领域专用非人形机器人更具成本效率 [11] 技术路径与产业实践 - VLA技术路径存在争议，儿童和乌鸦案例显示操作能力可独立于语言系统，当前大模型性价比低 [8][9] - 短期优先采用learning与model结合方法，长期纯learning或成主流但需脑科学等学科突破支持 [10] - 工业界更认可model-based解决方案因其稳定可控，端到端大模型并非客户关注重点 [10] 行业动态与案例 - 人形机器人马拉松比赛暴露当前技术局限，多数需人工干预且电机发热问题突出 [7] - 行业存在同质化重复项目风险，需警惕过度追求"酷炫"而忽视经济性 [11] - 华为、智元机器人等公司加码人形机器人赛道，全栈自研和跨领域协作成为焦点 [15][16][18]