Workflow
计算机视觉
icon
搜索文档
少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了
机器之心· 2025-11-02 09:37
技术核心与创新点 - 提出SERES方法,通过语义匹配先验与区域级正则两条主线,解决稀疏视角下表面重建的几何准确性、细节还原与结构完整性挑战 [4][8] - 语义匹配先验从输入图像提取语义块与几何原语,进行多视角交互式对齐与聚合,为重建主干提供跨视角对应关系,减少错配带来的形状扭曲与边界模糊 [10][12] - 区域级正则基于几何原语生成区域分割掩膜,与模型渲染的语义分布对齐,形成结构层面的一致性约束,有效抑制噪声碎片,获得更干净连贯的网格 [14][16] - 该方法以训练期插件方式接入NeuS或Neuralangelo等主流主干,不改变推理流程,接口简单且额外计算开销小 [8][16] 性能表现与实验结果 - 在DTU稀疏多视角设置中,SERES作为插件显著提升重建质量与新视角合成质量,几何误差稳定下降 [17] - SERES+NeuS组合在DTU数据集上的平均误差为1.24,显著优于原始NeuS的4.00 [18] - SERES+Neuralangelo组合在DTU数据集上的平均误差为1.10,显著优于原始Neuralangelo的3.52 [18] - 在BlendedMVS及多种真实场景(高反射、复杂拓扑、低纹理)中,SERES输出更完整干净的几何,有效减少断裂与噪声,体现出良好鲁棒性与通用性 [22] 应用前景与工程价值 - 该方法不需要额外传感器或复杂改造,以即插即用方式接入现有隐式重建框架,迁移门槛低 [26][27] - 适合直接集成到当前稀疏三维重建工作流中,用更少视角获得更高保真的几何重建,对工程团队友好 [27]
南凌科技股份有限公司关于公司
上海证券报· 2025-10-30 07:32
交易概述 - 南凌科技拟使用自有或自筹资金10,000万元人民币投资中科方寸知微(南京)科技有限公司,其中3,000万元用于受让原股东部分股权,7,000万元用于增资 [7][9] - 交易完成后,公司将合计持有标的公司12.9521%的股权,标的公司不纳入公司合并报表范围 [7][9] - 本次交易已经公司董事会及相关专业委员会审议通过,在董事会审批权限内,无需提交股东会审议,不构成关联交易或重大资产重组 [8][9] 交易定价与结构 - 股权转让部分对应标的公司投前估值为6.08亿元,增资部分对应投前估值为7.60亿元,整体估值与标的公司最近一轮融资估值基本相当 [11] - 投资价格主要基于标的公司的行业前景、技术研发实力、客户资源及经营业绩展望等因素协商确定 [12] - 增资款将分两期支付,第一期5,000万元于2025年12月31日前支付,第二期2,000万元于2026年4月30日前支付 [20] 标的公司基本情况 - 中科方寸知微是一家专注于计算机视觉人工智能技术在边缘端应用的高科技企业,注册资本为1,177.5413万元 [11] - 公司核心业务是通过模型压缩算法、计算机视觉感知算法等技术,为电网、石化等行业提供智能巡检、安全监控等智能化运维解决方案 [22] - 标的公司2024年度财务报表已经立信会计师事务所审计,其股权清晰,无抵押质押或权利限制 [11][13] 交易目的与战略影响 - 此次战略投资旨在为公司核心业务"凌云服务"注入顶尖AI技术与垂直行业应用场景,强化"云智网安"融合服务矩阵的竞争力 [22] - 双方将优势互补,共同构建"网络+安全+算力+算法"一体化服务能力,形成端到端的闭环数智化解决方案 [22] - 投资有助于优化公司业务布局,提升综合竞争力,对公司持续发展及效益提升将产生积极影响 [23]
混元3D开源端到端全景深度估计器,代码+精选全景数据已上线,在线可玩
量子位· 2025-10-14 12:08
文章核心观点 - 腾讯混元3D团队提出了一种名为DA的全景深度估计器,该模型具备高精度、强大的零样本泛化能力以及完全端到端的特性 [2] - 该技术旨在解决全景深度估计领域因数据稀缺和球面畸变导致的泛化能力差和效率低下的核心挑战 [1][10] - 通过创新的数据扩充引擎和SphereViT模型架构,DA在多个基准测试中实现了最先进的性能,其关键指标AbsRel比最强的零样本方法平均提升38% [23][24] 背景与挑战 - 全景图提供360°×180°的沉浸式视角,是AR/VR和沉浸式图像生成等应用的关键视觉表示 [5][6] - 高质量的全景深度信息对于3D场景重建、物理模拟和世界模型等高级应用至关重要 [6] - 行业面临的主要挑战包括全景深度数据稀缺导致模型零样本泛化能力有限,以及全景图固有的球面畸变使得许多现有方法效率不理想 [1][10] 核心贡献:数据扩充 - 公司开发了一个数据管理引擎,将透视样本转换为高质量的全景数据,以扩展数据规模 [11] - 该引擎通过透视到等距矩形投影和全景外推技术,生成“完整”的全景图,解决了模型因缺乏全局背景和球面畸变差异而性能不佳的问题 [12] - 此引擎创造了约543,000个全景样本,将总样本数从约63,000扩展到约607,000,实现了约10倍的数据扩充,显著提升了模型的零样本性能 [14] 核心贡献:模型架构与训练 - 公司提出了SphereViT模型架构,通过计算球面角并生成球面嵌入,使图像特征能明确关注全景图的球面几何形状,从而有效减轻球面畸变影响 [16][17] - 与标准ViT不同,SphereViT采用交叉注意力机制,将图像特征作为查询,球面嵌入作为键和值,产生可感知畸变的表示 [17] - 模型的训练结合了距离损失和法线损失,前者约束全局精确的距离值,后者促进局部平滑且锐利的几何表面 [18] 实验结果 - 在斯坦福2D3D、Matterport3D和PanoSUNCG等多个数据集上的基准测试表明,DA实现了最先进的性能 [19][23] - 具体而言,DA在关键评估指标上表现优异,例如在斯坦福2D3D数据集上,其AbsRel为7.23,RMSE为14.00,δ1为95.45 [21] - 定性比较显示,由于训练数据量是UniK3D的约21倍,DA展现出更精确的几何预测,并且优于受多视角不一致性限制的MoGev2等方法 [27] 应用场景 - 该技术能有效支持广泛的3D重建相关应用,例如全景多视图重建 [28] - 模型能够根据房屋不同房间的全景图像,重建出全局对齐的3D点云,确保多个全景视图之间的空间一致性 [29]
苹果拟收购 Prompt AI,后者 Seemour 应用专攻监控识别分析领域
环球网资讯· 2025-10-11 12:31
收购交易核心信息 - 苹果公司正与计算机视觉初创企业Prompt AI进行收购的“最后阶段谈判”,计划将其核心技术及人才纳入麾下[1] - 交易完成后,部分未能加入苹果的员工将获得补偿并可申请苹果其他空缺岗位,公司投资人将实现部分资金回收但无法完全收回前期投资[1] - Prompt AI领导层已召开全员会议通报交易进展,并要求员工在公开沟通时暂不提及苹果公司名称[1] 被收购方Prompt AI概况 - Prompt AI成立于2023年,同年完成由AIX与Abstract Ventures领投的500万美元种子轮融资[3] - 公司核心产品为Seemour应用,可与家庭安防摄像头连接,具备高级识别与分析功能,能精准识别人物、宠物及物体,对异常活动实时警报或生成文字描述,并能响应用户针对画面内容的提问[3] - 尽管技术成熟度与应用实用性获市场认可,但现有商业模式未达预期,公司计划下线Seemour应用并删除相关用户数据以保障隐私[3] 行业趋势与背景 - 当前硅谷科技巨头普遍通过“人才收购”模式吸纳AI领域优质团队,以快速提升研发实力并规避监管压力[3] - 相较于Meta以143亿美元投资Scale AI及谷歌以24亿美元与Windsurf达成协议等大规模动作,苹果此次收购规模相对较小[3] - 苹果在收购策略上一贯保持谨慎克制,自成立近半个世纪以来最大一笔并购是2014年以30亿美元收购Beats,更倾向于低调收购小型技术团队进行深度整合[4] 对苹果公司的潜在影响 - 此次收购被视为苹果加码智能家居安全与视觉感知生态建设的重要动作[1] - 业内预计Prompt AI的技术与团队将被整合至苹果HomeKit智能家居部门,为家庭视觉感知与安全生态体系提供更强技术支撑[4] - 市场分析指出苹果在生成式AI领域进展相对缓慢,部分原因在于不愿开展大规模并购,今年以来苹果股价累计下跌约2%,在美股“科技六巨头”中表现最弱[4]
Insta360最新全景综述:全景视觉的挑战、方法与未来
机器之心· 2025-10-04 11:38
文章核心观点 - 全景视觉与常规透视视觉存在根本性差异,直接将基于透视视觉开发的算法迁移到全景视觉往往失效 [6] - 文章首次以“透视-全景 gap”为主线,系统梳理了三大核心挑战、两条核心技术路线与未来方向展望 [6] - 旨在为研究者提供“按任务选解法”的指南,并为工程团队“按场景落地”提供清晰坐标 [6] 研究背景与动机 - 全景图像捕捉的是360°×180°的完整球面视域,而常规透视图像是大部分计算机视觉任务使用的标准输入 [6] - 全景视觉在虚拟现实、自动驾驶、具身智能等新兴应用中正成为不可或缺的研究方向 [6] 全景视觉的核心挑战 - **几何畸变**:球面展开到平面时,两极区域被严重拉伸,物体形状被破坏 [7] - **非均匀采样**:赤道像素密集、极区像素稀疏,同一物体在不同纬度分辨率差异明显 [7] - **边界连续性**:等距矩形投影(ERP)图像的左右边界在球面上相邻,但在二维图像上被分割,导致模型学习出现连续性问题 [7] 核心技术路线与策略适配 - **失真感知方法**:直接在ERP全景格式上建模,通过畸变设计、畸变图权重或自适应注意力来补偿极区问题,优势在于保留全局像素级别的语义对应且与主流架构高度兼容 [10][13] - **投影驱动方法**:通过立方体投影(Cubemap)、切平面投影(Tangent)等将球面转换为多个畸变较小的子视图,优势在于有效缓解极区畸变并能直接复用透视模型和大规模预训练网络 [13] - **策略适配**:失真感知方法更适配全局语义一致性的任务(如超分辨率、修复、分割、检测),而投影驱动方法更适配强调局部几何精度的任务(如深度估计、光流、关键点匹配) [13] 全景视觉任务工具箱 - 文章覆盖20+代表性任务,并提供了横向跨任务对照表,将任务按四大板块归类:增强与评估、理解、多模态、生成 [14] - 新范式加速渗透,包括Diffusion/生成式模型在文生图/视频、图像补全、新视角合成方向快速涌现,以及3D高斯泼溅(3DGS)在高效高保真渲染中的应用 [14][15] - 多模态对齐,尤其是音频、文本、LiDAR与全景的对齐成为新的研究热点 [14][15] 全景视觉的未来发展方向 - **数据瓶颈**:缺少大规模、跨任务、跨场景的标准360°数据,真实场景高质量标注成本高,多模态资源不足制约研究进程 [21] - **模型范式**:需将基础模型迁移到全景视觉并设计参数高效的专家模块,多模态对齐和全景生成是核心难点 [21] - **下游应用**:关键场景包括空间智能与自动系统(具身智能、自动驾驶)、XR与沉浸式交互、三维重建与数字孪生以及广泛的行业化社会应用 [21]
凌云光现5笔大宗交易 总成交金额1919.09万元
证券时报网· 2025-09-18 22:40
大宗交易概况 - 9月18日通过大宗交易平台成交5笔 合计成交量44.63万股 成交金额1919.09万元 成交价格均为43.00元 较当日收盘价折价14.03% [2] - 近3个月累计发生6笔大宗交易 总成交金额达2411.05万元 [3] - 机构专用席位出现在3笔交易的买方或卖方 合计成交金额1204.00万元 实现净买入1204.00万元 [2] 股价及资金表现 - 当日收盘价50.02元 单日涨幅12.46% 日换手率9.95% 成交额22.31亿元 [3] - 近5日累计上涨22.39% 期间资金净流入9180.37万元 [3] - 主力资金当日净流出1.64亿元 [3] 融资交易数据 - 最新融资余额6.10亿元 近5日增加1.41亿元 增幅达29.93% [4] 公司基本信息 - 凌云光技术股份有限公司成立于2002年8月13日 注册资本46097.6733万元人民币 [4] 交易明细结构 - 最大单笔成交11.63万股/500.09万元 由中信证券总部对接银河证券深圳龙华营业部 [4] - 三笔机构专用交易分别成交10万股/430万元、10万股/430万元和8万股/344万元 卖方均为银河证券深圳龙华营业部 [4] - 最小单笔成交5万股/215万元 由中信证券总部对接银河证券同一营业部 [4]
凌云光: 凌云光技术股份有限公司前次募集资金使用情况鉴证报告
证券之星· 2025-08-30 01:47
前次募集资金基本情况 - 公司通过首次公开发行人民币普通股(A股)股票9000万股(超额配售选择权行使前),发行价为每股人民币21.93元,募集资金总额197,370.00万元,扣除承销保荐费用及其他发行费用后,募集资金净额为180,528.33万元,资金于2022年6月29日到账[3] - 通过行使超额配售选择权,公司额外发行1350万股股票,募集资金总额27,533.12万元,扣除印花税后募集资金净额为27,526.23万元,资金于2022年8月5日到账[3][5] - 前次募集资金净额合计为208,054.56万元[16] 募集资金存放情况 - 截至2025年6月30日,公司前次募集资金在银行专项账户中的存放余额为42,721.01万元,其中募集资金专户余额2,771.01万元,使用闲置募集资金进行现金管理金额39,950.00万元[16] - 募集资金存放于多家银行账户,包括上海银行、中国工商银行、中信银行、中国民生银行、华夏银行和苏州银行等,账户类型包括活期存款、通知存款和定期存款[6][7] - 初始存放金额与前次发行募集资金净额差异4,221.33万元,系前期发行费用导致[7] 募集资金使用情况 - 截至2025年6月30日,公司已累计使用募集资金总额166,121.11万元[16] - 募集资金主要用于以下项目:工业人工智能太湖产业基地、工业人工智能算法与软件平台研发项目、先进光学与计算成像研发项目、新能源智能视觉装备研发、数字孪生与智能自动化技术研发、补充营运资金、基于视觉+AI的虚拟现实融合内容制作中心等[16][17] - 公司不存在变更前次募集资金投资项目的情况,但存在部分募投项目增加实施主体和实施地点、调整内部投资结构以及延期等情况[8][9][10] 募集资金投资项目效益情况 - "工业人工智能太湖产业基地"项目仍在建设中,尚未实现效益[12] - "新能源智能视觉装备研发"、"数字孪生与智能自动化技术研发"、"基于视觉+AI的虚拟现实融合内容制作中心"项目旨在增强公司研发能力,无法单独核算效益[11] - 除"工业人工智能太湖产业基地"项目外,公司在招股说明书中未对其他募集资金使用效益作出承诺[12] 闲置募集资金使用 - 公司多次审议通过使用暂时闲置募集资金进行现金管理的议案,购买安全性高、流动性好的理财产品、存款类产品等[12][13][14] - 截至2025年6月30日,公司实际使用暂时闲置募集资金购买且尚未到期的理财产品金额为39,950.00万元,包括上海银行、中国民生银行、华夏银行和中信银行的理财产品[15] 募集资金结余及节余资金使用 - 2024年5月,公司审议通过"先进光学与计算成像研发项目"结项,并将节余募集资金永久补充流动资金,节余资金及利息共计5,618.05万元转入公司自有资金账户[15] - 截至2025年6月30日,公司前次募集资金未使用金额占前次募集资金总额的比例为20.53%,该等资金将继续用于实施承诺投资项目[16]
虹软科技(688088):2025年半年报点评:汽车业务量产驱动增长,AI眼镜+商拍未来可期
民生证券· 2025-08-26 16:59
投资评级 - 维持"推荐"评级 [4][7] 核心财务表现 - 2025年上半年营业收入4.10亿元,同比增长7.73%,归母净利润0.89亿元,同比增长44.06% [1] - 第二季度营收2.01亿元,同比增长2.08%,归母净利润0.39亿元,同比增长42.42% [1] - 预计2025-2027年营收分别为10.11亿元、12.74亿元、16.18亿元,归母净利润分别为2.34亿元、3.13亿元、4.44亿元 [4] - 2025年8月26日收盘价对应市盈率91倍、68倍、48倍 [4] 移动智能终端业务 - 实现收入3.39亿元,同比增长2.23% [2] - Turbo Fusion技术提升影像处理效率并降低系统负载与功耗,改善夜景、逆光、长焦等场景画质 [2] - AI眼镜领域通过算法与硬件深度融合强化视觉交互体验,与多家头部厂商签约并完成量产落地 [2] 智能汽车业务 - 实现收入0.65亿元,同比增长49.09% [3] - 舱内核心产品(驾驶员安全辅助系统、乘员安全辅助系统)完成多轮技术迭代并批量出货至海内外客户 [3] - 前装软硬一体车载视觉解决方案Tahoe产品在欧洲豪华品牌车型完成量产交付 [3] - 舱泊一体解决方案在客户项目完成POC技术验证 [3] AI视觉创新 - 升级新一代视觉大模型ArcMuse2025 V1.1 [4] - PSAI新增AI试鞋、商品换色、高清改尺寸等功能,聚焦服饰行业需求 [4] - 产品入驻淘宝、京东、亚马逊等主流电商平台,累计服务数十万中小商家,合作头部服饰品牌超300家 [4] 增长驱动因素 - 移动智能终端和智能汽车业务受益于新兴市场复苏 [4] - 智能商拍蓝海市场有望开启新增长曲线 [4]
36氪广东首发|全国首家、专注计算成像研发,「西湖智能」完成超五千万元Pre-A轮融资
36氪· 2025-07-14 18:15
公司融资与资金用途 - 西湖智能视觉科技完成超五千万元Pre-A轮融资 由东方富海独家投资 [1] - 资金将用于深化技术产品矩阵 推进产能建设 加速全球化布局 [1] - 此前公司已获得由中科创星领投 西湖科创投和西湖创新基金跟投的数千万元天使轮融资 [1] 公司背景与技术定位 - 公司成立于2022年 提供集感存算一体的成像系统解决方案 [1] - 依托西湖大学科研平台 通过底层光学硬件和算法突破推动智能成像系统革新 [1] - 专注于研发基于人工智能计算成像的新一代机器视觉感知系统 [1] 核心产品与技术优势 - 主要产品聚焦高光谱成像系统 高速相机和3D成像系统 [1] - 目标开发低成本 低功耗 低带宽 高通量的智能视觉成像系统 [1] - 已构建三大核心技术矩阵:视频级高光谱成像 万帧级超高速动态捕捉 微米级3D成像 [4] - 视频级高光谱成像实现单次曝光获取完整高光谱数据立方体 显著提升成像速度与效率 [4] - 万帧级超高速动态捕捉满足极端高速场景精准观测需求 [4] - 微米级3D成像提供超高精度三维视觉感知能力 [4] 技术突破与行业价值 - 计算成像技术通过联合优化光学硬件与算法 突破传统光学成像速度慢 功耗高 易受运动目标影响等痛点 [3] - AI技术突飞猛进促进计算成像落地应用 公司基于AI+光学实现新突破 [3] - 无人机挂载公司产品可高效获取1.5平方公里范围内每一点的光谱信息 [3] - 单次曝光可获取光谱 三维偏振 视频等多维信息 重塑医疗早筛 工业质检 消费电子 自动驾驶等领域 [3] 研发投入与团队实力 - 公司年均研发投入占比超60% [4] - 研发团队包含10名博士和4名硕士 在相关领域具有深厚研究经验积累 [4] - 创始人袁鑫博士发表学术论文近300篇 谷歌学术引用超13000次 H指数59 申请专利30余项(已授权15项) [2] 市场前景与发展规划 - 计算成像技术是下一代智能感知的核心引擎 赛道至少是千亿级市场 [3] - 三年规划基于现有三大核心技术持续拓展产品线 加强技术纵深 保持领先优势 积极开拓国际市场 [5] - 五年规划搭建标准化生产线 提升规模化交付能力 推动计算成像领域标准制定 [5] 投资机构观点 - 东方富海认为公司技术将多维信息编码至二维空间 再利用AI算法重构 获得更多观测维度 [6] - 产品在半导体检测 低空 安防等领域具有广阔应用前景 [6] - 希望融资加快产品规模化量产 推动机器视觉行业向高维智能成像升级 [6]
工业异常检测新突破,复旦等多模态融合监测入选CVPR 2025
量子位· 2025-06-16 14:59
数据集创新 - 联合发布高精度多模态数据集Real-IAD D³ 涵盖RGB图像、伪3D光度立体图像和微米级精度3D点云数据 [1][3] - 数据集包含20个工业产品类别、69种缺陷类型 总计8450个样本 其中正常样本5000个、异常样本3450个 [4] - 点云精度达到0.002毫米 显著高于MVTec 3D-AD的0.11毫米和Real3D-AD的0.011-0.015毫米 [4] 技术突破 - 提出多模态融合检测方法D³M 整合2D、伪3D和3D数据提升检测性能 [6] - 在图像级异常检测指标(I-AUROC)上达到0.890 像素级异常检测指标(P-AUROC)达到0.901 全面优于单模态和双模态方法 [9] - 生成的分割图在细节和准确性上优于其他方法 在连接器外壳女性类别中达到0.999的I-AUROC和0.911的P-AUROC [9] 行业应用价值 - 解决传统2D图像检测缺乏深度信息和现有3D检测细节捕捉不足的行业痛点 [4] - 为工业制造质量控制提供更可靠的解决方案 推动工业异常检测领域发展 [12] - 该研究是Real-IAD系列第二篇工作 首篇工作已被CVPR2024收录 形成持续技术输出体系 [13] 数据规模扩展 - Real-IAD系列数据集包含30类对象 每类含5个拍摄角度 总计150K高分辨率图像 规模达主流数据集十倍以上 [16] - 具有更大的缺陷面积和缺陷比例范围 能更好区分不同方法性能 满足各种工业异常检测研究设置 [16]