Workflow
视觉
icon
搜索文档
3000多颗元件十几秒检完 解码“屏”实力背后的智造密码
央视新闻· 2025-07-02 14:29
行业概况 - 超高清视频显示产业是广东十大战略性支柱产业之一,广州作为核心试验区2024年产值超2000亿元,同比增长近8% [1] - 广东超高清视频产业集群2023年营业收入突破9000亿元,正向万亿级规模迈进 [11] - 广州超高清面板、显示模组、偏光片、超高清电视板卡产能居全国前列 [1] 产品应用 - 智能屏幕应用场景广泛,涵盖教育(智能黑板)、家电、健身器械及AR眼镜等 [1][3] - 教育用智能交互屏幕可实现三维几何体展开等高级功能,提升教学效率 [1] 制造能力 - 智能制造工厂年产能超1000万片显示主板,全球每3台电视机有1台使用其主板 [3] - 单块主板含1700多颗微型元件,复杂产品可达2000多颗,需微米级精度装配 [5] - AI视觉检测系统使元件检测效率提升2倍多,15秒内完成3000颗元件瑕疵筛查 [7] 技术创新 - 建设中试线加速新技术/材料的生产验证,推动智造升级 [9] - AI模型结合机器视觉实现微米级元件比对,替代传统人眼检测 [7] 产业链布局 - 新型显示产业已集聚130多家规模以上企业,覆盖上中下游全链条 [9] - 海外业务在智造升级驱动下实现显著增长 [9]
大模型时代,通用视觉模型将何去何从?
机器之心· 2025-07-02 08:54
通用视觉模型(VGM)研究背景 - 通用视觉模型(VGM)曾是计算机视觉领域的研究热点,旨在构建统一架构处理图像、点云、视频等多种模态输入及分类、检测、分割等多样化任务,目标是实现「视觉模型大一统」[1] - 随着大语言模型(LLM)的兴起,多模态大模型成为新趋势,视觉被视作语言模型的输入模态之一,其独立性被重新定义,传统VGM研究面临边缘化风险[1] - 视觉数据具有结构化强、空间信息丰富等优势,但存在模态间差异大、难替代的挑战,如2D图像、3D点云和视频流的统一处理问题在当前多模态范式中未充分解决[1] VGM的核心能力与价值 - VGM通过广泛预训练和共享表示实现跨任务零样本迁移,无需为单一任务专门调整,解决了传统视觉模型任务专用化的局限性[7] - VGM具备多模态输入统一处理能力,能将图像、点云、视频等映射到共享特征空间,同时支持多任务并行处理(如图像识别与视频分析)[7][8] - 清华大学团队在IJCV发表的综述系统梳理了VGM研究进展,涵盖输入统一方法、任务通用策略等,为未来视觉模型发展提供参考[2] VGM的技术实现框架 - 编码式框架通过共享特征空间统一输入模态,使用Transformer编码不同数据(如图像、文本),最终生成统一输出[12] - 序列到序列框架借鉴NLP方法,将可变长度输入(如视频)转换为固定表示,适用于图像生成等任务[13] - 多任务学习、视觉-语言学习等技术被用于扩充VGM知识边界,相关领域研究为模型设计提供技术补充[13] VGM的数据与评测体系 - 训练采用大规模多模态数据集(图像/视频/点云),任务分为图像、几何、时间序列等四类,评测注重跨任务泛化能力[9] - 研究对比了主流VGM在22个基准数据集的表现,但未披露具体数据指标[14] VGM的挑战与未来方向 - 当前面临统一框架设计优化、训练效率提升和大规模数据处理等挑战,数据标注仍是发展瓶颈[16] - 自动化标注技术和大规模无监督学习将成为研究重点,需解决模型偏见、公平性等伦理问题[16] - 应用潜力覆盖智能监控、自动驾驶等领域,可扩展至视觉问答、图像-文本检索等复杂任务[16]
福特CEO:特斯拉很好,我选别人
汽车商业评论· 2025-07-02 07:03
自动驾驶技术路径分歧 - 福特CEO吉姆·法利公开支持Waymo基于激光雷达的多传感器融合方案,认为激光雷达在摄像头失效时仍能提供精确探测能力 [2][4] - Waymo第六代系统配备13个摄像头、4个激光雷达、6个毫米波雷达及音频接收器,特斯拉则仅依赖8个摄像头实现360度视野 [3][5] - 马斯克坚持纯视觉路线,称激光雷达"很蠢",认为其成本过高且人类驾驶仅需视觉,特斯拉通过优化摄像头与AI简化制造并降低成本 [4][7] 技术路线对比与成本差异 - Waymo系统成本高昂,激光雷达单件成本达数万美元,特斯拉FSD系统因摄像头集成设计使整车售价维持在4万-6万美元区间 [7] - 马斯克估算特斯拉汽车成本仅为Waymo的20%-25%,主要因后者产量低且传感器昂贵 [7] - 激光雷达在暴雨、低光照等极端场景提供冗余安全,纯视觉路线依赖AI模拟人类驾驶但被质疑安全性不足 [4][5] 商业化进展与竞争动态 - Waymo当前运营1500辆无人车,覆盖旧金山等4城,计划2025年扩展至2000辆并新增亚特兰大等3城 [16] - 特斯拉Robotaxi在奥斯汀试点10-20辆Model Y,运行时段为6点至午夜,避开复杂路况,Cybercab预计2026年投入使用 [9][14] - Waymo早期聚焦自动驾驶叫车服务,现与丰田/现代合作进军消费级车型;特斯拉从量产车转向Robotaxi服务,两者路径趋近 [9] 福特战略调整 - 终止Argo AI项目(与大众联合投资10亿美元),放弃自研L4转向外部合作,重点开发BlueCruise系统(支持13万英里高速公路脱手驾驶) [18][19] - 未来或集成激光雷达以提升城市自动驾驶安全性,可能增加成本但强化电动车安全保障 [19] - 法利强调福特品牌需谨慎对待新技术,激光雷达被视作安全关键组件 [17][18] 行业分化趋势 - 技术路线分歧体现安全性与成本的权衡:Waymo/福特选择多传感器冗余,特斯拉押注纯视觉降本 [4][5][19] - 监管复杂度影响扩张速度,特斯拉需应对加州严格审查,Waymo已通过多城市运营积累数据 [14][16] - 早期试乘反馈显示特斯拉Robotaxi操控性获分析师满分评价,但NHTSA正审查其异常驾驶事件 [13][14]
重磅直播!清华&博世开源SOTA性能纯血VLA:Impromptu-VLA告别双系统~
自动驾驶之心· 2025-07-01 20:58
自动驾驶技术进展 - 当前自动驾驶系统在结构化环境(如城市和高速公路)中取得显著进展,但在非结构化场景(如乡村小路、临时施工区、恶劣路况)中仍面临鲁棒性和安全性挑战 [1] - 现有大规模自动驾驶数据集主要关注常规交通状况,缺乏针对非结构化环境的专门、大规模且精细标注的数据 [1] Impromptu VLA框架 - 清华AIR联合博世中央研究院提出Impromptu VLA框架,旨在提供开放权重和开放数据的驾驶视觉-语言-动作模型 [1] - 该框架是完全端到端、无中间感知表征的"纯血VLA"系统,直接从驾驶视频片段提取多模态特征并生成自然语言格式的驾驶命令 [1] - 系统无需手工设计感知模块、行为先验或中间BEV表达 [1] - 在NeuroNCAP闭环安全评测中表现优异,得分2.15,显著超越CVPR 2025最新提出的BridgeAD系统(1.60) [1] 技术资源与分享 - 论文已发布于arXiv(编号2505.23757v1) [2] - 项目主页在GitHub(ahydchh/Impromptu-VLA) [2] - 清华大学计算机系本科生迟浩瀚将分享该VLA框架 [2] 学习建议 - 建议入门者扎实深度学习和计算机视觉基础,逐步了解自动驾驶各模块 [2] - 推荐通过阅读前沿论文和参与开源项目实践来熟悉数据处理和模型训练流程 [2]
爱威科技(688067)每日收评(07-01)
和讯财经· 2025-07-01 17:29
公司股价与技术面分析 - 综合得分61.27分,趋势方向较强 [1] - 主力成本分析:当日21.76元、5日21.54元、20日21.08元、60日19.65元 [1] - 短期压力位21.62元,短期支撑位21.28元 [1][2] - 中期压力位20.16元,股价突破短期及中期压力位,短线和中线均有望走强 [2] - 过去一年内无涨停或跌停记录 [1] 资金流向数据 - 主力资金净流出189.25万元,占总成交额-9% [2] - 超大单净流入0元,大单净流出189.25万元 [2] - 散户资金净流入134.78万元 [2] - 北向资金数据暂未披露 [2] 财务数据 - 每股收益0.09元,营业利润0.06亿元 [2][3] - 销售毛利率55.595%,净利润6,321,040.42元 [2][3] - 市盈率数据未披露 [2] 行业与概念板块关联 - 所属医疗器械板块上涨1.39%,医疗器械概念板块上涨0.93% [2][4] - 机器视觉板块下跌0.36%,人工智能板块下跌0.29% [2][4]
瑞德智能(301135) - 2025年7月1日投资者关系活动记录表
2025-07-01 17:16
公司整体业绩与战略 - 2024 年公司制定 1+3+N 产业新格局,以家电智能控制器业务为核心,推动新赛道业务增长,拓展战略探索业务 [1] - 2024 年公司实现营业收入 126,240.30 万元,同比增长 18.06%;2025 年一季度营业收入达 33,293.78 万元,同比增长 37.22% [1] - 未来公司将践行五大战略主轴,深化内部变革,秉持“创新驱动”理念提升核心竞争力 [1] 智能家电领域 - 公司聚焦业务结构优化,加大研发投入,推动家电智能控制器产品功能升级 [2] - 风扇、除湿机等产品线市场份额显著提升,风扇和电暖器智能控制器成“八千万元级”王牌产品线 [2] - 2024 年公司家电智能控制器实现营业收入 96,752.06 万元,同比增长 13.07% [2] 机器人领域 - 公司开展人工智能前沿研究,在服务机器人领域智能控制器产品已落地 [2] - 与外部云服务商合作处理数据,研发高精度控制模组等提升兼容性 [2] - 与顺德职业技术大学合作推动关键领域智能化进程,泳池、炒菜机器人已量产 [2] 宠物科技领域 - 公司实现智能鱼缸、宠物喂食器、宠物饮水机等智能控制器产品量产 [4] AI 领域 - 公司积极应用 AI 赋能电子信息产业,引入高端人才,投资 AI 硬件算力 [4] - 探索结合瑞德知识库应用,构建 deepseekR1 平台提升研发效率 [4] - 结合 1+3+N 产业格局探索各细分产品 AI 智能体 [4] 数智能源领域 - 公司核心产品包括便携式储能电源、家用储能设备储能电源 PACK 等 [4] - 自主研发的 BMS、MPPT 等技术已在行业内落地 [4]
智能家居市场将成万亿风口 欧菲光持续创新技术把握市场机遇
全景网· 2025-07-01 14:14
智能家居行业发展趋势 - 2023年中国智能家居市场规模达7558.1亿元,2024年增至8767.4亿元,预计2025年突破10000亿元 [1] - 行业受益于政策支持(如2023年13部门联合发文推动全屋智能)和"以旧换新"等消费刺激措施 [1] - 5G、物联网、人工智能等技术驱动行业进入快速发展阶段,未来五年将形成万亿级市场 [1] - 全球智能家居市场规模预计2028年达1544亿美元,2024-2028年复合增长率67% [4] 欧菲光智能门锁领域布局 - 自研电容式/光学/超声波指纹识别技术,已实现门锁主控三合一方案并向五合一方案升级 [2] - 开发机电一体化全自动锁体,推动行业从半自动机械锁向智能锁升级 [2] - 推出VGA ToF人脸识别方案,投射点云达30万,达到金融级安全标准并实现量产 [2] - 提供从指纹模组到整锁设计的一站式服务,已突破行业头部客户 [3] 欧菲光3D感测及视觉技术 - 研发ToF方案、结构光、双目摄像头等差异化方案,形成光学产业优势资源 [2] - 2024年推出双光源ToF专利架构,具备10米探测距离、低功耗、高采样率特性 [3] - 双光源ToF模组可检测粉尘脏污,适用于扫地机、商服机器人等多场景 [3] 欧菲光机器人业务拓展 - 2019年进入机器人赛道,ToF避障模块出货量达kk级别 [3] - 聚焦感知智能技术,覆盖扫地机器人、配送机器人、商业服务机器人等领域 [4] - 目前唯一实现双光源ToF架构模组量产的厂商 [3] 公司未来战略方向 - 加强智能门锁、运动相机、工业医疗、VR/AR等新领域布局 [4] - 计划通过技术优势提升新业务收入占比,形成未来增长支柱 [4]
新股消息 | 瑞为技术递表港交所 公司在中国民航企业视觉智能产品市场排名首位
智通财经网· 2025-07-01 07:36
公司上市申请 - 厦门瑞为信息技术股份有限公司向港交所主板递交上市申请 华泰国际、建银国际、农银国际担任联席保荐人 [1] - 按2024年收入计 公司在中国民航企业视觉智能产品市场份额为8.9% 排名第一 [1] 公司业务与技术 - 公司是面向企业客户提供视觉智能技术和产品的人工智能公司 专注于计算机视觉算法、光学成像优化及算力优化的全栈视觉智能技术 [3] - 核心技术包括视觉大模型技术、深度学习技术、多光谱成像技术及软硬件协同设计能力 [3] - 已开发RecoSee视觉感知智能体、RecoAware视觉认知智能体及RecoThink视觉推理智能体三大技术组件 [4] - 产品应用于民航、商业空间及货运物流等场景 属港交所18C章特专科技行业可接纳领域 [4] 研发能力 - 研发团队107人 占员工总数约50% [6] - 拥有168项注册专利(159项自主研发)和119项软件著作权 [6] - 建立端到端集成产品开发体系 覆盖全产品生命周期 [6] 财务表现 - 2022-2024年收入分别为7836.3万元、2.42亿元、3.95亿元 [6] - 同期毛利分别为1231万元、9882.4万元、1.57亿元 [6] - 2024年实现盈利828.8万元 [6]
暑假打打比赛!PRCV 2025空间智能与具身智能视觉感知挑战赛正式启动~
自动驾驶之心· 2025-06-30 20:51
竞赛概述 - 竞赛聚焦空间智能与具身智能的视觉感知技术,旨在推动高效、高质量的技术研究,探索强化学习、计算机视觉等前沿方法的创新,并促进神经渲染、场景优化等方向的应用 [2][4] - 竞赛由北京科技大学、清华大学、中国科学院自动化研究所等机构联合组织,北京九章云极科技有限公司提供赞助和技术支持 [5] 参赛要求与流程 - 参赛者包括高校教师、研究生、博士生及企事业单位研究团体,以个人或团队形式报名,每队不超过5人 [8][9] - 报名需通过邮件提交团队信息,截止日期为7月31日,比赛分为训练集发布、结果提交、评测和颁奖四个阶段 [5][6][10] 竞赛资源与任务 - 提供大规模无人机航拍图(500-1000张1k分辨率)和具身智能仿真场景数据,九章云极免费提供8卡H800 GPU算力用于验证 [11][12] - 赛道1要求构建多视角航拍图像的三维重建模型,评估渲染质量(PSNR)和几何精度(F1-Score) [17][19][20] - 赛道2要求完成动态遮挡场景的抓取任务,评估任务完成度(成功率、位姿误差)和执行效率(耗时、路径效率) [21][23] 奖项设置 - 每个赛道设一等奖(6000元+500度算力券)、二等奖(3000元+200度算力券)、三等奖(1000元+100度算力券)及优胜奖(500元+50度算力券) [25] 相关会议 - 竞赛结果将在PRCV2025大会(10月15-18日)公布,该会议是CCF分区顶级学术会议,涵盖模式识别与计算机视觉领域前沿成果 [27][28]
从看见到看懂 机器人之“眼”看世界
金融时报· 2025-06-30 20:22
3D视觉技术与机器人产业 - 奥比中光展示的机械手可在3D视觉下实现360度灵活抓取 体现精密机械与人类意识的协作 [1] - 机器人需要AI视觉与3D视觉获取环境感知能力 实现从"看见"到"看懂"的跨越 [1] - 政策明确推动机器视觉与机器人技术融合 覆盖教育、物流等应用领域 [2] 行业发展趋势 - 机器人被视为3D视觉技术最重要的应用载体 行业专家预测机器人将成为增长最快领域 [3] - 中国服务机器人3D视觉传感器市场中 奥比中光市占率超70% [3] - 2025年中国视觉人工智能市场规模预计达1873亿元 3D视觉技术需多学科深度耦合 [4] 公司技术布局 - 奥比中光构建机器人视觉产业中台 布局结构光、iToF、Lidar等主流3D感知技术 [3] - 公司技术矩阵已发展到"双目视觉+多线雷达"阶段 支撑机器人精准操作需求 [3] - 具身智能产业加速落地 3D视觉技术将迎来爆发式增长 [3] 资本支持与企业发展 - 2015-2020年30家机构战略入股奥比中光 近期拟募资21.87亿元投入AI视觉研发 [7] - 金融政策强调壮大耐心资本 支持科技领军企业与专精特新中小企业发展 [7] - 奥比中光案例体现资本对科创企业的关键支撑作用 [6][7]