Workflow
计算机视觉
icon
搜索文档
CVPR 2026 Workshop征稿|从感知到推理,ViSCALE 2.0 邀你重塑计算机视觉的 System 2
机器之心· 2026-02-13 12:19
当大语言模型通过 Test-time Scaling(推理时计算扩展)在逻辑推理上不仅 "读万卷书",更能 "行万里路" 时,计算机视觉的 "System 2" 时刻也已悄然 降临。 从单纯的像素感知,到构建符合物理规律的世界模型(World Models);从平面的模式识别,到复杂的空间推理(Spatial Reasoning)—— 视觉智能正站 在新范式的路口。 2026 年 6 月,CVPR 第二届计算机视觉推理扩展研讨会(ViSCALE 2026) 将在美国重磅回归!继首届研讨会成功开启 TTS 在视觉领域的无限可能后, 本届 ViSCALE 由来自 清华、普林斯顿、UC Santa Cruz、NUS 等全球顶尖机构的学者联合举办,将汇聚全球顶尖学者,共同探索如何让视觉模型通过计 算扩展突破现有模型的能力瓶颈。 研讨会亮点:重新定义 "看" 与 "想" 如果说上一代视觉模型是 "直觉反应",ViSCALE 关注的则是深度推理。我们不再满足于静态的输出,而是探索模型如何在测试时动态分配计算资源,实现 从 "看懂画面" 到 "模拟世界" 的跃迁。 核心议题包括但不限于: 世界模型与视频生成: 如何利用 T ...
山东将在高端装备等领域开展语料库揭榜挂帅
大众日报· 2026-02-06 09:06
项目核心内容 - 山东省工业和信息化厅宣布将在多个重点行业开展“语料库揭榜挂帅”项目申报 [1][2] - 项目旨在通过技术攻关、标准研制、打造高质量语料库及推动应用场景落地,以支持行业大模型的开发、训练和微调 [2] 项目覆盖行业 - 项目聚焦的行业包括高端装备、烟草制品业、农副食品加工业、家具制造业、木材加工、皮革毛皮羽毛及其制品和制鞋业、仪器仪表制造业、废弃资源综合利用业 [2] 项目具体目标与要求 - 项目聚焦于工业制造重点行业的基础理论研究、产品研发设计、生产管理运行、过程质量检测等关键环节和特定场景的知识语料汇聚 [2] - 语料库将基于结构化、非结构化和半结构化数据,经过清洗、去噪和统一格式处理 [2] - 处理后的语料用于支持自然语言处理、计算机视觉、机器学习、深度学习等任务 [2] - 项目验收时,行业相关语料库的数据量要求不低于10万条 [1][2] - 验收的语料库需具有较高的数据质量、领域覆盖程度、潜在价值和应用成效,并需通过第三方测评 [2] 项目鼓励方向 - 山东省鼓励各行业语料库项目加快语料资源的优化整合,并积极开放公共语料 [2]
伞:我会飞了!人:我湿透了!这项硬核发明主打一个陪伴
机器人大讲堂· 2026-01-31 12:07
飞行雨伞项目技术解析 - 项目由加拿大工程师John Tse开发,旨在打造一款能自动悬浮在头顶、解放双手的雨伞[1] - 第二代产品实现了完全自主飞行,第一代产品发布于2024年初,仍需手动遥控[7] - 项目开发历时近一年,经历了零件断裂、软件崩溃、硬件烧毁等诸多挑战[18] 核心技术方案与迭代 - 采用四螺旋桨提供动力,由Pixhawk飞行控制器保持平衡,树莓派Compute Module 4处理数据[5][9] - 跟踪系统经过多次迭代,最终选用飞行时间深度相机,替代了普通摄像头、GPS和激光雷达方案,因其在昏暗环境下也能精准构建3D图像[9][12] - 深度相机识别使用者头部位置,系统反应迅速,可在正常步行速度下稳定跟随[9] 机械与结构设计 - 采用可折叠机械臂设计,四个机械臂从中央枢纽延伸,末端装有电机和螺旋桨,解决了便携性问题[11] - 结构件大部分使用碳纤维尼龙材料3D打印,以平衡强度与重量[14] - 设计了包含铰链、橡皮筋和固定板的锁定系统,以减少飞行震动,该折叠机构经过大量时间优化[14] - 内部电子设备布局经过精心设计,以保持重心稳定[16] 项目性能与局限性 - 出于安全考虑,雨伞需悬浮在头顶几米高,导致实际遮雨效果不佳,风雨天雨水会斜向飘入[5][18] - 当前版本续航时间仅10-15分钟,与小型消费级无人机相近[20] - 在人群密集处使用可能存在碰撞风险[20] - 在暴雨测试中能实现稳定飞行和“零故障”跟踪,但遮雨功能基本失效[18] 项目意义与行业背景 - 项目展示了个人创客利用现成无人机技术、计算机视觉和开源硬件实现自主机器人的能力[20] - 文章结尾附有广泛的机器人行业企业名单,涵盖工业机器人、服务与特种机器人、医疗机器人、人形机器人、具身智能及核心零部件等多个领域[21][22][23][24][25][26][27][28]
京东方取得基于计算机视觉的群体识别技术专利
搜狐财经· 2026-01-24 11:34
公司近期动态 - 京东方科技集团股份有限公司于近期取得一项名为“一种基于计算机视觉的群体识别方法和群体识别装置”的专利,授权公告号为CN116597382B,该专利的申请日期为2023年5月 [1] - 公司成立于1993年,位于北京市,主营业务为计算机、通信和其他电子设备制造业,注册资本为374.1388亿元人民币 [1] - 公司对外投资了73家企业,参与招投标项目303次,拥有商标信息775条,专利信息5000条,以及行政许可47个 [1] 公司技术研发与知识产权 - 公司新获授权的专利涉及计算机视觉领域的群体识别技术,表明公司在人工智能及图像识别技术方向持续进行研发投入 [1] - 公司旗下子公司北京京东方技术开发有限公司(成立于2016年)同样专注于计算机、通信和其他电子设备制造业,注册资本为3800万元人民币,拥有专利信息3871条 [1] - 子公司北京京东方技术开发有限公司对外投资了1家企业,参与招投标项目92次,拥有行政许可4个 [1]
AI视觉提供商极视角递表港交所 经营活动现金流为负
每日经济新闻· 2026-01-22 22:47
公司IPO申请与市场地位 - 公司于1月20日首次向港交所递交IPO申请,中信证券为独家保荐人,拟将募集资金用于增强研发能力、提升商业化能力及补充营运资金 [1] - 公司定位为中国领先的AI计算机视觉解决方案提供商,按2024年收入计,在中国新兴企业级计算机视觉解决方案市场中排名第八,但市场份额仅为1.6%,与排名第一的公司(份额12.1%)差距显著,市场相对分散 [1][8] - 截至2025年三季度末,公司AI算法商城展示逾1500种算法,覆盖逾100个行业,拥有由数十万开发者组成的全球社区,累计服务逾3000名客户 [2] 业务构成与客户分析 - 报告期内(2022年、2023年、2024年及2025年前三季度),公司收入主要来自AI计算机视觉解决方案,占比分别为100%、100%、75.9%和81.8%,大模型解决方案收入占比从0%提升至19.2% [2] - 客户主要为民营企业,报告期内来自该类型客户的收入占比分别为94.7%、36.7%、58%和69.6%,波动较大 [3] - 收入地域分布波动剧烈,华东地区收入占比从2023年的65%骤降至2025年前三季度的32.1%,同期华南地区收入占比从18.6%升至56.0% [3] 财务表现与盈利能力 - 报告期内,公司收入分别为1.02亿元、1.28亿元、2.57亿元和1.36亿元,期内利润分别为-6072.2万元、-5624.6万元、870.8万元和-3629.6万元,仅2024年实现盈利 [4] - 截至2025年三季度末,公司累计亏损由2024年底的9880万元增加至1.258亿元,因存在累计亏损,目前无法宣派或派发股息 [4] - 报告期内,销售及分销开支、行政开支和研发开支三项总额分别约为1.01亿元、9830.4万元、9827万元和1.01亿元,占各期收入的比例分别为99.91%、76.99%、38.19%和74.39% [4][5] 现金流与应收款项状况 - 报告期内,公司经营活动产生的现金流量净额长期为负,分别为-7914.3万元、-7296.3万元、-1759.2万元和-2137.3万元 [5] - 贸易应收款项及应收票据总额从2022年底的4201.5万元快速攀升至2025年三季度末的1.81亿元 [5] - 贸易应收款项及应收票据周转天数显著增加,从2022年的99天、2023年的163天、2024年的182天,大幅延长至2025年前三季度的379天,公司解释原因为公众客户数目增加导致信贷期较长及业务具有季节性 [5][6] 融资历史与估值 - 公司自2015年成立以来累计完成11轮融资,引入了青岛金融、高通中国、华润创新、横琴基金等机构 [7] - 2024年11月完成的D轮融资代价为1000万元,投后估值达到23.1亿元,较2015年天使轮融资后的估值(约950.12万元)增长超过243倍 [1][7] - 但D轮融资后23.1亿元的估值,较2022年10月C3轮融资后的估值(23亿元)几乎未增长,仅微增0.4% [1][7] - IPO前,根据一致行动协议,董事长兼总经理陈振杰、执行董事兼副总经理罗韵及横琴极力能够行使公司合计约29.84%的投票权,为单一最大股东集团,但公司无控股股东 [7]
第二届CVPR 2026 CV4CHL Workshop征稿启动,用AI大模型守护儿童未来
机器之心· 2026-01-22 11:13
行业背景与研讨会概况 - 针对儿童发育、健康和教育的人工智能与计算机视觉技术尚处于起步阶段 [2] - CV4CHL研讨会由儿科AI初创公司PediaMed AI联合多所知名高校及研究所在CVPR 2026期间承办 旨在汇集多维度学科观点 填补该领域关键空白 [2] - 研讨会致力于搭建跨学科桥梁 汇聚计算机视觉研究员、大模型技术专家、儿科医生、心理学家、教育家 共同探讨前沿技术在儿童应用场景的创新与伦理挑战 [2] 研讨会核心活动与议题 - 研讨会将包括主题演讲 PediaMed AI将发布相关儿科AI产品 [3] - 将联合伊利诺伊大学厄巴纳-香槟分校组织儿童AI未来方向圆桌讨论 联合深圳儿童医院组织首届儿童步态分析挑战赛 [3] - 核心议题涵盖受儿童学习认知能力启发的基础模型与多模态大语言模型、面向儿童的脑机接口技术、增强/智能眼镜人机交互、具身AI的儿科应用、儿童发育认知建模相关的计算机视觉、儿科智慧医疗、AI赋能教育、AI支持儿童心理健康以及儿童AI技术的伦理与社会影响 [6] 研讨会时间、地点与投稿规则 - 研讨会时间定于2026年6月3日至6月7日 地点在美国科罗拉多州丹佛 [6][7] - 投稿设Proceeding及Non-proceeding两个赛道 在OpenReview平台进行双盲审稿 [8] - Proceeding赛道投稿正文限制8页以内 论文将收录于CVPR 2026 Workshop Proceeding [8] - Non-proceeding赛道非存档 可投稿已发表或在审工作 正文限制4页以内 研讨会后不会公开 [8] - 投稿截止日期为2026年3月31日 审稿结果通知日期为2026年4月8日 [6] - 投稿格式和模板遵循CVPR 2026官方投稿指南 [11] 合作与参与 - 研讨会由PediaMed AI、UIUC HCESC、机器之心赞助 欢迎更多企业加入 期间将设置赞助商展位 [9] - 研讨会是研究者与行业专家展示成果、激发灵感、参与讨论的平台 [9]
新股消息 | 极视角港股IPO及境内未上市股份“全流通”获中国证监会备案
智通财经网· 2026-01-21 19:09
公司上市与股份流通计划 - 中国证监会国际合作司已向山东极视角科技股份有限公司发出境外发行上市及境内未上市股份“全流通”备案通知书 [1] - 公司计划发行不超过2006.34万股境外上市普通股并在香港联合交易所上市 [1] - 公司31名股东拟将所持合计99,872,436股境内未上市股份转为境外上市股份,并在香港联交所上市流通 [1] 公司业务与市场地位 - 公司是中国AI计算机视觉解决方案提供商,为各行各业的企业提供端到端解决方案开发、部署及管理服务 [3] - 根据弗若斯特沙利文的资料,按2024年的收入计,公司于中国新兴企业级计算机视觉解决方案市场中排名第八 [3] “全流通”股东及转换股份详情 - 股东陈振杰申请全流通股数最多,为16,114,821股 [4] - 股东珠海横琴极力投资合伙企业(有限合伙)申请全流通股数为9,452,122股 [4] - 股东珠海横琴极创投资合伙企业(有限合伙)申请全流通股数为9,024,164股 [4] - 股东深圳市创兴前沿技术股权投资基金合伙企业(有限合伙)申请全流通股数为6,455,286股 [4] - 股东青岛经济技术开发区金融投资集团有限公司申请全流通股数为5,464,317股 [4] - 股东高通(中国)控股有限公司申请全流通股数为4,990,208股 [4] - 股东青岛天奇前沿科技投资基金合伙企业(有限合伙)申请全流通股数为4,852,238股 [4] - 股东汕头市华润创新股权投资基金合伙企业(有限合伙)申请全流通股数为4,819,420股 [4] - 股东Marvel Holding (HK) Limited申请全流通股数为4,732,743股 [4] - 股东罗韵申请全流通股数为4,405,085股 [4] - 股东山东陆海联动投资基金合伙企业(有限合伙)申请全流通股数为4,353,621股 [4] - 股东深圳安京投资合伙企业(有限合伙)申请全流通股数为3,729,795股 [4] - 股东深圳市理想同心投资合伙企业(有限合伙)申请全流通股数为3,509,625股 [5] - 股东宁波梅山保税港区莱玛投资管理合伙企业(有限合伙)申请全流通股数为1,952,036股 [5] - 股东茂名市智创未来投资企业(有限合伙)申请全流通股数为1,800,619股 [5] - 股东青岛极视和风管理咨询合伙企业(有限合伙)申请全流通股数为1,591,503股 [5] - 股东青岛国投资本管理有限公司申请全流通股数为1,500,006股 [5] - 股东青岛青铁一期产业投资基金合伙企业(有限合伙)申请全流通股数为1,277,699股 [5] - 股东深圳九畹中创拾伍号科技投资中心 (有限合伙)申请全流通股数为1,212,121股 [5] - 股东海南景泰成长股权投资基金三期合伙企业(有限合伙)申请全流通股数为1,022,690股 [5] - 股东淄博凯沃股权投资基金合伙企业(有限合伙)申请全流通股数为1,000,466股 [5] - 股东深圳市前海康星健康产业基金管理企业(有限合伙)申请全流通股数为975,989股 [5] - 股东青岛杰正海睿商贸有限公司申请全流通股数为900,309股 [5] - 股东青岛海创智链工业互联网产业投资基金合伙企业(有限合伙)申请全流通股数为871,042股 [5] - 股东深圳达辰云极人工智能合伙企业(有限合伙)申请全流通股数为868,790股 [5] - 股东株洲云龙创新创业投资引导基金合伙企业(有限合伙)申请全流通股数为664,581股 [5] - 股东北京聚引融合科技有限公司申请全流通股数为630,000股 [5] - 股东深圳市极视春雨咨询合伙企业(有限合伙)申请全流通股数为544,048股 [5] - 股东竞骏高飞(深圳)企业管理有限公司申请全流通股数为474,054股 [5] - 股东横琴粤澳深度合作区产业投资基金(有限合伙)申请全流通股数为434,783股 [5] - 股东杭州初者之心股权投资合伙企业(有限合伙)申请全流通股数为248,255股 [5]
【全球招募】用AI唤醒千年文明!探元计划NextGen数智活化赛道:五大文化场景等您“揭榜挂帅”
腾讯研究院· 2026-01-20 17:53
文章核心观点 - 腾讯探元计划NextGen发起“数智活化赛道”,旨在通过AI、多模态大模型、XR、计算机视觉等前沿技术,解决文化遗产在公众理解、体验互动与技艺传承方面的痛点,推动文化资源的数字化焕新与活化利用[2][4][7][56] 赛道议题与目标 - 赛道致力于通过前沿技术激发创新内核、重塑表达形态、创造体验革命,以产生新动能、新形态、新场景[5] - 议题一为“文化垂类多模态智能体”,要求智能体具备深层次语义理解、低幻觉推理和自主决策能力,能生成满足特定文化、审美与情感需求的数字内容[5] - 议题二为“沉浸式互动体验场景创新”,要求在交互感知、多感官数据融合、沉浸式呈现、情感计算、虚实融合及数字人/机器人导览等技术应用上创新产品和业态[6] - 议题三为“人机协同技艺传承发展”,旨在通过构建技艺“数字基因库”、智能化教学系统、生成式设计引擎等方式,实现AI驱动的个性化技艺传承与创意生产转化[7] 五大特定命题场景 - **场景一:云居智友(云居寺多模态智能体)** - 类型为博物馆/国家级档案文献遗产,痛点为石经内容难懂、叙事方式陈旧、体验单薄参与感低[8] - 期待构建一个懂历史、有温度、能创作、可交互的垂类多模态AI智能体,打通“石经—人心”的“最后一公里”[9] - **场景二:杭州西湖(文化遗产活化叙事系统)** - 类型为世界文化景观遗产,痛点为游客停留于浅层观光,难以触及千年文脉[15] - 期待基于游客动线与三维模型,用AI重建历史风貌,生成隐私安全的个性化沉浸式游览影像[16] - **场景三:海岱智游(大汶口文化沉浸式互动体验)** - 类型为博物馆/考古遗址,痛点为展陈静态、公众难理解史前社会与符号含义、古代制陶技艺流程断裂[19] - 期待形成可应用的AI体验系统平台,实现与“虚拟先民”对话、模拟制陶、解码八角星纹,让观众“进入历史”[19] - **场景四:廊桥智传(木拱桥营造技艺智能传承系统)** - 类型为非物质文化遗产(联合国人类非遗),痛点为技艺认知门槛高、年轻传承动力不足、实操成本高昂[29] - 期待开发智能教练系统,融合知识图谱与实时动作识别技术,引导用户动手拼装实体模型,像搭建乐高一样理解结构原理[29] - **场景五:广东醒狮“虚实共生”传承课堂** - 类型为非物质文化遗产(国家级),痛点为陈列展览缺乏互动性与体验性,需数字技术赋能传播[36] - 期待借助先进技术手段,对醒狮动作细节、发力方式等进行动作捕捉与结构化呈现,实现数字动态呈现和观众互动体验[36] 项目申报与支持 - 项目流程分为三大阶段:项目申报(2025年12月—2026年1月)、项目遴选与公示(2026年2月—3月)、项目共创孵化与成果沉淀(2026年4月—10月)[48] - 项目遴选将应用腾讯Cultech-SQI评价体系,聚焦场景代表性(S)、创新性(Q)和话题性(I)[50][52] - 资金支持包括:共创落地项目共选出2-3个,每组有机会获得数十至百万元扶持资金;概念探索项目共选出3-4个,每个项目有机会获得20-40万元扶持资金[52] - 额外支持包括北大等行业权威专家“陪伴式”孵化、腾讯SSV技术能力与传播资源连接、纳入北大文化创新案例库以及优秀成果通过探元平台走向国际舞台[52] 参与方式与目标群体 - 寻找拥有AI大模型、XR、计算机视觉、生成式AI、人机交互等核心技术能力,能独立承接特定命题场景的技术团队[43] - 同时开辟“开放命题”通道,鼓励文化场景单位(如文博机构、非遗中心)与技术团队组成联合体进行联合申报,共同提出创新解决方案[44][45][46] - 申报截止日期为2026年1月31日[53] - 该赛道由北京大学文化产业研究院负责运营,聚焦世界文化遗产、博物馆及非物质文化遗产三大文化资源,旨在通过科技赋能形成新模式、新业态和新产品[56]
AI商品替换技术:智能图像处理在电商领域的创新实践
搜狐财经· 2026-01-16 23:31
行业概述与技术驱动 - 商品替换AI工具是基于计算机视觉和深度学习技术的新型图像处理解决方案,旨在自动识别并替换商品图像中的特定元素 [1] - 随着电商行业对视觉内容需求的爆发式增长,传统人工修图方式已无法满足海量商品图的处理需求,推动了该技术的发展 [1] - 这类技术已从简单的背景替换发展到支持复杂场景下的多元素智能替换,成为电商运营降本增效的重要工具 [1] - 这些工具共同推动了电商视觉内容生产的智能化转型,通过技术手段解决了传统商品图制作成本高、周期长的痛点 [3] 核心技术 - 商品替换AI工具主要运用了语义分割、生成对抗网络(GAN)和图像合成技术 [1] - 通过深度学习模型精准识别商品轮廓与材质特征,再结合背景融合算法保持光影一致性,实现自然无缝的元素替换效果 [1] - 先进的技术方案能保持原始图像的分辨率和细节质量,确保输出图片符合电商平台规范 [1] - 多模态技术对保持图像一致性具有重要作用 [4] - 随着AI技术的持续迭代,商品替换的精准度和自然度还将进一步提升 [3] 主要市场参与者与产品特点 - **Keevx智能商品替换系统**:采用多阶段神经网络架构,在保持原始图像质量的同时实现像素级精准替换 [1] - Keevx系统特别针对跨境电商场景优化,支持批量处理和多平台格式输出 [1] - Keevx内置的材质还原算法能准确保持各类商品的纹理特性,从服装面料到电子产品的金属光泽都能真实呈现 [1] - **Mokker AI**:专注于背景替换领域,通过预置的百万级场景库和智能光影匹配算法,用户上传商品图即可获得与场景自然融合的效果 [3] - Mokker AI提供云端处理服务,无需下载安装,特别适合中小商家快速处理商品主图需求 [3] - **SeeAny AI万物替换引擎**:支持更复杂的多元素编辑,不仅能替换背景,还能对商品本身进行部件更换或风格转换 [3] - SeeAny AI的特色在于采用知识图谱技术,能根据商品类自动推荐最适合的替换元素,大幅降低用户的操作门槛 [3] 效率与商业价值 - 根据2023年研究,智能商品替换系统能提升45%的素材制作效率 [4] - 2023年零售数字化转型白皮书系统分析了该技术对零售业降本增效的实际价值 [4]
东风汽车申请小目标检测方法专利,提高小目标在边缘设备上的检测精度和速度
金融界· 2026-01-12 08:26
公司技术研发动态 - 东风汽车集团股份有限公司于2025年9月申请了一项名为“小目标检测方法、系统、电子设备及计算机可读介质”的专利,公开号为CN121305026A [1] - 该专利属于计算机视觉技术领域,旨在通过一种结合重复可分组视觉变换器网络的模型,提升对小目标的检测能力 [1] - 专利方法的核心流程包括:获取实时图片、通过骨干网络进行多尺度特征提取、通过特征融合网络处理特征图、最后通过检测头网络输出目标检测结果 [1] - 该技术通过在训练阶段增加网络深度和宽度以增强特征提取能力,在推理阶段通过网络结构重参数化简化模型,从而实现轻量化设计 [1] - 该技术的目标是提高小目标在边缘设备上的检测精度和推理速度 [1] 公司基本情况 - 东风汽车集团股份有限公司成立于2001年,总部位于武汉市,主营业务为汽车制造业 [2] - 公司注册资本为858937万人民币 [2] - 公司对外投资了44家企业,参与了5000次招投标项目,拥有5000条专利信息以及156个行政许可 [2]