计算机视觉

搜索文档
从自动驾驶到具身智能,这几个社区撑起了半边天!
自动驾驶之心· 2025-08-09 00:04
今年来,各家具身与自驾公司开始规模化量产相关产品,融资和招聘情况大幅增长。可落地的技术成为 大家争先占领的重点,具备相关能力的人才更是各个公司争夺的目标。然而这个行业对从业者能力要求 较高,即使有岗位也很难顺利拿到offer,可以说非常卷,一个岗位难求。 如何从内卷中脱颖而出,除了极强的自律外,系统的学习方法也很重要,这里给大家推荐了几个国内非 常具有影响力的具身智能、自动驾驶、计算机视觉和AI方面的优质社区,对入门学习以及后续进阶很有 帮助! 智驾最前沿 「智驾最前沿」是自动驾驶领域专业的技术、资讯全媒体平台。我们的slogan是:聚焦智能 驾驶 ,紧盯行业前沿。 关注「智驾最前沿」微信公众号,回复「智驾干货」,即可免费领取超多份自动驾驶领域专业 资料。 点击上方名片即可关注 计算机视觉研究院 计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、 OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文 一键下载,并分享实战项目。研究院主要着重"技术研究"和"实践落地"! 点击上方名片即可关注 视觉语言导航 "视觉语言导航"公众号致力于打造专业性的具 ...
自动驾驶之心项目与论文辅导来了~
自动驾驶之心· 2025-08-07 20:00
自动驾驶之心项目与论文辅导 - 项目正式推出自动驾驶领域论文辅导服务 旨在解决学生在研究过程中遇到的环境配置 创新点实现 模型调试等疑难问题 [1] - 过往辅导成果显著 部分学员成功在CVPR ICRA等顶级会议发表论文 [1] - 2024年计划扩大辅导规模 目标助力更多学员冲击顶会 [1] 主要辅导方向 方向1:多模态与计算机视觉 - 覆盖端到端自动驾驶 BEV感知 大模型等前沿技术领域 [2][3] - 辅导老师为华为天才少年计划入选者 在CVPR/ICCV/ECCV/NIPS等顶会发表论文30+篇 总引用量超6000次 [3] - 学术指导经验丰富 曾指导博士生在CCF-A类顶会顶刊以一作/共一身份发表7篇论文 [3] 方向2:3D视觉技术 - 聚焦图像/点云数据的3D目标检测 语义分割 占据预测等多任务研究 [4][5] - 辅导老师来自国内TOP2高校 在ECCV CVPR等会议有多次论文发表记录 [5] 方向3:自动驾驶感知架构 - 研究领域包含OCC 世界模型 BEV等自动驾驶核心感知方案 [6] - 辅导团队参与多个主流感知方案开发 成员均来自国内TOP2高校 在CVPR ECCV等会议有论文发表 [6] 方向4:神经渲染与重建 - 涉及NeRF 3D Gaussian Splatting等三维重建技术 [7] - 辅导老师以第一作者发表4篇CCF-A类论文(含2篇CVPR和2篇IEEE Trans) [7] - 另有导师在CVPR ICCV ICML TPAMI等期刊会议发表多篇论文 学术背景覆盖国内外顶尖高校(QS200/国内TOP100) [7] 合作方式 - 提供个性化论文辅导服务 具体细节需通过指定微信号(wenyirumo)咨询 [7] - 咨询时需备注"论文辅导"以获取定向服务 [8]
暑期打比赛!PRCV 2025空间智能与具身智能视觉感知挑战赛报名即将截止~
自动驾驶之心· 2025-08-04 15:31
竞赛概述 - 竞赛聚焦空间智能与具身智能视觉感知技术 旨在推动自动驾驶 智慧城市 机器人等场景的应用突破[4][5] - 核心目标包括推动高效高质量的空间智能技术研究 探索强化学习与计算机视觉等前沿方法创新 促进神经渲染与机器人抓取等应用落地[7] 组织架构 - 主办方包括北京科技大学 清华大学 中国科学院自动化研究所等顶尖机构 技术赞助由九章云极科技提供[9] - 指导专家团队由张兆翔 鲁继文 殷绪成等学界权威组成 确保竞赛专业度[9] 赛制设计 - 设置双赛道:空间智能赛道考核多视角航拍图像三维重建 具身智能赛道测试动态遮挡环境下的机器人抓取能力[20] - 评价体系差异化:空间智能侧重渲染质量(PSNR)与几何精度(F1-Score) 权重6:4 具身智能关注任务完成度(成功率)与执行效率(路径效率) 权重5:5[22][23] 资源支持 - 提供500-1000张1k分辨率无人机航拍图及仿真环境数据集 九章云极赞助8卡H800 GPU算力验证[14][15] - 算力优惠政策:新用户享6元/度体验价 H800 8卡月租4.2万元 显著降低参赛成本[16][17] 赛事日程 - 6月10日发布赛题 8月10日截止报名 9月30日完成评审 10月15日PRCV大会颁奖[13] - 允许2次结果更新 需提交技术报告说明方法细节 最终成绩前20名可获排名积分[26] 奖项设置 - 单赛道设一等奖(6000元+500度算力券) 二等奖(3000元+200度) 三等奖(1000元+100度) 优胜奖(500元+50度)[25][27] - 所有获奖团队将获得PRCV 2025组委会认证证书 奖金及算力券由九章云极全额赞助[27]
2025-2031年实验室自动化设备行业全景深度分析及投资战略可行性评估预测报告-中金企信发布
搜狐财经· 2025-07-24 11:42
实验室自动化设备行业现状 - 实验室自动化是指通过自动进行样本制备、操作控制、检测、信息处理等实验流程,减少人工干预,广泛应用于多领域实验室操作环节 [2] - 根据自动化程度和规模可分为四个阶段:单一设备形式自动化、工作站形式自动化、流水线形式自动化和智能化形式自动化 [2] - 海外市场主要参与者包括Tecan、Hamilton、BeckmanCoulter等成熟领先企业,国内企业受益于政策支持、公共卫生防控意识升级和国产化替代处于快速发展阶段 [7] 行业发展趋势 - 流程标准化程度高的实验室将向高通量、自动化、信息化方向发展 [7] - 结合机器学习、计算机视觉、数字孪生等技术推动系统向方案自适应调整、流程智能决策等更高智能化方向发展 [7] - 推动检验检测、精准医疗等多应用场景整合和多组学分析更快发展 [7] 技术门槛 - 设备仪器技术门槛:基因测序仪涉及光学、机械、电子、流体、软件、算法等多学科交叉,对硬件设计、系统集成和生产制造工艺要求高 [8] - 试剂耗材技术门槛:涉及文库制备试剂、阵列芯片、关键酶等,需高效控制核酸片段提取、断裂、扩增和富集过程,阵列芯片制作需半导体加工工艺 [9] - 数据分析和软件开发门槛:需处理庞大测序数据并进行基因组装、比对、变异检测等生物信息学分析,是精准医疗应用的基础 [10] 行业发展状况 - 2019-2024年中国实验室自动化设备行业经营效益分析显示盈利能力、运营能力、偿债能力和发展能力等指标均有详细数据 [11] - 行业经济指标分析包括不同规模企业、不同性质企业和不同地区企业的工业总产值、销售产值等 [12] - 2019-2024年全国及各地区供给情况、需求情况和产销率分析显示行业供需平衡状况 [12] 全球市场竞争 - 全球市场主要参与者集中在欧洲、北美、日本和韩国等地区,海外企业占据主导地位 [13][14] - 2019-2024年欧洲、北美、日本和韩国市场规模及2025-2031年预测数据显示各地区发展前景 [16] - 全球市场规模现状、需求结构分析和市场前景展望显示行业整体增长趋势 [16] 中国市场运行 - 2019-2024年中国实验室自动化设备行业总体规模分析包括企业数量、人员规模、资产规模和市场规模 [17] - 行业产销情况分析显示总产值、销售产值和产销率等指标 [17] - 区域细分市场调研显示东北、华北、华东、华南、华中和西南地区市场规模差异 [18] 产业链分析 - 行业产业链包括上游产业供给和下游产业需求,上游涉及原材料和技术供给,下游涉及检验检测、精准医疗等应用领域 [19] - 上游产业发展现状、供给分析和供给价格分析显示产业链上游状况 [19] - 下游产业发展现状和需求分析显示应用领域对行业的影响 [20] 行业发展趋势与前景 - 2025-2031年中国实验室自动化设备市场趋势预测显示产量、市场规模和销量增长预期 [21] - 细分市场发展趋势预测显示不同应用领域的发展潜力 [21] - 行业供需预测显示供给量、需求量和供需平衡状况 [21] 行业投资分析 - 2019-2024年行业投资规模、资金来源构成和投资主体构成显示投资活跃度 [22] - 行业进入壁垒、盈利模式和盈利因素分析显示投资特性 [23] - 投资机会和风险分析显示行业发展潜力和潜在挑战 [23]
江苏两项目入选文旅部建设名单
江南时报· 2025-07-22 21:48
文化和旅游部技术创新中心建设 - 第二批文化和旅游部技术创新中心建设名单公布,江苏省两家企业入选,分别为交互式体感仿真游乐装备中心和3D动漫制作工具链研发与服务中心 [1][2] - 第二批技术创新中心持续深耕文旅科技前沿与关键应用场景,继首批11家单位后进一步拓展领域 [1] 交互式体感仿真游乐装备技术创新中心 - 依托徐州拓普互动智能科技有限公司,聚焦体感仿真游乐设备专业赛道,重点破解设备智能化、一体化等行业关键问题 [1] - 中心研究方向包括设备外观设计、系统集成研发和内容制作分发,实现专业化研发与产业化生产双提升 [1] - 公司拥有超30000平方米生产基地,在曲柄结构控制、伺服控制、变频控制、体感交互、环境模拟等核心技术领域稳居业内前沿 [1] - 公司荣誉包括全国虚拟现实设备厂商十强企业、江苏省科普产品研发基地、全国文化和旅游装备技术提升优秀案例等 [1] 3D动漫制作工具链研发与服务中心 - 依托江苏原力数字科技股份有限公司,以研发创新3D数字技术产品及服务为核心 [2] - 中心设计计算机视觉相关软件系统与工具,深挖计算机图形、三维动画理论与算法,植入深度学习算法优化动画制作流程 [2] - 公司为行业内唯一国家专精特新"小巨人"企业,专注3D数字内容制作,通过重光照技术实现精细面部建模 [2] - 公司作品包括《凡人修仙传》《遮天》《鬼吹灯之南海归墟》等口碑动画,并参与《战神:诸神黄昏》《漫威复仇者联盟》等知名作品制作 [2] - 公司生成国内首套可用于AIGC的高精度中国人面部3D&4D扫描数据包 [2]
如何创建高质量视觉数据集
36氪· 2025-07-21 11:43
高质量计算机视觉数据集的重要性 - 企业人工智能采用率在过去四年中增长270%,推动计算机视觉应用快速整合[1] - 计算机视觉模型性能高度依赖训练数据的质量和数量,低质量数据会导致模型难以达到行业标准[1] - 高质量数据集需具备五大特征:准确性、多样性、一致性、及时性和隐私保护[5][6] 计算机视觉数据集的类型 - 训练数据:用于从头训练模型的主要数据集,包含带标签的图像和视频[3] - 验证数据:用于检查模型在训练过程中的表现[3] - 测试数据:独立数据集,用于评估模型对全新数据的预测能力[3] 低质量数据的挑战 - 过拟合:模型在训练数据表现良好但无法泛化到新数据,常因数据集缺乏多样性[7] - 欠拟合:数据集示例不足或质量差,模型无法学习有意义的模式[7] - 特征提取困难:不完整或不相关数据使模型难以提取有效特征[9] 数据集质量维护技巧 - 数据收集应采用多源策略(众包、地理多样性数据、合成数据)以减少偏差[11] - 预处理技术包括归一化和增强(旋转/翻转/缩放),可提升模型泛化能力[11][33] - 数据集分割建议比例为70%训练、15%验证、15%测试,需防止数据重叠[11] 计算机视觉数据集的未来趋势 - 行业重点从模型优化转向数据集质量提升,Andrew Ng提出"以数据为中心的人工智能"概念[14] - 未来方向包括提高标签准确性、去除噪声样本和确保数据多样性[14] 图像数据集构建关键步骤 - 明确用例:物体检测/分类/分割/面部识别等不同任务需要定制化数据集[20] - 数据多样性需涵盖光照条件、角度、分辨率等多维度变量[23] - 伦理考量要求数据集代表不同人口统计特征以避免算法偏见[21] 数据收集与标注最佳实践 - 主流数据来源包括公共数据集、网页抓取和自定义采集,各有优劣[24][30] - 标注类型需匹配任务:边界框(物体检测)、多边形(分割)、关键点(面部识别)[27][31] - 麻省理工研究显示错误标签可使模型性能降低50%,需多人标注+AI辅助确保质量[28][32] 数据集优化与管理 - 增强技术包括旋转/亮度调整,可模拟真实环境提升模型鲁棒性[33][34] - 云存储方案(AWS/谷歌云/Azure)适合大规模数据集版本管理[36][37] - 敏感数据需遵守GDPR等法规,医学/面部识别数据需匿名化处理[38] 数据集验证与维护 - 质量检测方法包括抽查注释和在小样本上预训练模型[45] - 维护需定期更新数据并重新训练模型以保持现实世界适应性[46] - 性能评估指标应包含精度、召回率和F1分数等量化标准[41]
暑假打比赛!PRCV 2025空间智能与具身智能视觉感知挑战赛启动~
自动驾驶之心· 2025-07-17 15:29
竞赛概述 - 竞赛聚焦空间智能与具身智能视觉感知技术,旨在推动高效、高质量的技术研究,探索强化学习、计算机视觉、图形学等前沿方法创新,并促进神经渲染、场景优化和机器人抓取等方向的应用 [2][4] - 竞赛由北京科技大学、清华大学、中国科学院自动化研究所等多家单位联合组织,北京九章云极科技有限公司提供赞助和技术支持 [5] 参赛要求与流程 - 参赛者包括国内研究团体、企事业单位及高校师生,团队不超过5人,每人仅能加入1个团队 [8][9] - 报名需通过邮件提交团队信息,截止日期为7月31日,比赛分阶段进行,包括数据集发布、结果提交和评审,最终在PRCV2025大会上颁奖 [5][6][10] 竞赛资源与任务 - 提供大规模无人机航拍图(500-1000张1k分辨率)和具身智能仿真场景数据,九章云极提供8卡H800 GPU算力支持 [11][12] - 赛道1要求构建多视角航拍图像的三维重建模型,评估渲染质量(PSNR)和几何精度(F1-Score) [17][19][20] - 赛道2要求完成动态遮挡场景中的抓取任务,评估任务完成度(成功率、位姿误差)和执行效率(耗时、路径效率) [21][23] 奖项与知识产权 - 每个赛道设一等奖(6000元+500度算力券)、二等奖(3000元+200度算力券)、三等奖(1000元+100度算力券)及优胜奖 [25] - 参赛方案知识产权归团队所有,数据仅限竞赛使用,禁止扩散,组织方承诺保密 [29] 相关会议PRCV2025 - PRCV2025为国内模式识别与计算机视觉顶级会议,涵盖学术前沿、产业应用与技术创新,投稿截止2025年6月30日 [27][30] - 会议由四大国家级学会联合主办,上海交通大学承办,Springer出版论文集并被EI/ISTP检索 [31][32]
自驾搞科研别蛮干!用对套路弯道超车~
自动驾驶之心· 2025-07-11 09:14
课程核心价值 - 通过1v6精英小班模式快速掌握LLM/MLLM领域科研全流程,包括模型理论、代码实践、论文写作与投稿技巧 [1][5][10] - 提供经典与前沿Baseline资源,导师定制化分配研究idea,确保学员产出完整论文初稿 [6][7][20] - 系统性解决知识碎片化问题,帮助构建算法设计、创新思路及论文写作方法论体系 [10][22] 导师资质 - 毕业于知名计算机院校,具备计算机视觉、模型压缩、多模态大语言模型等领域的算法研究经验 [2] - 在CVPR/ICCV/EMNLP等顶会发表论文十余篇,担任CVPR/ICML/NeurIPS等会议审稿人,拥有多项发明专利 [3] 目标学员 - 自动驾驶领域硕博生(感知/预测/规划方向)、车企算法工程师、AI从业者 [11] - 需具备Python/PyTorch基础,熟悉深度学习框架,最好拥有4张4090显卡级别算力设备 [16][17] 课程设计 - 授课周期3.5-4个月,提供6个月答疑服务,采用腾讯会议直播+小鹅通回放形式 [19][21] - 产出对标SCI 1-4区或CCF A/B/C级别论文,定制化调整idea难度 [20][22] - 配套班主任督学服务,要求学员全勤参与、完成作业并保持学术诚信 [23] 技术门槛 - 最低硬件要求为2张4090显卡,建议掌握Linux开发调试及CUDA语法基础 [16][17] - 需通过1v1面试评估基础能力,课程深度根据学员水平动态调整 [14][16]
中美AI差距有多大,AI竞争焦点在哪?《全球人工智能科研态势报告》全球首发
钛媒体APP· 2025-07-03 18:36
全球AI科研态势 - 报告基于2015-2024年96961篇AI领域文献分析,由联合国工业发展组织与东壁科技数据联合发布,采用东壁指数评价体系 [2] - 全球AI科研演进分为四个阶段:初始起步期(2015-2016年论文量4421→3628篇)、快速发展期(2017-2019年突破万篇)、成熟高峰期(2020-2023年达17074篇)、波动调整期(2024年回落至14786篇) [5][6] - 技术路径从传统机器学习(2015-2017)→深度学习/计算机视觉(2018-2020)→大语言模型/生成式AI(2021-2023)→可解释性AI/多智能体系统(2024-) [6] 中美AI人才对比 - 全球AI人才57.7%集中在中美两国,美国6.3万人领先,中国5.2万人以28.7%年复合增速追赶 [7][8] - 美国形成"人才旋转门"机制(高校企业流动率37%),中国互通率不足15% [10] - 华人学者在美表现突出:全球百人榜中20位在美学者里华人占10位,女性榜11位在美学者含3位华人女性 [3] 机构与企业表现 - 顶尖机构榜:中国占38席(中科院2386人才/4639篇论文),美国35席(总论文35117篇/被引228万次) [7] - 美国企业学术产出优势显著:谷歌(2895篇)+微软(1582篇)+Meta(1419篇)总量是中国TOP3企业(腾讯1354+阿里1034+华为885)的1.8倍 [9][10] - 中国企业应用导向突出:计算机视觉论文比美国高40.8%,知识图谱高50.1%,在自动驾驶/移动支付等场景落地强劲 [11] 技术发展趋势 - 深度学习关键词频率十年增长84倍,2018-2023年均增速217%,2024年进入平台期(增速30%) [14] - 计算机视觉形成"目标检测(78%热词)-语义分割-视觉应用"闭环,语义理解类关键词2022年后年均增45% [14] - Transformers技术2022年后崛起,工程化关键词如特征提取/优化持续升温 [15] 区域与性别特征 - 亚太创新中心崛起:北京/上海/深圳/新加坡/首尔进入全球20大人才聚集区,微软在华部署714人占其全球AI人才29% [13] - 中国AI女性人才占比仅9.3%(美国20.1%),头部企业女性占比6.1%远低于谷歌/微软的18.7% [12][13]
实验室10篇论文被ICCV 2025录用
自动驾驶之心· 2025-07-02 21:54
论文研究成果总结 论文1 - 提出类别级几何学习框架用于三维点云分割的域泛化问题 通过几何嵌入感知点云细粒度属性并构建类别级几何属性 耦合几何嵌入与语义学习提升泛化能力 [1] - 引入几何一致性学习模拟潜在三维分布并对齐类别级几何嵌入 使模型关注几何不变信息 实验验证该方法在域泛化三维分割中具有竞争力 [1] 论文2 - 开发分层变分测试时提示生成方法 通过Hyper Transformer动态生成文本/视觉提示 解决传统方法提示模板固定导致的领域适应性问题 [3] - 采用变分推理减轻提示模板敏感性和分布偏移 通过分层条件提示捕捉深层上下文依赖 实验显示该方法在零样本准确率上达到SOTA [3] 论文3 - 提出知识引导部件分割框架(KPS) 利用大语言模型构建部件结构知识图谱 通过结构知识引导模块将关系信息嵌入视觉特征 [5][6] - 设计粗粒度物体引导模块增强整体类别感知 实现复杂场景下的精细部件分割 突破传统方法忽视部件结构联系的局限 [5][6] 论文4 - 构建TopicGeo统一检索匹配框架 通过CLIP提示学习嵌入文本语义主题 消除多时相遥感图像的类内/类间分布差异 [9] - 采用中心自适应标签分配与离群点剔除机制优化检索匹配流程 实验表明该方法在召回率和匹配精度上均优于分离范式 [9] 论文5 - 提出视觉语言交互关系挖掘模型(VL-IRM) 通过多模态交互学习解决开放词汇场景图生成中的关系感知缺失问题 [11] - 开发关系生成模型增强文本模态的开放式关系探索能力 利用视觉引导扩展关系文本空间语义 实验验证其广义关系表征优势 [11] 论文6 - 设计VGMamba网络实现三维视觉定位 包含属性Mamba、位置Mamba和多模态融合Mamba三模块 通过SVD分解与滑动窗口捕获属性特征 [13] - 提出属性到位置线索推理机制 融合语言查询与点云空间信息精准定位目标物体 在复杂语义查询场景下表现优异 [13] 论文7 - 创新动态中心距离(DCD)度量 通过元学习框架计算特征空间样本难度 解决噪声标签学习中简单样本主导问题 [15] - 结合DCD与半监督训练策略 聚焦硬样本优化分类损失 在合成/真实噪声数据集及医学图像中验证鲁棒性 [15] 论文8 - 提出BuCSFR方法实现粗标签到细粒度表征学习 通过自底向上构建树状图适应动态类别变化 无需预定义类别数量 [17] - 基于最小信息损失准则迭代合并实例 利用EM框架协同优化树状图构建与特征可分性 在物种识别等任务中表现突出 [17] 论文9 - 开发类别特异选择性特征增强模型 针对长尾多标签分类中样本稀缺类别敏感性丧失问题 利用类激活图定位关键区域 [19][20] - 设计渐进式注意力增强机制 按头部-中部-尾部类别顺序提升低置信度响应 实验显示其在标签不平衡场景下的泛化优势 [19][20] 论文10 - 建立部分匹配子图定位框架 通过高斯分布建模跨模态歧义性 放宽指令文本与点云地图严格对齐假设 [22][23] - 提出不确定性感知相似性度量 将定位阶段的不确定性传播至场景识别阶段 提升真实噪声场景下的任务协同性 [22][23] 学术会议背景 - ICCV 2025为计算机视觉A类顶会 本届收到11239份投稿 录用率24% 将于10月19-25日在夏威夷举办 [25] 技术社区资源 - 具身智能之心知识星球聚集近1500名开发者 覆盖40+开源项目与60+数据集 涉及VLA、VLN、Diffusion Policy等前沿方向 [29][30] - 3D视觉之心社区聚焦三维重建、NeRF、SLAM等技术 提供行业交流与求职对接服务 [26][27]