Workflow
全球首个,Nature重磅研究:计算机视觉告别“偷数据”时代
索尼集团索尼集团(US:SONY) 36氪·2025-11-06 16:13

计算机视觉(CV)技术,广泛应用于自动驾驶汽车、消费电子设备等众多领域。其中,图像数据集扮演着基础性的角色,ImageNet 等大型图像数据集的 出现,使计算机视觉领域实现了革命性突破。 然而,过去十年,大多数数据集的数据采集依赖网络抓取,仍然存在未经授权、缺乏多样性、知情同意以及补偿相关的伦理问题。 数据的"先天不足"不仅削弱了人工智能(AI)系统的公平性和准确性,还在无形中强化了种族、性别等社会偏见。 例如,有研究指出,商业人脸识别系统在识别深肤色女性时的错误率远高于浅肤色男性;部分知名数据集因数据收集的伦理争议相继撤回,即便仍在使用 的数据集,如 COCO、VQA2.0 或 MIAP,在人口多样性和自我报告信息方面仍存在明显缺陷。 在这一背景下,Sony AI 推出了全球首个公开可用的、全球多样化的、基于用户同意的数据集——FHIBE,专门用于评估以人为中心的计算机视觉任务的 公平性。 据介绍,FHIBE 收录了来自 81 个国家和地区的 10318 张图像,涉及 1981 位独立个体,涵盖从人脸识别到视觉问答等广泛视觉任务。 此外,FHIBE 拥有迄今最全面的标注信息,包括人口统计特征、物理属性、环境 ...