核心观点 报告评估四种非洲国家详细家庭普查提取数据的替代基于卫星的深度学习方法,以加速大规模、细粒度和动态贫困测量的进步,结果表明变压器架构解决多个开放问题,结合卫星图像、公开可获取的地理特征以及新的深度学习架构,可在数据稀缺环境中实现高度局部化和动态的贫困测量 [4]。 研究背景 - 准确、最新且高度细化的经济福祉测量对监测和实现国际减贫目标至关重要,但官方对低收入和中等收入国家的贫困测量长期依赖家庭调查,存在耗时、难以获得全面及时数据、无法生成村庄或小区层面可靠估计等问题,因此需要成本效益高且可扩展的替代方案 [8][9] - 近年来公开可用的遥感数据日益丰富,机器学习的最新进展改变了生计测量格局,早期研究利用卫星图像和机器学习估算财富,后续研究引入改进提高了测量精度 [10][11] 研究方法 数据集构建 - 汇集大规模、多分辨率和多时间尺度的贫困数据集,涵盖四个非洲国家(马拉维、莫桑比克、布基纳法索和马达加斯加)超过120万户家庭的数据,包含两个马拉维城市内精确地理参考的测量数据及同一地点随时间的重复测量数据 [11] - 使用国家普查问卷的数据构建资产财富指数,将七种住房特征按1到5的等级排序,六项资产用二元分类评估,数据标准化后构建主成分分析模型,提取第一个主成分作为资产财富指数,并汇总到行政区域级别标注 [34] - 国家层面的贫困及其变化预测收集白天Landsat卫星影像,马拉维和莫桑比克有双时间点影像对;城市级别的贫困情况预测收集PlanetScope和SkySat多光谱卫星图像 [36] 模型构建 - 比较基于树的模型XGBoost和两种先进的深度学习模型(基于卷积神经网络的模型和基于编码器 - 线性架构的变换器模型) [37] - XGBoost回归模型,仅使用卫星影像时用三个矩(均值、标准差和偏度),结合卫星影像和地理空间特征时用一个矩(均值);财富变化预测将两个年份的所有通道矩输入模型预测AWI的变化 [38] - 基于ResNet - 18的CNN模型进行财富水平预测和变化预测,财富水平预测先提取深层特征,通过全局平均池化层计算嵌入向量,附加两个多层感知器层预测AWI;贫困变化预测将两个时间点的图像沿通道轴连接提取深层特征 [38] - 变压器架构采用SwinV2 - T作为骨干网络提取深层层次特征,附加两层MLP层预测AWI;通过条件机制将地理空间特征融入深层特征;贫困变化预测采用Siamese网络架构,共享SwinV2 - T骨干网络,连接两个深层特征集合输入两层MLP层预测贫困变化 [39] 模型训练与评估 - 所有深度模型使用相同配置训练,通过最小化均方误差损失并使用AdamW优化器从头到尾进行端到端训练,训练100个周期,总批次大小为32,学习率为常数1e - 4,权重衰减为1e - 2,训练数据增强采用D4旋面群变换 [40] - 采用五折交叉验证的方法评估模型性能,为每个国家或城市训练五个不同的模型,在四折数据上训练,剩余一折上测试,用R²作为级别和更改预测的度量 [40] - 模拟两种数据可用性受限的场景:限制图像数量,使用完整训练集样本的1%、5%、10%、25%、50%和100%进行实验;限制图像中的户数,引入替代的“10户资产财富”标签 [41] 研究结果 国家一级财富预测 - 变压器模型在马拉维、莫桑比克和马达加斯加表现更佳,使用整个普查提取数据训练时,R²值分别为0.83、0.70和0.62;在布基纳法索,基于卫星影像和地理空间特征的XGBoost模型表现最佳,解释了62.9%的变异,简单变压器模型也保持竞争力,解释了57.4%的变异 [14] - 实证识别出训练样本数量为原始训练数据集的10%是关键转折点,在此之下估计精度会迅速下降 [14] - 地理空间特征能显著改善国家一级财富预测的绩效,特别是在布基纳法索,训练样本量较小时地理空间特征尤为有益 [17][18] 国家一级财富变化预测 - 基于完整样本训练的深度学习模型能够捕获马拉维52%的变化和莫桑比克42%的变化,给定相同输入数据时,深度模型表现优于XGBoost [19] - 变压器模型在估计莫桑比克十年财富变化方面略微优于常用的CNN,在马拉维达到相当性能;减少采样地点的数量比减少每批次样本的家庭数量对准确性的下降影响更大 [21] 城市级财富预测 - CNN和Transformer模型在两个城市中始终优于XGBoost,Transformer模型在Blantyre表现明显优于CNN,在Lilongwe实现与CNN相当的性能;所有模型随着训练数据比例增加表现显著改进,达到约25% - 50%后性能提升开始停滞 [26] - SkySat在各种训练数据比例下均一致地优于PlanetScope,SkySat适用于高精度要求的当地区域财富测量,PlanetScope更适合进行大规模财富mapping [27] - 城市级别的财富预测中,地理空间特征通常会降低模型性能;实现了精确的大规模、城市级财富地图绘制,0.3公里分辨率城市级财富图能解释利隆沃大约76%的变化情况,解释布兰太尔大约67%的变化情况 [27][28] 研究结论与展望 - 变压器模型在横截面财富预测、城市内财富预测和财富变化预测中表现出色,优于CNN和XGBoost模型,强调了开发相关工具、文档和培训材料以及不确定性估计方法的重要性 [29][30] - 获得大量训练数据对估计预测模型很重要,未来研究可探讨在小样本量训练变压器模型时提高性能的方法,以及变化模型中参数在时间和/或空间上的稳定性 [32]
动态、高分辨率贫困数据稀缺环境中的测量
世界银行·2025-02-12 16:57