利用调查和人口普查数据评估小面积贫困估计的替代方法

报告行业投资评级 * 该报告为世界银行政策研究工作论文，属于学术研究范畴，未对任何行业或投资标的给出明确的“买入”、“持有”或“卖出”评级 [1][5][6] 报告核心观点 * 该研究通过基于墨西哥和巴西人口普查数据的模拟，系统评估了结合调查与普查数据进行小区域贫困估计的不同模型与方法的性能 [4][24] * 核心结论是：没有一种方法在所有情境下都占优，其相对表现具有情境特异性 [4][133] * 当样本权重经过重新调整后，在预测中使用更细粒度的数据（如家庭或村庄级预测变量）没有坏处，且通常能带来更准确或同等准确的估计 [4][133] * 在墨西哥，由于区域内样本具有信息性且权重分布高度偏斜，重新调整样本权重对估计准确性至关重要，否则会严重扭曲不同方法间的性能比较 [31][54][113] * 仅使用区域级预测变量的模型（如Fay-Herriot模型）在面对样本选择偏差和小样本量时，其性能表现会显著下降 [29][100][106] * 包含家庭级预测变量的模型在面对调查预测变量中的经典测量误差时，表现可能不如省略家庭级变量的模型稳健 [27][110] 根据相关目录分别进行总结研究方法与模型概述 * 研究评估了七种主要的小区域估计方法，这些方法根据所用预测变量的层级（家庭级、初级抽样单位级、市级）分为三类 [35][36] * 第一类模型使用家庭、PSU和市级预测变量来预测家庭收入，主要包括经验最佳预测器（EBP）和ELL方法 [37][39] * 第二类模型仅使用PSU和市级预测变量，包括PSU级单位背景模型、子区域模型和提升回归森林（BRF）方法 [40][44] * 第三类模型仅使用市级预测变量，包括Fay-Herriot区域级模型和仅使用区域级预测变量的单位背景模型 [45][49] 在“完美数据”下的结果 * 在墨西哥，EBP单位级模型比ELL方法更准确（平均等级相关性为0.956 vs 0.948），而在巴西两者表现相当（平均等级相关性均为0.969）[25][91][94] * 省略家庭级预测变量会导致准确性轻微下降：在墨西哥，PSU级单位背景模型的平均等级相关性从0.956降至0.954；在巴西，从0.969降至0.965 [26][95] * 仅使用PSU级和市级预测变量的模型（子区域模型、PSU单位背景模型）与仅使用区域级预测变量的模型（Fay-Herriot、区域单位背景模型）相比，准确性更高或相当 [28][97] * 在模拟的定向转移项目中，基于不同方法估计的贫困率进行目标定位，对贫困差距减少的影响差异很小，在墨西哥最多相差0.4个百分点，在巴西最多相差0.34个百分点 [26][86][97] 在“不完美数据”下的结果 * 当调查与普查数据来自不同年份时，仅使用区域级预测变量的模型（如区域单位背景模型和Fay-Herriot模型）比使用家庭级预测变量的单位级模型更具稳健性 [26][98] * 当样本存在选择偏差时，Fay-Herriot模型和仅使用区域级预测变量的单位背景模型准确性下降最为明显，而使用PSU级预测变量的模型能部分纠正偏差，表现更好 [29][100][103] * 当样本量较小时，Fay-Herriot模型的准确性也出现不成比例的下降，在墨西哥的最小样本中，其平均等级相关性为0.911，低于其他方法 [106] * 当调查预测变量存在经典测量误差时，使用家庭级预测变量的EBP单位级模型可能比省略家庭级变量的单位背景模型更容易受到影响 [27][110] 样本权重与方差平滑处理的重要性 * 在墨西哥，由于样本权重在各市间的分布高度偏斜，估计线性模型时使用未经重新调整的“原始”样本权重会显著降低估计准确性（例如，EBP单位级模型的平均等级相关性从0.956降至0.919），并扭曲方法间的比较 [31][54][114][115] * 在估计EBP模型时，混合权重和广义最小二乘法（GLS）加权方法通常能产生最准确的估计 [118] * 对于Fay-Herriot模型，对直接估计的抽样方差进行平滑处理至关重要，特别是在小样本或存在选择偏差的情况下，可以防止因某些区域样本贫困率为0或100%而导致的估计偏差，若不进行平滑，准确性会大幅下降 [49][121][122]