Workflow
In-person Surveys
icon
搜索文档
调查模式对数据质量的影响:来自尼日利亚的实验证据
世界银行· 2026-02-07 07:10
报告核心信息 - **报告行业投资评级**: 该文件为世界银行的政策研究工作论文,并非针对特定行业或公司的投资分析报告,因此未提供传统的“买入”、“持有”或“卖出”等投资评级 [1][3][6] - **报告的核心观点**: 通过尼日利亚农村的大规模随机实验,研究发现电话调查与面对面调查之间存在显著且普遍的模式效应,电话调查的响应与面对面调查的响应中位数相差17%–18%,这些效应在规模上可与甚至超过覆盖误差等其他常见调查误差,对中低收入国家的经济研究和数据质量具有重要影响 [4][13][19] 实验设计与方法 - **研究背景与目的**: 在中低收入国家,电话调查因其成本低、部署快、灵活性高而日益成为重要的数据收集方式,尤其是在COVID-19大流行之后,但对其数据质量的担忧依然存在,本研究旨在通过实验隔离并量化调查模式本身带来的测量误差 [9][10] - **实验设计**: 研究在尼日利亚农村地区进行,向随机选择的937户家庭分发手机,并对他们先后进行电话和面对面访谈,使用完全相同的问题集,并随机分配两种模式的访谈顺序,从而实现了“受访者间设计”和“受访者内设计” [12][33][34] - **识别策略**: 采用两种互补的策略识别模式效应:1) 受访者间设计:比较随机分配到先接受电话访谈和先接受面对面访谈的两组受访者的首次访谈结果;2) 受访者内设计:比较同一受访者在两种模式下的回答差异,同时随机化访谈顺序 [12][40][41] - **控制条件**: 实验设计通过随机分配、控制访谈间隔时间(平均约4-6天)、使用相同问卷、分发手机确保覆盖范围一致等方式,以隔离模式效应,并测试排除了排序或学习效应的干扰 [44][45][48] 主要研究发现:模式效应的普遍性与规模 - **效应普遍存在**: 在健康、劳动、冲击、福祉和粮食安全等主题的20项结果指标中,几乎都检测到了具有统计学意义的模式效应 [13][57] - **效应规模**: 电话收集的响应与面对面估计值的中位数差异为18%(受访者间设计)和17%(受访者内设计),两种设计结果的高度一致性增强了研究发现的稳健性 [13][57] - **效应方向**: 70%的结果指标的模式效应为正值,表明受访者倾向于在电话中提供更肯定或更频繁的响应,例如更频繁地报告健康事件、家庭企业活动、粮食消费和冲击暴露 [13][60] - **领域差异**: 健康领域的模式效应最大,例如健康支出发生率差异达199%(受访者间设计)和198%(受访者内设计),COVID-19疫苗接种率差异达63%和62%,而膳食多样性分数的模式效应最小,仅为4%和2% [57][58] 模式效应的异质性及行为模式 - **个体异质性**: 受访者层面的模式效应存在巨大差异,平均效应掩盖了不同方向的个体效应,例如,23%的受访者在电话中报告患病而面对面中没有,同时16%的受访者则相反 [64] - **教育水平的影响**: 受教育程度更高的受访者更不易受模式效应影响,与未接受正规教育的受访者相比,拥有小学、中学和高等教育背景的受访者给出不一致答案的概率分别低约4、5和7个百分点 [70] - **回答选项数量的影响**: 模式不一致的可能性随着离散答案选项数量的增加而急剧上升,二元问题的不一致率为36%,而拥有十个选项的主观福祉问题不一致率高达82%,每增加一个回答选项,不一致概率平均增加5个百分点 [75][78] - **系统性行为差异**: 电话受访者表现出更强的同意倾向,对二元问题回答“是”的概率高19.4个百分点,对控制点陈述表示同意的概率高34.7个百分点,同时更可能提供极端值(高16.7个百分点)和取整的数值响应(高11.8个百分点) [74][76][113] 模式效应与其他调查误差的比较 - **与覆盖误差比较**: 覆盖误差(因非普遍拥有手机导致)在约一半的结果指标中显著,但其规模通常小于模式效应,中位数仅为模式效应规模的21%,且两者常符号相反,在汇总时会相互抵消,从而掩盖数据中潜在的巨大抽样和非抽样误差 [15][83] - **其他误差评估**: 实验评估表明,向家庭分发手机(捐赠效应)并未影响其提供的回答,同时研究也未发现受访者因短期内接受两次访谈而产生排序或锚定效应 [88][89] 研究贡献与启示 - **对数据质量的贡献**: 该研究提供了迄今为止关于中低收入国家调查中模式效应的规模与机制最全面的实验证据,并强调了解决电话调查测量误差对于提升数据质量的重要性 [16][17] - **对数据分析的启示**: 模式效应可能使跨模式数据比较或合并产生严重偏差,简单的模式虚拟变量调整可能不足,需要结合更严格的调查设计和分析校正技术(如利用纵向数据或重复观测)来应对 [97][98] - **对调查设计的启示**: 为改善数据质量,应在混合模式系统中尽可能标准化问卷、访员培训和现场规程,设计适合电话调查的问卷,加强测试和试点,并利用实时调查管理系统监测响应质量 [99][100][102] - **未来研究方向**: 需要在不同情境下复制实验以验证外部有效性,进一步探究激励措施和访员的作用机制,寻找客观基准来评估数据准确性,并开发统计调整方法以减轻模式效应带来的偏差 [108]