Diseño muestral de la encuesta de movilidad a hogares del proyecto MODURAL en Lima: enfoque, método y elecciones realizadas
Florent Demoraes, Pascal Sebille. Diseño muestral de la encuesta de movilidad a hogares del proyecto MODURAL en Lima: enfoque, método y elecciones realizadas. Université Rennes 2; Iféa; Ined. 2023. ⟨hal-04291345⟩
En los sondeos de opinión de las grandes metrópolis latinoamericanas, la movilidad cotidiana es la segunda preocupación después de la inseguridad. Una gran mayoría de los habitantes de las ciudades experimentan verdaderas dificultades para desplazarse a diario, y esto es aún más cierto para las clases desfavorecidas relegadas en los barrios periféricos. En este contexto, se analiza en el proyecto ANR Modural los viajes al trabajo y a la escuela en la periferia de Bogotá (Colombia) y Lima (Perú), dos capitales que cuentan cada una con más de 9 millones de habitantes en 2021. Para ello, se realizaron dos encuestas por cuestionario a una muestra de 1.600 hogares (800 por ciudad) entre junio y agosto de 2022 en cuatro zonas ilustrativas de los contextos urbanos periféricos que prevalecen en cada una de estas dos capitales. En este manual se exponen los objetivos, las dificultades y las opciones metodológicas adoptadas en el diseño de la muestra para la encuesta en Lima. Se explica el interés de usar un diseño muestral bietápico estratificado por áreas y se presentan las diferentes etapas del diseño. Se describe la estratificación de las zonas de la encuesta diseñada con base en un análisis factorial y de conglomerados con las pruebas de validación estadística asociadas, el cálculo de los tamaños de las muestras, el sorteo aleatorio de las unidades primarias (manzanas) y secundarias (hogares) y, por último, el cálculo de los factores de expansión y los intervalos de confianza. El diseño del muestreo se basa en fuentes de datos que no son específicas de Lima. Se sustenta sobre todo en datos censales y capas SIG (manzanas, divisiones administrativas, mapas de base e imágenes de satélite) que hoy en día están disponibles libremente en numerosos países. Con vistas a la reproducibilidad, sólo se utilizó software libre o de código abierto, como el software R y, más ocasionalmente, los softwares QGIS y SavGIS. Los scripts de R y las funciones SIG utilizadas se detallan en los anexos. Esta metodología se utilizó del mismo modo para la encuesta de hogares ANR Modural de Bogotá.
In opinion polls of large Latin American metropolises, daily mobility is the second most important concern after insecurity. A large majority of city dwellers experience real difficulties in getting around on a daily basis, and this is even truer for the low-income classes relegated to outlying neighborhoods. In this context, the ANR Modural project focuses on commuting to work and to school in the outskirts of Bogotá (Colombia) and Lima (Peru), two capitals that have more than 9 million inhabitants each in 2021. To this end, two questionnaire surveys were deployed among a sample of 1600 households (800 per city) between June and July 2022 in four areas that illustrate the peripheral urban contexts of each of these two capitals. This handbook discusses the objectives, stumbling blocks and methodological choices made to devising the sample design for the survey applied in Lima. In particular, it explains the interest of a stratified two-stage areal sampling design for household surveys. The different steps in the development of such a design are successively presented, from the stratification of the survey areas based on factorial and cluster analysis with associated statistical validation tests, the calculation of sample sizes, the random drawing of primary units (blocks) and secondary units (households), and finally the calculation of weights and confidence intervals. The development of such a sampling methodology relies on data sources that are not specific to Lima. On the contrary, it relies in particular on the use of censuses and GIS layers (city blocks, administrative divisions, base maps and satellite images) which are now openly available in many countries. In a perspective of reproducibility, only free or open-source software is used, including the R software and more occasionally the QGIS and SavGIS software. The R scripts and the GIS functions used are detailed in the appendix of the handbook in order to facilitate their re-use. The same methodology was used for the ANR Modural household survey in Bogotá.