De lo Macro a lo Micro: Implementación del NSE a Nivel Local en México
Summary
TLDREl comité aborda el desafío de implementar niveles socioeconómicos en áreas geográficas pequeñas, utilizando datos del censo y de la encuesta de ingreso y gasto. Se exploran metodologías como K medias y análisis discriminantes para estimar variables faltantes, como autos y baños completos. El modelo discriminante se selecciona por su mayor precisión, permitiendo calcular la distribución de siete niveles socioeconómicos. Se accede a datos detallados de INEI para correr modelos y se realizan agregaciones a diferentes niveles geográficos. Los resultados son consistentes con la realidad, permitiendo una planificación y distribución precisa de recursos.
Takeaways
- 😀 El comité se enfoca en implementar el nivel socioeconómico a áreas geográficas pequeñas, un reto constante.
- 📊 La encuesta de ingreso y gasto se utiliza cada dos años para hacer estimaciones a nivel nacional, estatal, urbano y rural.
- 🚗 Existe una limitación debido a la falta de datos sobre el total de automóviles y el número de baños completos en el censo de población y vivienda.
- 🔍 Se revisaron diferentes metodologías para estimar las variables faltantes y aplicar el modelo al censo, utilizando seis variables clave.
- 🏢 Se comparó la información del INE con el censo de 2020, encontrando una alta consistencia en la mayoría de las variables.
- 📉 Se exploraron estrategias como el uso de K medias, análisis discriminantes y offset para estimar las variables faltantes.
- 🏆 El modelo discriminante resultó ser el más preciso para estimar los niveles socioeconómicos y se utilizó para calcular la distribución de los siete niveles.
- 🏢 Se obtuvo acceso a la información de cada registro de las viviendas para correr el modelo y hacer agregaciones a diferentes niveles geográficos.
- 🗺️ Se analizaron las estimaciones a nivel de manzana, ajev, localidad y municipio, y se compararon con la información de la encuesta de ingreso y gasto.
- 🔑 Se resaltan las diferencias menores entre las estimaciones del censo y la encuesta, y se destaca la consistencia en la información a nivel nacional.
Q & A
¿Cuál es el desafío principal mencionado en el comité de niveles socioeconómicos?
-El desafío principal es implementar el nivel socioeconómico para áreas geográficas pequeñas, utilizando la información de la encuesta de ingreso y gasto cada 2 años para hacer estimaciones a diferentes niveles geográficos.
¿Qué información faltante se necesita para estimar los niveles socioeconómicos a nivel local?
-Se necesitan dos variables que no están en el censo de población y vivienda: el total de automóviles y el número de baños completos.
¿Qué metodologías se exploraron para estimar las variables faltantes y aplicar el modelo al censo?
-Se exploraron tres estrategias: la estimación a partir de K medias, la estimación a partir de criterios de similaridad basados en distancias euclidianas y la estimación de las variables que sustituyen a las faltantes con análisis discriminantes y análisis offset.
¿Cuál fue la metodología seleccionada y por qué?
-El modelo discriminante fue seleccionado porque tuvo mayor precisión en las estimaciones y permite calcular la distribución de los siete niveles socioeconómicos, no solo el predominante.
¿Cómo se estimaron los dos variables faltantes, el número de baños completos y el número de automóviles?
-Las dos variables faltantes se estimaron mediante el modelo discriminante, con una coincidencia del 75% para el número de baños completos y casi un 80% para el número de automóviles, comparados con la estimación del INEI.
¿Cómo se utilizó la información de la Ciudad de México para probar las metodologías?
-Se utilizó la Ciudad de México para verificar si las colonias o zonas conocidas coincidían con los niveles socioeconómicos estimados, proporcionando elementos para calificar la bondad de las estimaciones geográficamente.
¿Qué restricciones impone el INEI en la publicación de la información?
-El INEI impone restricciones de confidencialidad que no permiten publicar menos de tres casos en una unidad geográfica, lo que afecta la coincidencia de las agregaciones a niveles superiores.
¿Cuál es la disponibilidad de la información a nivel de manzana y para qué tipo de público está disponible?
-La información a nivel de manzana está disponible solo para socios y a la venta para el público en general, mientras que la información a nivel de ajev y mapas para algunas áreas metropolitanas se pueden descargar en la página de la MAY.
¿Cómo se puede acceder a la información de identificación geográfica y niveles socioeconómicos?
-La información de identificación geográfica y niveles socioeconómicos se encuentra disponible en formato de SPSS y Excel, y se compone de la clave ID entidad, clave de municipio, clave de localidad, clave de ajev y clave de manzana.
¿Cómo se pueden visualizar las diferencias socioeconómicas en la delegación de Benito Juárez y en otras áreas?
-Se pueden visualizar las diferencias socioeconómicas a través de mapas que utilizan colores para representar los diferentes niveles socioeconómicos, permitiendo ver claramente las zonas de alto y bajo nivel en áreas específicas como Benito Juárez, Miguel Hidalgo, Cuauhtémoc, etc.
Outlines
📊 Análisis de Niveles Socioeconómicos a Micronivel
El primer párrafo aborda el desafío de implementar el análisis socioeconómico a nivel micro para áreas geográficas pequeñas. Se menciona la encuesta de ingreso y gasto que se realiza cada dos años y permite estimaciones a nivel nacional, estatal, urbano y rural. Se destaca la limitación de la regla del censo de 2020, que no incluye variables como el número total de automóviles y baños completos, que son necesarias para el modelo. Se exploraron diferentes metodologías para estimar estas variables faltantes, utilizando la información del censo y variables como escolaridad, disponibilidad de internet, número de automóviles y baños. Se compararon los datos entre la ENIG y el censo de 2020, encontrando una alta consistencia. Se implementaron tres estrategias: uso de K medias, criterios de similitud basados en distancias euclidianas y análisis discriminantes para estimar los niveles socioeconómicos en áreas específicas. El modelo discriminante resultó ser el más preciso y permitió calcular la distribución de los siete niveles socioeconómicos.
🏢 Aplicación del Modelo a Datos de Viviendas
El segundo párrafo describe cómo se aplicó el modelo desarrollado para estimar los niveles socioeconómicos a los datos de viviendas del INEI. Se obtuvo acceso a información detallada de registros de viviendas para correr el modelo y se realizaron agregaciones a diferentes niveles geográficos, como manzana, localidad y municipio. Se comparó la información resultante con la clasificación socioeconómica obtenida a partir del censo y la ENIG 2020, encontrando diferencias menores y coherentes. Se destacan las diferencias entre las estimaciones para viviendas y hogares, y las restricciones de información impuestas por el INEI, como la cláusula de confidencialidad que limita la publicación de datos cuando hay menos de tres casos en una unidad geográfica. Además, se describe la disponibilidad de la información a nivel de estado, municipal, localidad y manzana, y se menciona que los datos están disponibles en formatos SPSS y Excel.
🗺️ Visualización de Datos Socioeconómicos en Mapas
El tercer párrafo presenta la visualización de los datos socioeconómicos en mapas para la delegación de Benito Juárez, destacando cómo se representan los diferentes niveles socioeconómicos con colores. Se describen las áreas con niveles altos, medios y bajos de forma detallada, y se hace un recorrido virtual por diferentes zonas, como Insurgentes, la colonia Florida y la delegación Miguel Hidalgo, donde se identifican áreas de altos niveles socioeconómicos y áreas con concentraciones de niveles más bajos. Se menciona la utilidad de estos mapas para la planificación y el trabajo de campo, y se invita a los asistentes a explorar más zonas si lo desean. Finalmente, se agradece la atención y se menciona la experiencia acumulada en el trabajo con mapas y programas sociales, destacando la importancia de estas herramientas para la planificación y la implementación de políticas públicas.
Mindmap
Keywords
💡Macro a micro
💡Encuesta de Ingreso Gasto
💡Censo de Población
💡Variables faltantes
💡K medias
💡Análisis discriminantes
💡Niveles socioeconómicos
💡Restricciones de información
💡Agregaciones
💡Mapas de distribución
Highlights
El comité se enfoca en implementar el nivel socioeconómico a áreas geográficas pequeñas, un reto constante.
La encuesta de ingreso y gasto se utiliza cada dos años para estimaciones a nivel nacional y estatal.
Existe una limitación debido a la regla del 2020 que coincide con el censo de población.
Se analizaron distintas metodologías para estimar variables faltantes y aplicar el modelo al censo.
Se utilizaron seis variables en el modelo, incluyendo escolaridad y disponibilidad de internet fijo.
Se comparó la información entre el INE y el censo de 2020 para evaluar la consistencia.
Se exploraron tres estrategias para estimar las variables faltantes: K medias, similaridad basada en distancias euclidianas y análisis discriminantes.
La Ciudad de México se utilizó para probar las metodologías y calificar la bondad de las estimaciones.
El modelo discriminante resultó ser el más preciso y se utilizó para calcular la distribución de los siete niveles socioeconómicos.
Se lograron estimar las variables faltantes, número de baños completos y número de automóviles, con una coincidencia del 75% y 80% respectivamente.
Se firmó un convenio con INEI para acceder a información detallada de viviendas para correr el modelo.
Las estimaciones permitieron hacer agregaciones a nivel de manzana, ajev, localidad y municipio.
Se analizaron las diferencias entre la clasificación de nivel socioeconómico utilizando el censo y la ENIG 2020.
Se encontraron diferencias menores en la comparación a nivel estatal entre las dos fuentes.
Se tomaron en consideración las restricciones de información impuestas por INEI, como la cláusula de confidencialidad.
La información geográfica incluye claves de entidad, municipio, localidad, ajev y manzana.
Se proporcionan datos de los siete niveles socioeconómicos, nivel predominante, y tamaño de la localidad.
Los datos están disponibles en formato SPSS y Excel y se pueden descargar mapas a nivel de ajev para algunas áreas metropolitanas.
Se presentan mapas de la delegación de Benito Juárez, mostrando la distribución de niveles socioeconómicos en diferentes zonas.
Se analizan mapas específicos de la alcaldía de Cuauhtémoc, destacando áreas de nivel socioeconómico alto y bajo.
Se discuten las herramientas y plataformas utilizadas para mapear la pobreza y programas sociales, con una experiencia de 20 años.
Transcripts
el comité de niveles socioeconómicos que
es justamente pasar de lo Macro a lo
micro eh Cómo implementamos el nivel
socioeconómico para áreas geográficas
pequeñas que eso pues siempre ha sido un
reto que hemos tenido en el comité
sabemos que la encuesta de ingreso gasto
que podemos utilizar cada 2 años eh nos
permite hacer estimaciones a nivel
nacional a nivel Estatal y dentro del
nivel Estatal para nivel urbano y rural
también a nivel nacional para algunos
cortes urbanos Rurales y como ahorita
presentó Carlos pues para algunas áreas
metropolitanas también no pero bueno la
verdad es que tenemos un poco más de
apetito de de de poder utilizar la
información sobre todo la información
censal para poder hacer estimaciones a
niveles locales no eh sin embargo pues
había eh la limitación eh que contiene
la regla del 2020
Y por qué hablo del 2020 porque pues es
la encuesta de ingreso gasto que
coincide justo con el censo de población
entonces utilizamos esa fuente de
información pero Teníamos dos variables
que no están en el censo de población y
vivienda como las necesitamos que son el
total de automóviles y el número de
baños completos sí había como vamos a
ver más adelante algunos indicadores que
nos acercaban un poquito en los dos
temas entonces bueno revisamos distintas
metodologías para lo lograr estimar las
variables faltantes y así aplicar el
modelo a la información del censo
eh las seis variables que intervienen en
el modelo ya las sabemos la escolaridad
del jefe personas de 14 años hay más que
trabajan la disponibilidad de internet
fijo en la vivienda el número de
automóviles que no está tal cual en el
censo sino está Solamente si dispone de
auto o camioneta el número de
dormitorios y el número de baños
completos que no está está Solamente la
disponibilidad de sanitario entonces
Bueno lo primero que hicimos eh fue
hacer un comparativo de esta información
entre el enig y el censo de 2020 para
ver la consistencia y encontramos que la
verdad en los indicadores que tenemos
originales hay muchísima consistencia en
todas las variables A lo mejor un
poquito de diferencia en alguna
categoría de escolaridad pero todos los
demás están prácticamente con diferencia
de un punto medio punto porcentual
Entonces eso nos decía Mira al menos las
variables las cuatro que sí tienes son
perfectamente comparables y las otras
dos que tienes como proxis pues se
aproximan mucho que es la disponibilidad
de automóvil o
camioneta que es esta y la
disponibilidad de sanitario se parece
mucho Entonces ahora el reto es cómo
pasamos de la disponibilidad de
sanitario y la disponibilidad de
automóvil o camioneta a tratar de
estimar Cuántos autos hay y cuántos
baños hay entonces Bueno pues para eso
qué hicimos para complementar la
información faltante y lograr estimar
los niveles de cada área como la
distribución En cada una de las siete
categorías se siguieron tres
estrategias hicimos grupos dentro del
comité de niveles socioeconómicos cada
quien se dedicó a explorar una uno fue
la estimación a partir de K medias que
permite formar grupos a partir de sus
características minimizando las sumas de
distancias entre cada objeto y el
centroide de su conglomerado es decir
tomamos el nivel a vemos Quiénes están
cerca y con eso tratar de ubicarlo
estimación a partir de criterios de
similaridad basados en distancias
euclidianas y creo que ha algo se hizo
después de mahalanobis también y la
tercera fue la estimación de las
variables que sustituyen a las faltantes
con análisis discriminantes y análisis
offset que permite visualizar las
interacciones entre las categorías de
las variables y para hacer la prueba de
las
metodologías utilizamos la Ciudad de
México que bueno era muy fácil ahí ver
si había colonias que todos conocemos o
zonas que dijos esto no puede ser nivel
a b o este no puede ser nivel D en fin o
sea geográficamente Nos daba elementos
como para calificar la bondad de las
estimaciones
eh Y después de analizar los resultados
de las metodologías decidimos utilizar
el modelo discriminante dado que tuvo
mayor precisión en las estimaciones y
permite calcular la distribución de los
siete niveles socioeconómicos y no solo
el predominante eh las dos variables
faltantes número de baños completos y
número de automóviles se lograron
estimar mediante esta metodología en el
caso del número de baños logramos una
coincidencia del
75 respecto a la estimación del enig y
para el caso de los automóviles fue
mejor ocho casi nu de cada 10
este observaciones coincidían con lo que
observamos entre las dos
Fuentes una vez teniendo el modelo que
sustituye a las dos variables con
nuestros amigos del Inegi hicimos un
convenio nos dieron acceso a la
información de cada uno de los registros
de las viviendas para correr nuestro
modelo Y ya teniendo las estimaciones
pudimos hacer las agregaciones a nivel
de manzana de ajev de localidad y de
municipio que era lo que necesitamos
claro hicimos también las agregaciones a
nivel de estado pues para fines
comparativos con lo que estábamos
teniendo
eh A partir de la de la encuesta de
ingreso gasto
eh Y con esto pudimos ver la
consistencia de la información y aquí
vemos cómo se comporta la información de
la clasificación ya de nivel
socioeconómico utilizando el censo y la
May digo la enig 2020 Y entonces bueno
que sí hay algunas diferencias pero
estas diferencias se dan básicamente de
la diagonal principal a las celdas
adyacentes y con porcentajes
relativamente
bajos y Cuando hacemos la comparación a
nivel Estatal también encontramos
algunas diferencias algunas más grandes
como esta en chapas en fin todas estas
que están en amarillo son diferencias eh
fuera de lo normal pero en general vemos
que la tabla tiene diferencias respecto
a la estimación de 1% punto5 en fin eso
pues nos da como muy buena eh
prospectiva de de de del trabajo que
estábamos
haciendo y a pesar de que encontramos
estas diferencias las estimaciones a
nivel nacional entre las dos Fuentes
pues son sumamente parecidas no eh
También diferencias de un punto de dos
puntos en fin que no nos causaba la
verdad ningún eh conflicto en el
comité y con eso Bueno pues
eh hay que tomar también en
consideración después de todo este
ejercicio los siguientes temas por un
lado las estimaciones se hacen para
viviendas en el caso del censo de
población y vivienda y para hogares en
el caso del enig eh el modelo utilizado
evidentemente es distinto en los dos en
los dos Fuentes por eso no nos preocupa
tanto que hay estas diferencias son
naturales y existen también
restricciones en la información que nos
impone el inji con toda razón firmamos
un convenio en este convenio hay una
cláusula de cláusula de confidencialidad
donde no se pueden publicar menos de
tres casos en una unidad geográfica
cualquiera que esta sea eh
las agregaciones a niveles superiores No
necesariamente coinciden por estas
restricciones O sea si Nosotros tomamos
la información de manzanas y la
agregamos a nivel de localidad pues no
nos va a coincidir con la estimación de
localidades Pues porque estamos quitando
una cantidad de viviendas que no podemos
reportar porque tienen que haber al
menos tres
eh la información a nivel Estatal
municipal por localidad y por ajeb están
disponibles para cualquier persona en la
página de la May se pueden bajar se
pueden bajar también algunos mapas a
nivel de aev Para algunas áreas
metropolitanas y la información a nivel
de manzana está disponible solamente
para socios y a la venta para público en
general y qué tenemos en la base de
datos Bueno pues tenemos toda la
identificación geográfica que está
compuesta por la clave ID entidad eh
clave de municipio clave de localidad
clave de ajev y clave de manzana Y
tenemos el total de viviendas para cada
uno de los eh siete niveles
socioeconómicos tenemos el nivel
predominante en la unidad tenemos las
viviendas totales que hay en la unidad y
el tamaño de la localidad a donde
pertenece ese eh manzana eh o ese jef
entonces Esto es lo que tenemos eh Y
tenemos un total de municipios los
2469 municipios 189,000 registros de
calidad cerca de un cu4 de millón de
aeps y más de 2.3 millones de manzanas y
estas bases están disponibles en formato
de spss y de Excel y Bueno es es la
estructura que se
tiene ya no me ayuda
Esto ya no me
ayuda Ya se acabó la pila de esto
Pero bueno eso es lo que queríamos muy
bien Bueno ahora pues vamos a darle una
probadita a la información no sé cuántos
de ustedes ya hayan utilizado la
información pero bueno pues vámonos a la
delegación de a la alcaldía Benito
Juárez y vamos a ver aquí están los
colores el color rojo Este es el nivel
AB Este moradito es el c+ el azul oscuro
como este es el c y después los colores
verdes Bueno hay unos que se confunden
desafortunadamente con parques pero los
niveles más bajos el D más d y e son
colores verdes entonces a ver si quieres
hacemos un zoom por esta zona que es una
zona que está por insurgentes y que
seguramente muchos de ustedes la conocen
un poquito más para arriba es el cruce
esta parte de aquí es el cruce de
insurgentes y donde sale el eje de
Ángelus rasa entonces bueno si
recordamos ahí hay una zona de nivel
alto con casas muy grandes no y todo el
alrededor también y un poquito más para
arriba tenemos por acá la colonia
Florida de la Colonia Nápoles en donde
Pues hay eh mezcla de nivel alto nivel
medio no este podemos pasar al al mapa
de digo no sé si alguien quiera ver
alguna zona en particular del avenito
Juárez en particular los que tienen agua
contaminada por ejemplo
no está este este la alcaldía estapalapa
que bueno pues igual no vale mucho la
pena A lo mejor hacer un zoom ya vemos
que ha ha una alta concentración de
nivel socioeconómico bajo son todos los
verdes verdes claritos verdes más
oscuros y solamente alguna zona por acá
de de nivel socioeconómico alto que creo
que está pegado a
algún al avenito Juárez Exacto donde hay
creo que hasta un campo de golf una cosa
así pero bueno ahí contrastamos como hay
zonas
y exactamente cerca del cont Club tienes
toda la razón así es eh Y ahora bueno en
la Miguel Hidalgo Bueno pues vemos
también la la distribución que tiene
toda esta parte de aquí en las zona de
las Lomas que a lo mejor no hace ni
siquiera mucha falta hacer un zoom
evidentemente es predominantemente nivel
a pero si nos vamos a esta zona del
centro Ahí vamos a encontrar Polanco y y
vamos a encontrar Anzures si podemos
hacer un zoom a esta a esta zona Karen
por
favor esto Esta parte de aquí pues por
aquí está presente mazari está orcio
está Homero todo esto es Polanco y por
aquí tenemos ya ansures también en esta
zona y esta parte de acá es la que
tenemos atrás de Mariano Escobedo que ya
es toda esta zona donde está Pemex y
todos los lagos en fin entonces Bueno la
verdad es que al ver estos mapas a mí me
da como mucha tranquilidad de que lo que
estamos haciendo lo que estamos
plasmando pues obedece mucho a la
realidad que tenemos no lo mismo en la
en la en la delegación cuautemoc También
tenemos Pues todo esto es la Condesa
aquí está amsterdam y vemos cómo están
combinados nivel a b c+ c y ya de este
lado que es como la zona de los de la
Colonia de los doctores Pues están los
niveles más bajos sí no sé si alguien
quiera ver algo más de estos mapas de
alguna distribución y este y bueno esto
ya hemos hecho bastante ejercicio aquí
Félix no me dejará mentir trabajamos
juntos muchos años en en en este también
mapear la pobreza y los programas
sociales en en este mismo tipo de
plataformas entonces bueno esto ya es
una experiencia que tiene 20 años no
este y y y que la verdad es que lo
liberamos y lo ponemos a disposición
Pues porque al menos nosotros en la
práctica y conceptualmente creemos que
es una muy buena herramienta que nos
puede ayudar a todos en pues planeación
del trabajo de campo en fin no Entonces
si no tienen ningún otro comentario Si
no quieren ver nada más este agradezco
agradezco mucho e la atención y y pues
yo creo que vamos a pasar siguiente tema
Dale gracias
Browse More Related Video
Mesas de Trabajo: Futuro de los Niveles Socioeconómicos
Evolucionando en la Medición de Niveles Socioeconómicos
Orígenes y fundamentos de los Niveles Socioeconómicos
Estándares y Desafíos en la Medición de los Niveles Socioeconómicos en Latinoamérica
Intervalos de confianza de la media poblacional con una desviación estándar conocida
Estatística Básica para Ciência de Dados
5.0 / 5 (0 votes)