Ingresar
Ingresar
  • ¿Qué es el PAD?
  • ¿Qué es ANDA?
  • Política de entrega de Microdatos
  • Bases de datos documentadas INEC
  • Bases de datos documentadas del SEN
    Página principal / Catálogo Central de Datos / REGENIGH / INEC-ENIGH-2018
REGENIGH

Encuesta Nacional de Ingresos y Gastos de los Hogares 2018, 2018

COSTA RICA, 2017 - 2019
Registro Encuesta Nacional de Ingresos Y Gastos
INSTITUTO NACIONAL DE ESTADÍSTICA Y CENSOS (INEC)
Última modificación December 18, 2019 Visitas a la página 72711 Metadatos DDI / XML JSON
  • Study description
  • Descargas
  • Descripción de los datos
  • Obtener microdatos
  • Identificación
  • Alcance
  • Cobertura
  • Productores y Patrocinadores
  • Muestreo
  • Recolección de Datos
  • Procesamiento de Datos
  • Política de Acceso
  • Descargo de responsabilidad y Derechos de autor
  • Contactos
  • Producción de Metadatos

Identificación

Número ID de la Encuesta
INEC-ENIGH-2018
Título
Encuesta Nacional de Ingresos y Gastos de los Hogares 2018, 2018
Subtítulo
2018
Título traducido
Survey Income and expenditure of households
País
Nombre Código de país
COSTA RICA CRI
Resumen / Abstract
La Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH 2018) genera información de gran utilidad para la definición y evaluación de políticas en el campo económico y social y para la investigación, constituyendo una fuente de información fundamental para instituciones públicas, organismos no gubernamentales, universidades e investigadores.

La ENIGH 2018 es un proyecto que busca generar estadísticas sobre el monto, la distribución y la estructura del ingreso y gasto de los hogares, de manera que los objetivos de la encuesta consisten en:

Objetivo general

- Proporcionar información oportuna y detallada sobre la procedencia y estructura de los ingresos y los patrones de gasto de los hogares, así como otros aspectos relacionados a la medición del bienestar.

Objetivos específicos

- Determinar las fuentes de ingreso de los hogares, para el conocimiento de la conformación y distribución.
- Conocer la estructura del gasto de los hogares, para el análisis de consumo y satisfacción de sus necesidades básicas.
- Proveer información requerida por el Sistema de Cuentas Nacionales para la composición de la cuenta de hogares del Producto Interno Bruto.
- Obtener información requerida para la actualización de los coeficientes de ponderación del gasto en bienes y servicios que conforman la canasta de consumo del Índice de Precios al Consumidor.
- Proporcionar información que permita la actualización de la Canasta Básica de Alimentos y su costo.

También hay otros múltiples propósitos de estudio sobre los hogares que se pueden añadir, tal como la generación de indicadores sobre distribución del ingreso y niveles de vida, así como otras estadísticas para la estimación del aporte de los hogares a la generación del PIB.

Para lograr los objetivos mencionados, la encuesta requiere de amplia cobertura geográfica y temática, así como de la permanencia de 12 meses en campo. Esto hace que se considere una investigación compleja y costosa. El trabajo se desarrolló con 13 grupos de campo, visitando todas las regiones del país con 7 días de entrevista por hogar.

La encuesta sumó a la captura de información, la recopilación de facturas de compra grande en alimentos, en algunos supermercados identificados, permitiendo la reducción del tiempo en entrevista y el correcto registro de la información. Además se empleó la digitación de los datos en campo.

El procesamiento de la información inició 10 días después del inicio de la encuesta, un mes después de terminado el trabajo de campo finalizó la fase inicial de validación de microdatos; posteriormente se realizaron otros procesos que se extendieron hasta octubre de 2019.
Tipo de datos
Encuesta por muestreo (ssd)

Alcance

Palabras clave
Palabra clave
Vivienda
Hogar
Jefe de hogar
Condición de residencia
Sexo
Lugar de nacimiento
Etnia
Condición de aseguramiento
Estado conyugal
Condición de discapacidad
Educación
Becas
Servicio de cuido
Servicio de salud
Ayuda sociales
Condición de actividad
Personas ocupadas
Personas desempleadas
Personas Inactivas
Trabajo principal
Trabajo secundario
Asalariado
Patrono o cuenta propia
Agropecuario
Alquileres y renta de la propiedad
Transferencias
Ingresos
Ingresos ocasionales
Ingreso trabajos anteriores
Transferencia pagadas
Alimentos y bebidas
Bebidas alcohólicas y tabaco
Ropa y calzado
Alquiler de vivienda
Agua, electricidad o gas
Salud
Transporte
Comunicación
Recreación y Cultura
Alojamiento

Cobertura

Cobertura geográfica
La cobertura de la encuesta es a nivel Nacional. Se definieron 14 dominios de estudios los cuales son: Central Urbano, Central Rural, Chorotega Urbano, Chorotega Rural, Pacífico Central Urbano, Pacífico Central Rural, Brunca Urbano, Brunca Rural, Huetar Caribe Urbano, Huetar Caribe Rural, Huetar Norte Urbano y Huetar Norte Rural.
Unidad Geográfica
COBERTURA GEOGRÁFICA: Nacional total
DESAGREGACIÓN GEOGRÁFICA: Central, Chorotega, Pacífico Central, Brunca, Huetar Caribe y Huetar Norte
Unidad de Análisis
Para la Encuesta Nacional de Ingresos y Gastos de los Hogares 2018, la unidad de análisis la define el hogar particular residente en el país.

Un hogar particular es la persona sola o grupo de personas, residentes habituales en una vivienda individual, con vínculos familiares o sin ellos, que usan un fondo común para atender los gastos de alimentación y vivienda. Aquellas viviendas donde residen 6 o menos miembros no familiares se les dará el mismo tratamiento que un hogar particular. En el caso de una cantidad mayor a 6 miembros se considera que el hogar es colectivo y queda fuera del estudio.
Universo
El conjunto de todas las viviendas individuales y sus ocupantes, residentes permanentes en esas viviendas, dentro del territorio nacional en el período de recolección de la información. Se excluye del estudio a la población residente en las viviendas colectivas (hoteles, hospitales, asilos, cárceles, conventos, hogares de más de seis personas que no tienen vínculos familiares, etc.).

Productores y Patrocinadores

Investigadores primarios
Nombre
INSTITUTO NACIONAL DE ESTADÍSTICA Y CENSOS (INEC)
Productores
Nombre Afiliación Rol
Odette Navarro Solano INEC Coordinadora
Annia Chaves Gómez INEC Coordinadora
Luis Armando Aguilar Madrigal INEC Equipo técnico
Karla Daniela Porras Alfaro INEC Equipo técnico
Douglas Delgado Espinoza INEC Equipo técnico
Luis Alejandro Pereira Araya INEC Equipo técnico
Oscar Alexis Quesada Montiel INEC Equipo técnico
Mario Chacón Carvajal INEC Equipo técnico
Gerardo Fonseca Bolaños INEC Cartografía
Adriana Fernández Gamboa INEC Producción Gráfica
Danilo Jiménez Mena INEC Informática
Cristian Zamora Castro INEC Informática
Mario Alberto Granados García INEC Informática
Organización financiadora / Patrocinador
Nombre Abreviatura / Sigla Rol
Banco Central de Costa Rica BCCR Financiamiento propio
Ministerio de Hacienda MH Presupuesto Nacional
Otras identificaciones / Reconocimientos
Nombre Afiliación Rol
Floribel Méndez Fonseca INEC Gerente

Muestreo

Procedimiento de muestreo
DISEÑO MUESTRAL

El diseño muestral corresponde a un diseño probabilístico de áreas, estratificado, bietápico y replicado. De áreas, porque las unidades primarias de muestreo son áreas geográficas deimitadas llamadas UPM y las probabilidades de selección de las viviendas están asociadas a estas UPM, estratificado ya que para la distribución y selección de la muestra se definieron los estratos de interés antes señalados, bietápico porque en una primera etapa se seleccionaron las UPM, y en una segunda etapa se seleccionan viviendas o Unidades Secundarias de Muestreo (USM) dentro de las UPM seleccionadas en la primera etapa y replicado porque la muestra se seleccionó en cuatro réplicas de forma independiente, una para cada trimestre de encuesta. Esto permitió tener estimaciones preliminares por trimestre o réplica, pero con un margen de error mayor al de la encuesta total.

Con este diseño muestral se puede brindar flexibilidad en las necesidades de desagregación que requieren los usuarios y hasta donde los niveles de precisión lo permitan.

MARCO MUESTRAL

El marco muestral de viviendas (MMV-2011) utilizado para el diseño y selección de la muestra de la ENIGH 2018, se construyó a partir de la cartografía generada y la información obtenida del X Censo Nacional de Población y VI de Vivienda del 2011.

El MMV-2011 es un marco de áreas donde las unidades de marco UPM son superficies geográficas con límites claramente definidos, en las cuales los hogares se encuentran asociados a las respectivas viviendas individuales ubicadas dentro de estas UPM. En promedio, las UPM contienen 150 viviendas en las zonas urbanas y 100 viviendas en las zonas rurales.

Este marco de muestreo incluye la información necesaria para el diseño estadístico de las encuestas como variables sociodemográficas, para la estratificación e identificación de subpoblaciones de interés, además de variables geográficas para la desagregación y cobertura geográfica. En total lo conforman 10.461 UPM, clasificadas como urbanas un 64,5% y como rurales 35,5%, y 1.360.055 viviendas, 70,6% en zonas urbanas y 29,4% en zonas rurales.

DOMINIO DE ESTUDIO

Los dominios de estudio son subpoblaciones generalmente relacionadas con áreas geográficas para las cuales se requiere estimaciones con una precisión conocida. En los principales indicadores de la ENIGH 2018, el diseño muestral considera como dominios de estudio el nivel nacional, la zona Urbano-Rural y las seis regiones de planificación: Central, Chorotega, Pacífico Central, Brunca, Huetar Caribe y Huetar Norte.

De acuerdo con el diseño muestral, se podrán producir resultados para otras subpoblaciones de interés, sin embargo, su nivel de desagregación dependerá fundamentalmente de la precisión con que se estime los indicadores y del tamaño de muestra resultante en cada caso.

TAMAÑO DE LA MUESTRA

Para determinar el tamaño de muestra de la ENIGH 2018, se partió del tamaño efectivo de la muestra de viviendas obtenidas en la ENIGH 2013 y se evaluó los niveles de precisión que dio esta encuesta para las principales fuentes de ingreso, para el gasto promedio de los hogares y para los grupos de clasificación del gasto según la Clasificación de consumo individual por finalidades (CCIF). Partiendo de ese mismo tamaño de muestra, se hicieron ajustes para mejorar los niveles de precisión y así garantizar errores relativos menores al 15% para los dominios de estudio de la encuesta. Además, se consideró un ajuste del 30% por pérdida de muestra y se llegó a un tamaño de muestra de 9 828 viviendas.


DISTRIBUCIÓN DE LA MUESTRA

La selección de la muestra se efectuó en dos etapas: en la primera etapa se seleccionaron UPM con probabilidad proporcional al tamaño dentro de cada estrato y en una segunda etapa dentro de cada UPM se seleccionaron viviendas o USM con probabilidades iguales de selección, mediante un muestreo sistemático con arranque aleatorio.

La muestra de 9 828 viviendas fue distribuida por todo el país en 468 conglomerados de viviendas llamadas Unidades Primarias de Muestreo (UPM), considerando una muestra de 21 viviendas, su distribución fue durante casi 13 meses según las siguientes especificaciones:


DISTRIBUCIÓN DE UPM POR REGIÓN DE PLANIFICACIÓN

Central 162
Chorotega 63
Pacífico Central 54
Brunca 63
Huetar Caribe 63
Huetar Norte 63

DISTRIBUCIÓN DE UPM POR ZONA

Urbana 324
Rural 144
Desviaciones del diseño muestral
Las desviaciones que puedan existir entre la muestra y el resultado final del operativo de campo se deben básicamente a dos factores, problemas de marco y la no respuesta. Los problemas de marco se debe a que muchas viviendas han cambiado su uso o actividad, fueron demolidas o sufrieron daños por fenómenos naturales.

PORCENTAJE DE PROBLEMAS DE MARCO MUESTRAL

Costa Rica 11,7

ZONA

Urbano 10,6
Rural 14,0

REGION

Central
-Urbano 9,2
Bajo 9,4
Medio 7,9
Alto 10,3
-Rural 7,1

Chorotega
-Urbano 11,0
-Rural 13,2
Pacífico Central
-Urbano 10,1
-Rural 13,5
Brunca
-Urbano 12,0
-Rural 16,2
Huetar Caribe
-Urbano 14,2
-Rural 15,3
Huetar Norte
-Urbano 13,4
-Rural 16,0
Tasa de respuesta
Los resultados generales del operativo de campo dieron una tasa de respuesta de 80,4% a nivel nacional. Este porcentaje se obtiene dividiendo el total de hogares con entrevistas completas entre todos los hogares en los cuales se debió realizar una entrevista completa (rehusaron, difícil acceso, ausentes, limitaciones de idioma o enfermedad e informante no localizado).

La región con una mejor tasa de respuesta fue la Huetar Caribe Rural con 94,9% y la tasa más baja fue la región Central Urbana con un 64,0%.

TASA DE RESPUESTA SEGÚN ZONA Y REGION DE PLANIFICACION (%)

COSTA RICA 80,4

ZONA

Urbano 75,7
Rural 91,5

REGION

Central
-Urbano 64,0
-Rural 86,0

Chorotega
-Urbano 86,5
-Rural 90,4

Pacífico Central
-Urbano 86,2
-Rural 90,6

Brunca
-Urbano 85,3
-Rural 91,8

Huetar Caribe
-Urbano 84,7
-Rural 94,9

Huetar Norte
-Urbano 84,5
-Rural 93,8
Ponderación
FACTOR BÁSICO DE EXPANSIÓN (FBE)

El factor de expansión es un ponderador que se aplica a cada unidad de estudio en la muestra para obtener una estimación poblacional; se interpreta como la cantidad de unidades en la población que representa cada unidad en la muestra, ya sea vivienda, hogar o persona.

El factor básico de expansión se calcula como el inverso de las probabilidades de selección de la primera y segunda etapa de muestreo a nivel de estrato de selección, de esta forma, todas las UPM dentro de cada estrato tienen inicialmente el mismo factor de expansión. Sin embargo, la desactualización del marco de muestreo y los problemas de no respuesta, afectan las probabilidades iniciales de selección de cada vivienda.

Para corregir esas diferencias en las probabilidades de selección, normalmente se consideran tres tipos de ajuste a los factores de expansión: por no respuesta, por crecimiento y proyecciones de población.

AJUSTE POR NO RESPUESTA

Las viviendas seleccionadas que no responden alteran las probabilidades iniciales de selección, para corregir esto se efectúa un ajuste por no respuesta. Este ajuste consiste en multiplicar el factor de expansión por la razón del número total de viviendas seleccionadas candidatas a entrevista entre el número de estas viviendas que efectivamente respondieron la entrevista. Este ajuste se hace en forma individual según el resultado de entrevista en cada UPM.

AJUSTE POR CRECIMIENTO

Debido al dinamismo de la población, es frecuente encontrar nuevas viviendas en las UPM seleccionadas que afectan las probabilidades iniciales de selección de las viviendas dentro de cada UPM. En este sentido, se hace un ajuste al factor de expansión según el crecimiento observado en campo, que consiste en multiplicar el factor básico de expansión por la razón del número actualizado de viviendas entre el número de viviendas listadas cuando se seleccionó la muestra. Este ajuste se realiza individualmente para cada UPM según lo observado y reportado en trabajo de campo.

AJUSTE DE POBLACIÓN

Aun aplicando los ajustes anteriores, es común que las estimaciones de población obtenidas en la encuesta presenten problemas de subestimación. Esto se debe a que el marco se desactualiza producto de la dinámica demográfica y distribución espacial de la población (i.e. en la estructura urbana-rural y regional), siendo más evidente conforme se aleje la fecha de la encuesta de la fecha de construcción del marco de muestreo. El ajuste por crecimiento corrige parcialmente los problemas de desactualización del marco, pero solo en las UPM de la muestra, para corregir el problema de subestimación de todo el marco de muestreo se aplica otro ajuste que consiste en multiplicar el factor de expansión ajustado por crecimiento y no respuesta, por la razón de la población proyectada en el mes de la encuesta (tomado de INEC. Estimaciones y Proyecciones de población distritales por sexo y grupos de edades. 2000-2025. San José, Costa Rica), entre la población estimada según la encuesta. Este ajuste se hace a nivel de región de planificación.


FACTOR DE EXPANSIÓN FINAL

El factor de expansión final se obtiene como el producto del factor básico de expansión multiplicado por los tres ajustes anteriores. El factor final de expansión es el mismo para todas las viviendas dentro de una misma UPM.

Para obtener las estimaciones de las diferentes características que investiga la encuesta, se multiplica el valor de la variable o característica de interés suministrado por cada persona u hogar en la muestra, por el correspondiente factor de expansión de la UPM y el resultado se agrega para cada ámbito geográfico: zona, región y nivel nacional.

Recolección de Datos

Fechas de recolección de datos
Inicio Fin Ciclo / Ronda
2017-11-08 2017-11-28 Trabajo de campo de la Encuesta Piloto
2017-11-29 2018-02-05 Planificación del trabajo de campo de la Encuesta Nacional
2018-01-08 2018-01-19 Capacitación de la Encuesta Nacional
2018-02-12 2019-03-06 Trabajo de campo de la Encuesta Nacional
2018-02-05 2019-04-30 Procesamiento de la información de la Encuesta Nacional
2019-05-01 2019-09-13 Depuración final de la base de datos
2019-09-13 2019-11-29 Documentos de resultados
Modo de recolección de datos
Face-to-face [f2f]
Supervisión
Durante las 36 decenas de la ENIGH se trabajó con 15 supervisores y supervisoras. Entre las principales funciones que tenía a cargo se encuentran: localizar las viviendas seleccionadas en la UPM, supervisar entrevistas, revisar formularios, controles y balances.

LOCALIZACIÓN DE LAS VIVIENDAS

El supervisor o supervisora recorría toda la UPM con el objetivo de ubicar las viviendas y verificar si estaban las indicadas originalmente en el mapa, ya que la población no es estática en el tiempo y podían haber problemas de marco (viviendas demolidas, desocupadas, abandonadas, convertidas en establecimiento comercial, entre otras).

Posteriormente el supervisor le indicaba a cada entrevistador (a), cuál vivienda debía entrevistar, cerciorándose en la medida de lo posible que la entrevista ha sido aceptada por parte del hogar y que efectivamente se dará inicio a la entrevista.

SUPERVISAR ENTREVISTAS

La persona supervisora debía cerciorarse de que el persona entrevistadora realizara la entrevista de forma correcta, para esto podía acompañar en algunas de las entrevistas o cuando se realizaban los seguimientos del formulario 2.
También debía acompañar en casos en los que se encontrara incongruencia en los datos posterior a la revisión del formulario.


REVISIÓN DE FORMULARIOS

Al realizarse parte de la entrevista en tableta, el supervisor o supervisora debía revisar las entrevistas desde la computadora, después de que se le transferieran los datos. Se revisaban aspectos como: congruencia en los datos, categorías correctas, preguntas con su respectiva contraparte de gasto o ingreso, entre otras. Por otra parte, la revisión de la existencia de las observaciones pertinentes fue lo más estricta posible, con el fin de que los datos quedaran claros para el personal encargado del procesamiento.

REVISIÓN DE LA DIGITACIÓN

La digitación y codificación fue realizada por el personal entrevistador en campo, en los tiempos en que no se tenían programadas visitas a los hogares para completar la entrevista.

REVISIÓN DE LOS CONTROLES Y BALANCES

El supervisor(a) junto a cada entrevistador debe ir analizando el balance financiero preliminar del hogar para ir descartando inconsistencias en ingresos o gastos y así aclarar, en la medida de lo posible, los datos en las próximas visitas al hogar.

SUPERVISIÓN GENERAL DE CAMPO

Las principales funciones realizadas por los encargados de la supervisión general de campo consistieron en: la verificación de viviendas seleccionadas y reconocimiento de la UPM, revisión de los formularios, elaborar y dar seguimiento a los controles diarios, controles de visitas a los viviendas, control de horas extras. Además, tenían la función de evaluar al personal de campo y organizar las giras de cada decena.
Cuestionarios
DISEÑO DE FORMULARIOS

Para el diseño de los formularios se tomó como base los formularios de la ENIGH 2013, modificando algunas preguntas mediante un proceso participativo, donde el equipo de trabajo de la encuesta (coordinadora y equipo técnico) contó con la participación de personal de la Encuesta de Hogares, Encuesta Continua de Empleo y la Unidad de Índice de Precios al Consumidor.

Se realizaron reuniones con representantes de instituciones públicas e instituciones sin fines de lucro, quienes aportaron información para mejorar la captación de las transferencias sociales en dinero o especie que reciben los hogares de este tipo de institución.

El grupo técnico tuvo reuniones con las representantes de cadenas de supermercados para solicitar la colaboración de estas empresas y garantizar una mejor captación del gasto en alimentos.

Se diseñaron cuatro instrumentos de recolección de información del hogar:

- Formulario 1: Características Sociodemográficas y Socioeconómicas.

Busca recopilar las características generales de la vivienda, el hogar y miembros del hogar. La condición de actividad y tipo de ingresos que tienen los miembros del hogar.

- Formulario 2.2: Gastos diarios del Hogar

En el se recopila información durante 7 días sobre los gastos diarios del hogar, los gastos personales semanales del informante general y de los menores de 12 años.

- Formulario 2.1: Hábitos de consumo, ahorro y pobreza subjetiva

Este recopila información sobre los hábitos de compra y consumo del hogar, la capacidad de ahorro y si el hogar considera que es pobre.

- Formulario 3: Gastos personales semanales y de otros periodos.

Comprende los gastos personales semanales y de otros periodos de todos los miembros del hogar mayores a 12 años.

- Formulario 4: Gastos de Otros Periodos.

Recopila los gastos en bienes y servicios que ha realizado el hogar durante diferentes periodos de referencia, distintos a la semana de la entrevista. Esto se debe a que muchos de los gastos que realiza el hogar tienden a ser poco frecuentes en periodos cortos, y a veces, aunque son esporádicos son de difícil recordatorio. Se registran gastos de periodo mensual, gastos de recordatorio de los últimos tres meses, últimos seis meses y últimos doce meses.


TIPO DE DISEÑO: Hogares.

FUNCIONALIDAD: Los cuatro formularios se diseñaron con una funcionalidad semiestructurados, contienen respuestas precodificas y abiertas.
Recolectores de datos/Encuestadores
Nombre Abreviatura / Sigla Afiliación
Instituto Nacional de Estadística y Censos INEC Ente Autónomo

Procesamiento de Datos

Edición de datos
PROCESAMIENTO Y VALIDACIÓN DE DATOS

El procesamiento de los datos se realiza en varias etapas, incluye la revisión de microdatos a nivel de hogar y posteriormente la revisión de datos agregados, en bases de datos. La revisión de microdatos incluye la codificación de las preguntas abiertas como sector institucional, rama de actividad económica, ocupación, educación universitaria y bienes y servicios adquiridos, y la fase de validación. Estas etapas inician en campo, por parte del personal entrevistador, quienes tienen la tarea de realizar la codificación y la limpieza de inconsistencias de nivel básico; además realizan un análisis de consistencia agregada por hogar denominado balance financiero, en el que se contrastan los ingresos y gastos del hogar transformados en valores mensuales.

En otro proceso, de oficina, se revisan los archivos y formularios en papel recibidos del trabajo de campo, se hace una verificación de códigos y una validación de la información general del hogar, se limpian inconsistencias que provienen de un plan más amplio y se completa información faltante por medio de llamada telefónica a los hogares, registros administrativos u otras fuentes como páginas institucionales, sitios de supermercados u otros comercios, entre otras.
Cuando la información está agregada en bases de datos con submuestras completas, se revisan valores atípicos especialmente en alimentos, tanto de gasto como de cantidades. Estos valores se corrigen con información del mismo hogar hasta donde sea posible o con ayuda de otros registros. Finalmente, una vez completada la muestra total se realizan, sobre la base de datos, imputaciones de datos ignorados o rechazados.

La etapa de procesamiento de datos se realiza simultáneamente a la recolección, con un desfase de una a tres decenas (15 días). Inició el 6 de febrero de 2018 con la capacitación de personal de validación y el 15 de abril de 2019 terminaron las fases iniciales de limpieza, posteriormente se extendió hasta el mes de agosto de 2019 con imputaciones.

VALIDACION DE DATOS
La validación de micro datos se realiza en varias etapas, que hemos llamado validación I, validación II y análisis de consistencia agregada.

VALIDACION I
En esta primer fase, se realizan varias funciones:
· Verificación de códigos: La información que se recibe de campo debe venir codificada, sin embargo, en validación I se tiene la directriz de revisar cada una de las secciones en las que deben existir una asignación de códigos, tal como lo son: carrera en educación superior, sector institucional, rama de actividad y ocupación del empleo principal y secundario, y los códigos de bienes y servicios que se recogen en los formularios 2, 3 y 4.
· Revisión de inconsistencias: estas son patrones programados dentro de la información para detectar incongruencias o faltante de información dentro de lo que se recibe de campo, con el fin de verificar con el hogar, ya sea para cambiarlo, aceptarlo o bien eliminarlo.
En total se contaba con 1212 inconsistencias programadas, cada persona validadora, empleando el sistema CSPro, corre las inconsistencias y se dedica a corregir los errores en los formularios de cada hogar.
Cada validador tiene la responsabilidad de depurar la mayor cantidad de inconsistencias posible, empleando toda la información a la que tiene acceso, además, del acompañamiento del supervisor de validación I. Para lo anterior cada validador tiene a disposición lo siguiente: llamadas externas por medio de diademas, para llamar a la persona entrevistadora o al hogar, equipo de cómputo con acceso a internet; materiales de apoyo como diccionarios de códigos de rama de actividad, ocupación, códigos de bienes y servicios, y de carrera profesional, archivo con información a nivel municipal para todo el país, plantillas de cálculos para verificar ingresos según su fuente, manuales de presentaciones de alimentos, los cuestionarios en formato PDF e instructivos para revisión.
· Revisión del balance financiero del hogar: este es un informe resumen sobre el estado financiero de cada hogar que contrasta los ingresos y gastos de cada hogar a partir de la información suministrada por estos. El validador debe entender el comportamiento económico de cada hogar que revisa y examinar minuciosamente los casos en que el balance sea de ±20% (déficit o superávit), a partir de lo cual debe corregir o describir la situación particular de cada caso a modo de justificación de la información proveniente de campo.


VALIDACION II
Esta etapa consiste en la incorporación de la información de facturas de compra en supermercados dentro de los gastos diarios del hogar. Para esto se creó una aplicación en los sistemas de procesamiento en la que se ingresa la información de la factura y esta es enviada por medio de correo electrónico a los supermercados cooperantes. Cuando se recibe el archivo de regreso con el desglose de los artículos adquiridos, se realizan varios chequeos de consistencia, luego se codificaba “automáticamente” si el articulo ya estaba ingresado en el diccionario de códigos de barra, de lo contrario se codifica manualmente.
Una vez incorporada la información de las facturas se realiza un chequeo de inconsistencias de información para los alimentos y nuevamente se revisa el balance general financiero del hogar.

ANALISIS DE VALORES EXTREMOS Y CONSISTENCIA AGREGADA

Con información agregada de submuestras de trabajo se iba aplicando un análisis de valores extremos para una gran parte de las variables numéricas (gasto e ingreso) con el fin de limpiar la información que quedaría como base de datos de procesamiento. Se consideraron como atípicos mínimos los valores menores a 3 veces el rango intercuartil menos al valor del primer cuartil, o extremos superiores si es 3 veces el rango intercuantil mayor al tercer cuartil.

Cada variable tiene un tratamiento, dependiendo de su naturaleza; en algunos casos se revisaba información de otras variables para corroborar la pertinencia de un valor. Para el caso de variables categóricas se realizaban frecuencias de cada una o cuadros cruzados de variables relacionadas, con esto se detectaban inconsistencias o valores perdidos. Algunas de estas inconsistencias se debían a omisión de pases o valores fuera de rango que no fueron advertidos por las inconsistencias a nivel de micro datos o fueron pasados por alto.

Conforme se avanzaba en el procesamiento de datos la nueva información era agregada, de manera que la revisión se hacía sobre una base acumulativa.

En el caso de alimentos se aplicó una verificación de precio por miligramo, para detectar posibles errores en cantidades o precios; como base se utilizó la información obtenida con la ENIGH 2013 y se fue alimentando con los datos que ingresaban cada decena de trabajo.

Una vez realizados los cambios requeridos a cada una de las bases y posterior a cada replica (un trimestre) se realizaron rutinas de estadísticas descriptivas sobre vivienda, población, empleo, entre otras, comparables con la información de otras encuestas como la Encuesta Nacional de Hogares o la Encuesta Continua de Empleo, además del análisis de estructuras de gasto e ingreso y la relación entre ambas, comparables con la información obtenida en la ENIGH anterior.
Otros procesamientos
OTROS RELACIONADOS AL PROCESAMIENTO

Una vez finalizado el proceso de validación y consistencia agregada para la muestra completa recolectada, se realizan otros procedimientos para el tratamiento de valores ignorados, estimaciones agregadas de gasto, contraste de resultados y modelaje de datos para el valor imputado de la vivienda propia y separación de proporciones de gasto en seguros y juegos de azar por tipo de gasto.

TRATAMIENTO VALORES CON AUSENCIA DE RESPUESTA (IMPUTACIONES)
Se consideraron 4 casos de ausencia de respuesta, para los que se aplicaron tratamientos distintos.

· Hogares con respuesta parcial: se identificaron los casos con ausencia de respuesta en formularios de gasto pero con información suficiente sobre características de las personas, vivienda e ingresos. Para estos se aplicaron imputaciones por el método del vecino más cercano con un enfoque de regresión, el cual combina el enfoque de modelos lineales con la imputación de un valor real del conjunto de datos. Por este método se imputaron casos de gasto completo del hogar o solo gasto en alimentos y también de ingresos por persona, dependiendo de las secciones con ausencia de respuesta en uno o más de los formularios.

· Valores con código ignorado: estos son casos en que el valor específico de un determinado ingreso o el gasto en el bien o servicio era desconocido por el informante. La mayoría de estos casos se resolvieron con consultas telefónicas posteriores, revisión de páginas web comerciales o que tenían valores de referencia relacionados con el lugar y momento de compra del artículo, o bien consultas a empresas o registros administrativos sobre salarios. Para el resto de los casos, específicamente de ingresos, se utilizó la imputación por el valor de la mediana de casos con las mismas características en variables de empleo, o con igual condición de actividad y otras variables demográficas, dependiendo del tipo de ingreso registrado como “ignorado”.

· Registro de gastos agregados, sin detalle: estos son casos donde se registraban “compra general de supermercado”, “compra en feria del agricultor (frutas y verduras)”, “compra de carnes” y “compra de comidas preparadas”. Para estos casos se habían utilizado códigos específicos y la desagregación de la compra fue imputada mediante el vecino más cercano considerando para esto 80 clústeres formados con variables de tamaño del hogar, quintil de ingreso y zona de residencia, según el caso válido con el valor más próximo al gasto “estimado” reportado por el informante según cada tipo de "gasto agregado".

· Ausencia de información por autoconsumo o remuneración en especie: estos se refieren a los casos donde se reportaba como fuente de ingreso remuneración en especie o autoconsumo de alimentos u otros artículos de producción propia, especialmente en el caso de los trabajadores por cuenta propia, sin que se registraran gastos (consumo) relacionados a esa producción o recibido en el lugar de trabajo en alguno de los cuestionarios de gasto. Para este tipo se imputó un valor gasto equivalente al ingreso reportado, y según el artículo que describió como producción propia, autosuministro o salario en especie (en este caso solo alimentos); para determinar los artículos específicos a imputar se utilizó información de casos similares en ocupación, rama de actividad y/o posición en el empleo.

Política de Acceso

Personal autorizado para el acceso a datos
Nombre Afiliación Correo electrónico URL
Instituto Nacional de Estadística y Censos Ente Autónomo informacion@inec.go.cr http://www.inec.go.cr/
Confidencialidad
Según artículo 10 de la Ley No.9694 del Sistema Estadístico Nacional de Costa Rica: Artículo 10: Las instituciones que conforman el SEN recopilarán, manejarán y divulgarán datos con fines estadísticos, conforme a los principios de confidencialidad estadística, transparencia, especialidad, proporcionalidad y de independencia técnica, los cuales se especifican a continuación: a) Principio de confidencialidad estadística: garantiza la protección de los datos obtenidos por el SEN, para la elaboración de las estadísticas dentro del marco de esta ley. Se exceptúan de la aplicación de este principio, los datos de carácter público que son de libre acceso para todos los ciudadanos. b) Principio de transparencia: derecho de obtener información plena sobre la protección dispensada a los datos brindados y la finalidad con que se recaban. c) Principio de especialidad: impone tanto al INEC y a las unidades administrativas a cargo de los procesos estadísticos del SEN, el deber que los datos recogidos para elaborar estadísticas se destinen a los fines que justificaron la necesidad de obtenerlos. d) Principio de proporcionalidad: relativo al criterio de correspondencia que deberá existir entre la cantidad y el contenido de la información que se solicita, y los resultados o fines que se pretenden obtener al tratarla. e) Principio de independencia técnica: autoridad exclusiva que tendrán tanto el INEC como las unidades administrativas a cargo de los procesos estadísticos del SEN, para decidir sobre los métodos estadísticos y de divulgación de los resultados de las estadísticas oficiales que les hayan sido asignadas.
Condiciones de acceso
A. Unidad responsable de la atención de solicitudes de información

El Área de Sistemas de Información y Divulgación Estadística (ASIDE), será la responsable de atender las solicitudes de los usuarios y de lo que conlleve la aplicación de la Política para la divulgación de las estadísticas y la entrega de microdatos del Instituto Nacional de Estadísticas y Censos.

B. Entrega de microdatos o de archivos de microdatos

Según la Política para la divulgación de las estadísticas y la entrega de microdatos del Instituto Nacional de Estadísticas y Censos, en la entrega de microdatos o archivos de microdatos se cuenta con cuatro tipos de archivos y formas de acceder a ellos:

1. Archivos de Uso Público (AUP): Los AUP son archivos de microdatos, los cuales se diseminan para el uso público en general, fuera del INEC. Estos archivos serán anonimizados y liberados a través de la página electrónica del INEC o en un medio digital. Esto se ejecutará una vez cumplidos los requisitos mínimos de registro de información relativa al usuario y a los fines de su utilización. El término anonimizado implica, además de haber retirado los nombres y direcciones, ejecutar otras acciones (por ejemplo, la agregación de los detalles geográficos), para reducir al mínimo el riesgo de identificar a los individuos. Los procedimientos seguidos para asegurar que los datos sean anónimos, serán divulgados en la página Web del INEC junto con los metadatos de cada archivo de microdatos.

2. Archivos con licencia: Los archivos con licencia también son anonimizados, pero no han sido tratados para impedir la posible identificación de forma indirecta, es decir, a partir de las características de las unidades de estudio. Su uso se restringirá a los investigadores de la academia y a usuarios autorizados de instituciones. Para ello, deberán firmar previamente un compromiso o contrato de confidencialidad. Los contratos de licencia se suscribirán únicamente con los usuarios de buena fe cuando existe una institución reconocida adecuada, pública o privada, que los respalda. Los usuarios deberán estar en posibilidad de lo siguiente:
i. Comprobar la necesidad de acceder a los datos a fin de lograr un propósito determinado estadístico o de investigación.
ii. Cumplir con las condiciones que estipula el Contrato formal de Acceso a Microdatos, el cual define el reglamento de esta política.
iii. Aquellos interesados en acceder a los datos conforme a una licencia deben llenar la fórmula de solicitud, según se especifica en la reglamentación
correspondiente.
iv. En el reglamento a esta política se deberá definir la composición y funcionamiento de un Comité de Divulgación del INEC, el cual deberá evaluar las solicitudes
de este tipo de archivo de microdatos. Cuando se toma la decisión de otorgar acceso a los datos, los usuarios los recibirán a través de un servidor ftp seguro.

3. Archivos no accesibles: Cuando los datos son particularmente confidenciales, o cuando se solicitan mayores detalles a los observados con anterioridad, solo es posible acceder a ellos por medio del procesamiento que realicen funcionarios del INEC. Además, el INEC inspeccionará las salidas generadas en una revisión de divulgación total antes de ser entregada a la persona usuaria para asegurar que no existe información expuesta.

4. Acceso de microdatos para procesamiento en línea: El INEC procurará poner a disposición de los usuarios las bases de microdatos anónimas en la página Web de la Institución, o en las de otras instituciones con las que se establezcan acuerdos, para procesamiento línea; es decir, por medio de su gestión remota para generar tabulados.



C. Entrega de resultados estadísticos adelantados

La persona a cargo de la Gerencia del INEC, podrá autorizar la entrega anticipada de los resultados estadísticos, antes de la fecha de divulgación en los siguientes casos, en los cuales se advertirá que son datos embargados, que no pueden ser compartidos con terceros, ni utilizados, ni citados, antes de la fecha oficial de divulgación.



D. Acceso de los usuarios a las estadísticas oficiales, elaboradas por el INEC

El INEC publicará en su página web los resultados principales de sus operaciones estadísticas el mismo día en que se dan a conocer. Adicionalmente y con no más de un mes calendario posterior a la fecha oficial de publicación, los usuarios acceden a los cuadros de resultados del Plan de Tabulados, en formato Excel u otro que les permita trabajar con los datos. Cualquier persona con acceso a Internet podrá acceder, por este medio, sin costo alguno.


Para más información accesar:

http://www.inec.go.cr/A/MI/Acerca%20del%20INEC/Acerca%20del%20INEC/Sustento%20Jurídico/01.%20Política%20para%20la%20divulgación%20de%20las%20estadísticas%20y%20la%20entrega%20de%20microdatos.pdf


http://www.inec.go.cr/A/MI/Acerca%20del%20INEC/Acerca%20del%20INEC/Sustento%20Jurídico/02.%20Reg
Requisitos de Citas
En la mención de la información metodológica, publicación, presentación o divulgación de los resultados obtenidos a partir de la información aquí documentada, se debe citar la fuente primaria de la siguiente manera:

Fuente: Instituto Nacional de Estadística y Censos (INEC).

Descargo de responsabilidad y Derechos de autor

Descargo de responsabilidad
Toda la producción estadística del INEC se rige por el principio de confidencialidad y cualquier otra norma legal o constitucional que ampare la información solicitada, según se estipula en el artículo 17 de la Ley No.9694 del Sistema Estadístico Nacional de Costa Rica. Esta misma ley especifica en la sección IV, artículos 20 al 23, lo que significa la confidencialidad estadística y cómo funciona.

En el artículo 21 se establece que los datos personales que se obtengan directamente de los informantes o por medio de fuentes administrativas son objeto de protección y quedarán amparados por la confidencialidad estadística. Así mismo, establece que el INEC y cualquier institución del SEN podrán entregar información individualizada e innominada, siempre que no permita, de manera directa o indirecta, la identificación de las personas a que se refiere la información.


CLÁUSULA DE EXENCIÓN DE RESPONSABILIDAD

La Ley No. 9694 del Sistema de Estadística Nacional (SEN) establece en el artículo 10 que “las instituciones que conforman el SEN recopilarán, manejarán y divulgarán datos con fines estadísticos, conforme a los principios de confidencialidad estadística, transparencia, especialidad, proporcionalidad y de independencia técnica, los cuales se especifican a continuación:

a) Principio de confidencialidad estadística: garantiza la protección de los datos obtenidos por el SEN, para la elaboración de las estadísticas dentro del marco de esta ley. Se exceptúan de la aplicación de este principio, los datos de carácter público que son de libre acceso para todos los ciudadanos.”

La entrega de base de datos innominada está sustentada en el artículo 21, donde se indica que “serán objeto de protección y quedarán amparados por la confidencialidad estadística, los datos personales que obtengan las instituciones del SEN, tanto directamente de los informantes como por medio de fuentes administrativas para la elaboración de las estadísticas. El intercambio de los datos personales protegidos por la confidencialidad estadística solo será posible si se cumplen los siguientes requisitos, los cuales deberán ser comprobados por el órgano que los tenga en custodia:

a) Que las instituciones que solicitan y reciban los datos formen parte del SEN, antes de que los datos les sean cedidos.
b) Que el destino de los datos sea la elaboración de las estadísticas y los directorios de unidades estadísticas que dichas instituciones tengan encomendadas.
c) Que los destinatarios de la información dispongan de los medios necesarios para resguardar la confidencialidad estadística.

Las instituciones del SEN podrán entregar a los usuarios bases de datos con información individualizada e innominada y que no permita, de manera directa o indirecta, la identificación de las personas a que se refiere la información.
Derechos de Autor
INEC

Contactos

Contactos
Nombre Afiliación Correo electrónico URL
Centro de Información (Area Sistemas de Información y Divulgación Estadística, 2280-9280 ext 323 ) Área Sistemas de Información y Divulgación Estadística informacion@inec.go.cr , www.inec.go.cr www.inec.go.cr
Annia Chaves Gómez Área Estadísticas Continuas annia.chaves@inec.go.cr www.inec.go.cr
Odette Navarro Solano Área Estadísticas Continuas odette.navarro@inec.go.cr www.inec.go.cr

Producción de Metadatos

ID del documento DDI
CRI-INEC-ENIGH-2018
Productores
Nombre Abreviatura/Sigla Afiliación Rol
Karla Daniela Porras Alfaro KPA Documentadora PAD Equipo técnico
Fecha de Producción de Metadatos
2019-12-16
Programa Acelerado de Datos INEC / Costa Rica.

© Programa Acelerado de Datos INEC / Costa Rica., All Rights Reserved.