Edición de datos
Procesamiento de los datos: Codificación y Validación
La codificación es la primer etapa en la revisión de cuestionarios (archivos digitalizados) procedentes de la recolección de la información. En términos generales se da la codificación de variables previamente determinadas, como la actividad económica y la ocupación de las personas empleadas. Una vez que las preguntas de las entrevistas son codificadas, se realiza una validación de la información, es decir una limpieza de la información. Esta tarea se logra utilizando una serie de aplicaciones informáticas basadas en una tabla de inconsistencias que han sido diseñadas tanto para la captura de los datos como para la limpieza o validación de los mismos, estas aplicaciones se hicieron utilizando los lenguajes de programación C+, Visual Basic y SQL.
La codificación y validación se lleva a cabo en los meses de julio y agosto de 2019, se inició el 1 de julio y finalizó el 9 de agosto, contó con cuatro días de capacitación y se contó con 16 personas para esta labor de ellas, 6 personas para realizar la codificación de la información y 10 personas para la validación, en tanto dos funcionarios de oficina coordinaron dicho proceso.
A continuación, se detalla cada uno de estos procesos:
1. Procedimientos para realizar la Codificación Enaho 2019
El proceso de Codificación se conforma por cuatro fases, en los que se revisa y codifica, ciertas variables de los cuestionarios; mismas que se muestran a continuación:
A. Asignación de las cargas de trabajo:
Esta etapa contempla la asignación de cargas de trabajo al personal codificador. Se dispondrá de una persona encargada de realizar la distribución del trabajo.
Para llevar a cabo dicha labor se cuenta con un sistema informático (Administrador) que permite controlar y administrar, tanto los cuestionarios transferidos desde campo para el Proceso de Codificación, como el mantenimiento de los usuarios en dicho proceso, controlando contraseñas de acceso, nombres de usuario, roles y cantidad de trabajo realizado y generación de reportes.
B. Codificación de Empresas de Cable e Internet, Geográfico y Educación:
La codificación de las variables de empresas de cable e internet, geográficas, y de educación contempla las siguientes preguntas abiertas:
» Apartado hogar:V18n1, V19a de la Sección V. "Vivienda y Servicios"; preguntas A7b1, A7b2, A7d1, A7d2, A16a, A20b de la Sección A. "Características Sociodemográficas".
» Apartado individual: pregunta C7c1 de la Sección C. "Personas Ocupadas" .
C. Codificación de Sector Instituciones, Rama de Actividad y Ocupación:
Se trabajarán las siguientes preguntas:
» Apartado individual: preguntas C7a, C8 y C9a de la sección C. "Personas Ocupadas"; preguntas F1, F2 y F3a de la sección F. "Empleo Secundario", y preguntas G4a, G7, G8 y G9 de la sección G. "Personas Desempleadas".
D. Instrucciones generales para la codificación:
El proceso de codificación se realiza en 7 diferentes procedimientos y que se analizarán seguidamente; pero antes, es importante tener en cuenta:
a) En casos dudosos, no tome decisiones arbitrarias y consulte con la persona encargada del proceso; esto ayudará a utilizar siempre los mismos criterios.
b) Lea todas las observaciones que estén anotadas en las variables disponibles del cuestionario, así como las variables de apoyo a la codificación y que se adjuntan para facilitar el trabajo.
c) Apéguese estrictamente a los códigos existentes y no altere los manuales de códigos agregando nuevos valores según su criterio. Si una respuesta no puede ser "traducida" a un código existente, consulte con la persona encargada.
d) Siga las indicaciones que se le han especificado en este instructivo o cualquier otra que se hizo durante el proceso. No realice procedimientos que no le han sido autorizados o tareas que no le han sido asignadas.
e) Si las preguntas correspondientes de codificación están en blanco, no tiene que realizar ningún proceso de codificación, dado no se registró información en campo por la aplicación de los pases respectivos.
f) Las preguntas de codificación tienen asignado un "-1" de manera automática por el sistema, con el fin de visualizar que aún no se han codificado.
g) Lleve un orden estricto de su trabajo y de su escritorio. Además, haga las anotaciones que considere necesarias, para aquellos cuestionarios que marque como "pendientes" (en espera de ser resuelto por el personal encargado).
1.1. Codificación Geográfico y Educación
Este procedimiento consiste en codificar las características geográficas y de educación, para determinadas preguntas y para cada uno de los miembros del hogar.
1.1.1. Codificación de Geográfico
Esta es otra de las variables que, en tableta, incorpora un buscador de códigos, por lo que la mayoría de los casos van a venir completamente codificados. El codificador será responsable de codificar los cantones y países que no se hayan podido captar en campo.
1.1.2. Codificación de Educación
Por medio de estas preguntas se indaga por el nombre de la carrera, especialidad o curso de los estudiantes que además de la educación general básica y diversificada, están o estuvieron asistiendo a algún centro educativo de enseñanza formal o no formal que certifica mediante la entrega de un título.
1.2 Codificación de Sector Institucional, Rama de Actividad y Ocupación.
Este procedimiento consiste en codificar las preguntas C7a, F1, G7 (Sector Institucional), C8, F2, G8 (Rama de Actividad Económica) y C9a, F3a, G4a, G9 (Ocupación); además de la revisión de las preguntas de apoyo que se utilizan para analizar cada caso. En el diagrama 4, estas etapas corresponden a los pasos 4, 5, 6 y 7 respectivamente. Específicamente estas preguntas se agrupan por sección de la siguiente manera:
Preguntas C7a, C8 y C9a de la Sección C. "Paso 4: Empleo Principal".
Preguntas F1, F2 y F3a de la Sección F. "Paso 5: Empleo Secundario".
Preguntas G4a, G7, G8 y G9 de la Sección G. "Paso 6: Personas Desempleadas"
1.2.1. Codificación de Sector
Preguntas: C7a, F1, G7. "Nombre del establecimiento del empleo principal, secundario y personas desempleadas"
El objetivo de estas preguntas es estimar el empleo público y privado. Para codificar estas preguntas el codificador utilizará el Clasificador de Sector Institucional, el cual es un catálogo propio del INEC que permite identificar de manera exhaustiva la pertenencia a uno u otro sector.
Tome en cuenta las siguientes pautas para codificar estas preguntas:
» Codifique la descripción anotada en las preguntas C7a, F1 o G7 en la casilla ubicada en la esquina superior derecha, en la que de forma automática el sistema asigna un "-1" cuando no se ha codificado la pregunta.
Analice detalladamente las preguntas relacionadas: C8 / F2 / G8 (Rama de actividad), C9a / F3a / G9(Grupo ocupacional) y C12 / F7/ G10 (Posición en el empleo); para asignar el código idóneo, ya que hay códigos de sector institucional que no son congruentes con la rama de actividad o la posición en el empleo.
1.2.2. Codificación de Rama
Preguntas C8, F2, G8. "Rama de actividad del empleo principal, secundario y personas desempleadas"
El objetivo de estas preguntas es conocer la actividad económica que realiza el establecimiento donde trabaja o trabajó la persona entrevistada. Para tal efecto, según el Sistema de Cuentas Nacionales el establecimiento se define como una empresa o parte de una empresa ubicada en un único sitio y en la que solo se realiza una actividad productiva (no auxiliar) o en la que la actividad productiva principal genera la mayor parte del valor añadido. Para llevar a cabo la codificación de estas preguntas se utilizará el Manual de Clasificación de Actividades Económicas (CIIU 4).
1.2.3. Codificación de Ocupación
Preguntas C9a, F3a, G9. "Ocupación en el empleo principal, secundario y personas desempleadas"
El objetivo de estas preguntas es conocer la ocupación que tiene o tuvo el trabajador(a), para identificar la distribución de la población ocupada en función de la especialización de la fuerza de trabajo.
La información sobre ocupación se indaga a través de las siguientes preguntas y según sea el caso:
C9a, F3a, G4a: indagan el nombre de la ocupación que la persona tiene o tuvo.
C9b describe las actividades o tareas que realiza o realizó en su trabajo.
C9c especifica las herramientas, maquinaria o equipo que utiliza para realizar su trabajo.
Estas preguntas deben ser codificadas tanto para el empleo principal (pregunta C9a) como para el secundario (pregunta F3a) y antecedentes laborales o personas desempleadas (pregunta G4a y G9).
1.3. Sistema de Codificación Asistida
Para el desarrollo del trabajo de codificación de la Encuesta Nacional de Hogares 2019, se utiliza un software informático que busca facilitar la asignación de códigos a las diferentes variables del cuestionario según corresponda.
Una vez que los datos son transferidos a oficina por el personal supervisor de Trabajo de Campo, estos se almacenan en un servidor manteniendo la identificación de cada uno de los cuestionarios aplicados. Con la información en el servidor del INEC, inicia el desarrollo de los demás procesos para el tratamiento de la información recolectada. El proceso de codificación es la fase inmediatamente posterior al Trabajo de campo, el encargado de la asignación del trabajo mediante un software asistido ingresa al servidor y distribuye el trabajo para cada miembro del equipo codificador.
Este sistema, se encuentra dividido en diferentes procesos que van de acuerdo a la composición de los espacios para completar la información de un hogar Enaho, y se presenta mediante una interfaz sencilla de manipular, convirtiéndose en una herramienta indispensable para el desarrollo del trabajo en codificación.
2. Procedimientos para realizar la Validación Enaho 2019
El proceso de Validación se conforma por cinco procedimientos, en los que se revisa y depura la información capturada desde campo en los cuestionarios. El sistema estaba constituido con más de 1500 inconsistencias programadas para validar la información de las variables que conforman la base de datos, las cuales fueron revisadas con el protocolo ya previamente mencionado..
A. Asignación de las cargas de trabajo
Esta etapa contempla la asignación del trabajo al personal validador. Se dispondrá de una persona encargada de realizar dicha distribución.
Para llevar a cabo dicha labor se cuenta con un sistema informático que permite controlar y administrar, tanto los cuestionarios transferidos de la fase de codificación a la fase de validación, como el mantenimiento de los usuarios en dicho proceso, controlando contraseñas de acceso, nombres de usuario, roles y cantidad de trabajo realizado.
B. Verificación
Dado que los cuestionarios asignados ya han sido codificados, este procedimiento consiste en una revisión de la información codificada, utilizando la misma metodología y criterios empleados en la Unidad 2 de este instructivo, lo anterior con el fin de depurar mejor la información Enaho.
Deberá determinar si los códigos asignados en la codificación de Empresas de Cable e Internet, Geográfico y Educación o la Codificación de Sector Institucional, Rama de Actividad y Ocupación; están correctos. De lo contrario, deberá realizar los cambios y ajustes necesarios para la validación y la depuración de la información. No realice ningún cambio si tiene dudas del código asignado, consulte antes con el personal encargado.
Considere que todas las variables correspondientes han sido codificadas, por lo que no deben aparecer códigos asignados por el sistema con "-1" (ver unidad de codificación), de encontrar algún caso informe al personal encargado.
C. Depuración de la información: Inconsistencias
Este proceso consiste en la depuración de la información por medio de la revisión de inconsistencias, que son una guía para que el validador verifique la información anotada desde Trabajo de Campo en cada cuestionario, considerando el hogar, la personas miembros de ese hogar y las secciones aplicadas según los pases realizados; corrigiendo los casos que así se determinen.
Para realizar dicho procedimiento, es importante detallar que existen varios tipos de inconsistencias, algunas son sólo de revisión y validación, otras efectivamente son errores que deben ser corregidos. Sin embargo, antes de detallar los tipos de inconsistencias, se realizará una pequeña descripción de la estructura general del mensaje de una inconsistencia.
D. Depuración de la información: Revisión final
Este es el penúltimo proceso antes de enviar la carga asignada de validación hacia el siguiente proceso. Consiste en una última depuración de la información por parte del validador por medio de la revisión de inconsistencias finales.
E. Chequeo de inconsistencias por parte del personal encargado
Último proceso de validación realizado por parte del encargado del proceso como mecanismo de revisión del trabajo listo para enviar por el validador para determinar su desempeño en la depuración de la información asignada en cada carga.
2.1. Sistema de Validación Asistida
Al igual que para codificación, para la validación se utilizó un software informático que busca facilitar la depuración de la información de la Enaho.
Este sistema se encuentra dividido en 5 procedimientos que van de acuerdo a la composición del sistema y de la recolección de los datos, y presenta una interfaz sencilla de manipular, lo que lo convierte en una herramienta indispensable para el desarrollo del trabajo en validador.
2.1.1. Inconsistencias
Este procedimiento se realiza hasta que se ha verificado la fase de codificación y luego ejecutando el botón de inconsistencias. Al darle "clic" en icono de inconsistencias, en la parte media de la pantalla se visualiza, tanto el total de inconsistencias en ese cuestionario, como el listado de inconsistencias a validar. Como se mencionó anteriormente algunas serán de revisión o validación, y de acuerdo a lo establecido en el mensaje, las mismas deberán ser validadas, depuradas o corregidas una por una.
2.1.2. Revisión final
Este proceso permite depurar aún más la información, verificando las inconstancias que se estarían pasando por alto en la primera revisión. Todas las inconsistencias que resulten al ejecutar del botón de revisión final, deben validarse correctamente y deberán estar justificadas por el validador en observaciones en el caso de no realizar la depuración correspondiente.
Dentro del panel de control, se encuentra el botón de "Borrar Sección", este botón deberá ser utilizado sólo en casos especiales en los que se desee borrar la información de TODA una sección, por lo que se uso debe ser cuidadoso y siempre con el visto bueno del personal encargado, dado que al borrar la información se pierde el acceso a la misma de forma definitiva. Cuanto utilice este botón asegúrese antes de:
» Tener el visto bueno del encargado del proceso.
» Estar en la Sección Correcta y en el número de la Línea Correcta.
2.1.3. Chequeo de Inconsistencias por parte del personal encargado de la Validación
Este procedimiento deberá ser realizado únicamente por el personal encargado, por lo que antes de enviar los cuestionarios identificados como listos, el validador deberá llamar al encargado del proceso para que proceda a revisar la validación realizada.
2.1.4. Envió de cuestionarios
Una vez que ha verificado y depurado cada cuestionario asignado, mismos que también han podido ser revisados por el encargado del proceso, y marcados los cuestionarios como listos, estos podrán ser enviados al darle "click" al botón de enviar cuestionarios para que continúen con el siguiente proceso.
En este punto el validador deberá informar al encargado del proceso para que le asigne cuestionarios para validación.
Una vez finalizado este proceso de validación y consistencia de la información, se procedió a la creación de indicadores y cuadros estadísticos, y de esta manera proceder con el análisis e interpretación de los resultados obtenidos.