SciELO - Scientific Electronic Library Online

 
 issue61The Determinants of Colombian Exports: An Empirical Analysis Using the Gravity Model author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

Related links

  • On index processCited by Google
  • Have no similar articlesSimilars in SciELO
  • On index processSimilars in Google

Share


Desarrollo y Sociedad

Print version ISSN 0120-3584

Desarro. soc.  no.61 Bogotá Jan./June 2008

 

La metodología de la Encuesta Continua de Hogares y el empalme de las series del mercado laboral urbano de Colombia

The methodology of the Continuous Household Survey and the connection of the Colombian series urban labor market

Luis Eduardo Arango
Andrés Felipe García
Carlos Esteban Posada*

* Las opiniones contenidas en este documento son responsabilidad exclusiva de los autores y no comprometen al Banco de la República ni a su Junta Directiva. Luis Eduardo Arango y Carlos Esteban Posada son integrantes de la Unidad de Investigaciones Económicas de la Gerencia Técnica y Andrés Felipe García, que se desempeñó como asistente de esta investigación, es estudiante de economía de la Universidad de Antioquia. Se agradecen los comentarios de Francisco Lasso y las sugerencias y recomendaciones de dos evaluadores anónimos. Las series estimadas están disponibles con la solicitud previa a los autores.

Este artículo fue recibido 8 de junio de 2007, modificado el 22 de abril de 2008 y aceptado el 30 de mayo siguiente.


Resumen

La encuesta de hogares tuvo cambios importantes en el año 2000. Ello implicó modificaciones en los conceptos, preguntas, periodicidad de recolección y cobertura que han dificultado la realización de estudios sobre el mercado laboral que requieran series completas desde 1984 hasta hoy. Efectos del cambio son menores registros en las tasas de desempleo y participación y uno mayor en la tasa de ocupación. Este artículo expone dos métodos de empalme de las series: uno apoyado en datos micro y otro en agregados del mercado laboral. Con base en los resultados de ambos métodos, proponemos series de tasas de ocupación, participación y desempleo para empalmar con las series recientes del Dane generadas a partir de la Encuesta Continua de Hogares.

Palabras clave: fuerza laboral, encuesta de hogares, desocupados, trabajadores familiares sin remuneración, modelos logit, modelos panel.

Clasificación JEL: J21, J22, J82, C21, C22, C23.


Abstract

The Continuous Household Survey of Colombia had important changes in 2000 with respect to concepts, questions, frequency of data collection and sample covering. This has made difficult to carry out studies on the labor market that demand series from 1984 up until now. The effects of the changes mirror in the reduction of the unemployment and participation rates while the increase in the occupation rate. This article presents two forms of joining the series: one built on micro data and another based on the labor market. The results allow us to propose series of employment, unemployment and participation rates to join with the recent official series generated from the Continuous Household Survey.

Key words: labor force, household survey, unemployment, family workers without pay, logit models, panel data model.

JEL classification: J21, J22, J82, C21, C22, C23.


Introducción

En el año 2000, el Dane realizó un profundo cambio en la metodología del sistema de encuestas de hogares con el fin de acoger los estándares internacionales surgidos de la Conferencia Internacional de Estadísticos del Trabajo (CIET) de 19931. Ello significó la interrupción de las series del mercado laboral colombiano derivadas de la Encuesta Nacional de Hogares (ENH).

El cambio se consolidó a partir del segundo trimestre de 2001, cuando se dio paso a un nuevo sistema de encuestas conocido como Encuesta Continua de Hogares (ECH), el cual tiene mayor cobertura, frecuencia en la recolección y presentación de datos (mensual en lugar de trimestral), además de cambios importantes en los conceptos que permiten estimar la composición de la fuerza de trabajo.

Con la ECH no es posible realizar análisis comparativos con el período previo a 2001, pues la caracterización de la fuerza de trabajo y la definición de los diferentes grupos de población tuvieron variaciones importantes, en especial en la definición de los desocupados, que afectaron los niveles de los principales agregados del mercado laboral, como se ilustra en el gráfico 1, en la cual se presentan las tasas desempleo (TD) en el período 1984-2005 calculadas con base en la ENH y la ECH.

Gráfico 1. Tasa de desempleo total siete ciudades. 1984-2005.

Se puede observar allí cómo en el año 2000 (único año en el que se tienen datos tanto para la ENH como para la ECH), según la nueva metodología, la tasa de desempleo es inferior en 2,8 puntos porcentuales (pp), en promedio, a la que se generaba según los criterios de la ENH2. Es claro entonces que para analizar la dinámica del mercado laboral en el mediano plazo es necesario empalmar las diferentes variables con el fin de mantener la unidad desde los puntos de vista metodológico y cuantitativo.

El objetivo de este documento es presentar propuestas de empalme de las series de los indicadores del mercado laboral, correspondientes a siete ciudades, para el período 1984-2005. Para ello, se utilizan dos enfoques. El primero –microeconómico–, basado en la ECH entre 2001 y 2005, utiliza modelos de elección binaria para pronosticar la probabilidad de ser reclasificado como inactivo o trabajador familiar sin remuneración (TFSR), según el caso. Este método se desarrolla a partir de los aportes de Lasso (2002). Sin embargo, dadas las dificultades con el ajuste de estos modelos para reclasificar los diferentes grupos de población, se emplea un segundo enfoque que se apoya en los agregados del mercado laboral. Este método se funda en el análisis de la tasa global de participación y los ajustes en las definiciones de la fuerza de trabajo principalmente en el grupo de los desocupados y el de trabajadores familiares sin remuneración.

Este documento tiene seis secciones, de las cuales esta introducción es la primera. En la segunda sección se hace una breve reseña de la transición de la ENH a la ECH con especial acento en el cambio en las definiciones de la fuerza laboral; en la tercera sección se discuten brevemente los empalmes pioneros de Suárez y Buriticá (2002) y Lasso (2002); la cuarta sección presenta la guía teórica y la estimación del modelo microeconométrico; la quinta sección contiene el modelo basado en los agregados del mercado laboral y los resultados; finalmente, la sexta sección presenta algunas conclusiones.

I. Transición metodológica: de la ENH a la ECH

Las encuestas de hogares, instrumento básico para estudiar la fuerza de trabajo en Colombia, se han venido utilizando desde los años sesenta. Entre 1970 y 1975, el Dane realizó nueve etapas que, aunque no tenían un esquema unificado, sirvieron de base para el desarrollo del ‘sistema de encuestas de hogares', el cual se consolidó en 1976 bajo el nombre de Encuesta Nacional de Hogares (ENH). Su marco conceptual y sus definiciones estuvieron inspirados en resoluciones de la CIET y la OIT.

Hasta 1984, con base en la ENH, el Dane reportaba datos agregados trimestralmente de las cuatro principales ciudades (Bogotá, Medellín, Cali y Barranquilla) y anualmente para el total nacional y cabeceras de otras zonas. A partir de ese año la encuesta se amplió a siete ciudades: se sumaron Bucaramanga, Pasto y Manizales y sus áreas metropolitanas.

Sin embargo, la ENH presentaba algunas limitaciones, entre las que destacaban la frecuencia trimestral3 y la gran rotación del personal encargado de capturar información, lo cual dificultaba los operativos de campo y el seguimiento a los hogares no informantes (Lasso, 2002). Con el objetivo, entonces, de modernizar el sistema de encuesta de hogares y obtener así resultados que reflejaran de mejor manera el mercado laboral y su dinámica, el Dane comenzó a desarrollar en 1996 un plan para mejorar la calidad de la ENH actualizando los marcos metodológico y de muestra, la optimización de los procesos operativos y la incorporación de tecnología para facilitar la planeación de los operativos de campo. La adopción de estos elementos trajo como resultado el "sistema continuo de recolección de datos", el cual toma en cuenta los cambios metodológicos propuestos por la OIT en 1993, las experiencias internacionales4 y la dinámica del mercado laboral colombiano. Este sistema fue adoptado, de manera paulatina, a partir de enero de 2000 bajo el nombre de Encuesta Continua de Hogares (ECH), el cual además del contenido de la encuesta y su periodicidad de aplicación, requiere una logística y un operativo técnico muy importantes.

El uso de este nuevo enfoque implicó dos cambios importantes en las estadísticas del mercado laboral: las definiciones de fuerza de trabajo (ocupados, desocupados e inactivos) y, el sistema continuo de recolección5. El primer cambio es el de mayor magnitud, pues produce una modificación en la composición de la población en edad de trabajar (PET), lo cual provoca reducciones en los niveles de las tasas de desempleo y participación y un aumento en el de la tasa de ocupación. El segundo no afecta la medición de los indicadores sino la estructura serial de éstas, por los ajustes estacionales que se producen en los datos intratrimestrales. A continuación se hace un recuento de los principales cambios de orden conceptual recogidos en la ECH.

A. El caso de los trabajadores familiares sin remuneración (TFSR)

La ECH modificó la definición de los TFSR, uno de los componentes de la variable ‘ocupados'. Así, mientras que en la ENH se consideraban como tales las personas que trabajaban en un negocio familiar sin remuneración durante 15 ó más horas a la semana, en la ECH basta con trabajar al menos una hora semanal para ser considerado TFSR. En consecuencia, el grupo de TFSR que trabajaba más de una y menos de 15 horas semanales, que estaba clasificado como desocupado o inactivo (según el flujo de respuestas del módulo de fuerza de trabajo), es ahora reclasificado como ocupado.

El diagrama 1 muestra el flujo de preguntas que permiten identificar los TFSR. En primer lugar, las personas se clasifican según la actividad realizada durante la última semana (o semana de referencia para la encuesta); esto es, si estuvieron ocupadas (trabajando), desocupadas o inactivas (buscando trabajo, dedicadas a estudiar, a oficios del hogar o alguna otra actividad) o se declararon inactivas a causa de una incapacidad permanente. Dentro del grupo de las personas ocupadas, se clasifican como TFSR aquellas que trabajan en un negocio familiar sin recibir remuneración al menos una hora a la semana. El gráfico 2 muestra las personas clasificadas como TFSR que trabajan entre una y catorce horas a la semana como proporción del total de desocupados e inactivos. Se observa allí cómo la población reclasificada por este criterio, en las siete principales ciudades, equivale, en promedio, a 0,8% del total de desocupados e inactivos.

Diagrama 1. Flujo de preguntas del módulo de fuerza de trabajo para la clasificación de TFSR.

Gráfico 2. TFSR reclasificados como proporción del total de desocupados más inactivos. Siete ciudades. Enero 2001 - diciembre 2005.

Este cambio metodológico trajo como resultado el aumento de la población ocupada y la disminución de los desocupados e inactivos; por tanto, disminuyeron los registros de las tasas de desempleo (TD)6 y de participación (TGP) y aumentó el de la tasa de ocupación (TO).

B. El caso de los desocupados

La población de desocupados incluye dos grandes grupos: quienes están en situación de desempleo abierto y en situación de desempleo oculto. Para efectos de identificación y clasificación de unos y otros, la ECH introduce el concepto de disponibilidad. En este sentido, la ECH incluye las siguientes tres preguntas: i) ¿… desea conseguir un trabajo remunerado o instalar un negocio?; ii) Aunque desea trabajar, ¿por qué motivo principal no hizo diligencias en las últimas cuatro semanas? (aparecen listadas las razones no válidas de desempleo); iii) Si le hubiera resultado algún trabajo… ¿estaba disponible la semana pasada para empezar a trabajar?

Estas preguntas permiten capturar la información necesaria para clasificar la población desocupada bajo la nueva definición de desocupado de la ECH, la cual se resume y compara con la definición de la anterior metodología en el cuadro 1. Se observan allí dos cambios importantes; el primero, da cuenta del periodo de referencia, el cual cambia de una semana a cuatro; y el segundo incluye el factor de disponibilidad inmediata a trabajar y razones válidas de desempleo.

Cuadro 1. Definiciones de lo que es un desocupado en la ENH y la ECH.

Por tanto, en comparación con la ENH no se consideran desocupadas en la ECH aquellas personas que se encuentran en situación de desempleo abierto pero no tienen disponibilidad inmediata para trabajar ni aquellas que están en situación de desempleo oculto pero que no cumplen con al menos una de las tres condiciones siguientes: i) tener disponibilidad inmediata para trabajar, ii) tener deseo de conseguir un trabajo remunerado o instalar un negocio, o iii) tener una razón válida de desempleo7.

A partir de la nueva definición de ‘desocupados' se puede establecer un flujo de preguntas que permite determinar la magnitud del cambio en la definición de los desocupados que afecta, además de este grupo, a los inactivos, de tal forma que se observa una disminución de la medida de los desocupados en contraste con un aumento de la medida de la población de inactivos. Dicho flujo se presenta en el diagrama 2, el cual se construyó con base en la ECH de 2002, pues entre 2000 y el primer semestre de 2001 las preguntas del módulo de fuerza de trabajo aún eran objeto de modificaciones. Sin embargo, ello no impidió, para estos períodos, caracterizar los desocupados bajo la definición presentada en el cuadro 1.

Diagrama 2. Flujo de preguntas del módulo de fuerza de trabajo para la clasificación de desocupados e inactivos.

El diagrama 2 parte de los grupos aún sin clasificar, es decir, la población en edad de trabajar, sin contar los ocupados (incluso los TFSR) y los inactivos por razones de incapacidad permanente. De este grupo se clasifican en primer lugar los desempleados en condición de desempleo abierto según las características que presenta el cuadro 1 (sin trabajo en la semana de referencia, buscó trabajo en las últimas cuatro semanas y estaba disponible para trabajar inmediatamente), seguidos de los desempleados en condición de desempleo oculto (según los criterios de razón válida de desempleo y disponibilidad a trabajar); el grupo restante se clasifica como inactivo.

Para ilustrar la magnitud del efecto que significó este cambio metodológico, el gráfico 3 muestra el porcentaje de desocupados que son reclasificados como inactivos en la ECH entre enero de 2001 y diciembre de 2005 correspondientes a siete ciudades. Entre enero de 2001 y diciembre de 2003 el promedio de reclasificados es de 9,9%, y entre enero de 2004 y diciembre de 2005, de 12,7%. Esto indica que en los últimos años la medida de esta variable ha presentado una tendencia creciente.

Gráfico 3. Desocupados que pasan a ser inactivos como proporción del total de desocupados. Total siete ciudades. Enero 2001 - diciembre 2005.

II. Empalme de series del mercado laboral

Con el propósito de hacer compatibles las series generadas con la ENH (1984 – 2000) y con la ECH (2001 – 2005) para siete ciudades, Suárez y Buriticá (2002) y Lasso (2002) propusieron dos metodologías. Los primeros desarrollaron dos pruebas no paramétricas y una prueba t para verificar la existencia de valores diferenciados entre la ENH y la ECH. Con esta información construyeron dos factores de corrección: uno para ajustar el cambio en las definiciones de la fuerza de trabajo y sus componentes y otro para hacer el ajuste por el cambio en el sistema de recolección por trimestre, de cuyo producto resulta un factor definitivo. Cada factor es el resultado de procesos autorregresivos de primer orden en frecuencia trimestral, lo cual permite corregir las estadísticas del mercado laboral del año 2000 hacia atrás. Entre las limitaciones de esta metodología están la imposibilidad de realizar desagregaciones, la escasez de datos con los cuales estimar procesos autorregresivos y la falta de coherencia de los datos obtenidos con el ciclo y la estacionalidad presentados por el mercado laboral (véase Lasso, 2002).

La segunda metodología hace un análisis completo del cambio en la definición de los TFSR y los desocupados y su efecto en las estadísticas laborales de forma separada mediante modelos logit con los cuales corrige lo relativo tanto al módulo de fuerza de trabajo (analizado en la sección anterior) como a la estacionalidad. De esta manera, se superan los problemas de la metodología anterior. El trabajo econométrico de Lasso ofrece dos alternativas de empalme, ya que construye dos tipos de modelos para cada caso de reclasificación: uno que usa sólo los meses en los cuales se realizaba la ENH y otro que usa la muestra por trimestres completa con dummies mensuales intratrimestre, con el fin de corregir la estacionalidad; así, para cada caso se presentan cinco modelos.

La metodología de Lasso presenta, sin embargo, dos limitaciones. En primer lugar, la inclusión de dos modelos de reclasificación para cada caso no permite tener un resultado único para el empalme. En segundo lugar, aparte la desagregación por género, no se intenta ningún empalme de las tasas por ciudad, grupos de edad, etc.

El presente documento plantea dos alternativas para el empalme de las series del mercado laboral, una de carácter microeconómico y otra basada en la tasa global de participación del mercado. La primera alternativa sigue la metodología de Lasso (2002) al utilizar modelos logit que toman como base los datos individuales de la ECH para determinar, a partir de las características personales y familiares, las personas susceptibles de ser reclasificadas. Procura, sin embargo, remediar algunos de los defectos de la propuesta de empalme de dicho autor al incluir elementos que permitan unificar el modelo en uno que contenga todos los posibles efectos estacionales y una información que genere mayor precisión cuando se estimen altos niveles de desagregación. De igual forma, parte de una teoría para justificar el modelo empírico. La segunda alternativa se desarrolló teniendo en cuenta el hecho empírico surgido de la correlación entre el porcentaje de reclasificados y la TGP, el cual permite determinar el flujo de reclasificados (cuántos) en cada uno de los casos expuestos. Con cada una de las metodologías empleadas para realizar los empalmes se realizan desagregaciones por género y ciudad. A la primera alternativa la llamamos indistintamente microeconómica o logit, y a la segunda la llamamos macro, o basada en datos agregados del mercado laboral.

III. Modelos logit para el empalme de series del mercado laboral: enfoque microeconómico

En esta sección se propone un modelo teórico para tratar los ‘nuevos inactivos' (que vienen de los desocupados que no tienen disponibilidad inmediata para trabajar) y los TFSR (que vienen de los desocupados e inactivos), del cual se derivan dos modelos logit cuyos resultados se presentan al final de la misma.

A. El tránsito de desocupados a inactivos: enfoque teórico

Se parte del modelo neoclásico de participación según el cual una persona participa en el mercado laboral si el salario de mercado supera su salario de reserva (cuando su nivel ex-ante de oferta de horas de trabajo es 0), dadas sus preferencias e ingresos no laborales; es decir, la persona participa si:

ecuación en la cual wm es el salario de mercado, wR el salario de reserva, el tiempo total disponible y l el tiempo destinado al ocio.

El hecho que se quiere caracterizar consiste en estimar la recomposición de la PET y su efecto en las estimaciones de las principales variables del mercado laboral. Concretamente, se quiere determinar qué ocasiona que personas que en un momento (durante la vigencia de la ENH) fueron consideradas participantes en el mercado laboral pasen a ser consideradas (durante la vigencia de la ECH) parte de la población inactiva. Por tanto, el objetivo es identificar aquellos factores que provocan una caída en salario relativo haciendo que:

Se considera que el salario de reserva, que es una variable no observable, se puede estimar bajo una especificación que contenga la siguiente forma:

cp son las características de la persona y cf las características familiares. En el primer caso, se utilizan variables como edad, escolaridad, nivel educativo, género y proxies del ingreso, entre otras. Debe señalarse que este conjunto de características también afecta la oferta salarial que puede recibir el individuo en el mercado. Entre las variables que caracterizan el hogar se tienen en cuenta su localización, los niños menores de seis años, el número de ocupados y desocupados del hogar, entre otras. Existen, desde luego, factores de demanda que afectan el salario de mercado. Sin embargo, aquí sólo nos concentraremos en el lado de la oferta.

B. El tránsito de desocupados e inactivos a TFSR: enfoque teórico

En el caso de los TFSR sólo se presenta un cambio importante respecto al modelo anterior, ya que se puede pensar que es importante considerar variables más específicas de las actividades económicas que realizan los agentes del hogar. Así, suponemos que el salario de reserva depende no sólo de las características personales y familiares, sino también de especificidades del jefe del hogar (cj) como la rama de actividad y la posición ocupacional.

El salario explicito no parece cumplir un papel fundamental en el caso de los TFSR; por tanto, cuando se habla de ‘salario' se hace referencia a las ganancias en términos de ayudas en dinero y experiencia y a la satisfacción que obtiene un TFSR por el hecho de prestar ayuda.

C. Aspectos empíricos

Se estiman dos modelos de elección binaria. Con el primero se quiere determinar la probabilidad de que un individuo que se encuentra como desempleado sea reclasificado como inactivo. Con el segundo, la probabilidad de ser reclasificado como TFSR, si previamente ha sido clasificado como inactivo o desocupado. En cada caso se estima un modelo logit de la forma:

En esta ecuación y toma el valor de 1 si el individuo se reclasifica y 0 en otro caso. I es la función índice que viene dada por una forma lineal:

siendo H el vector de características del hogar compuesto de la ciudad de residencia, el estrato socioeconómico, el número de ocupados y desocupados en el hogar, la presencia de niños menores de seis años, la presencia de cónyuge8 y el género, edad y escolaridad del jefe como conjunto de factores básicos que determinan la participación en el mercado laboral9; P, entre tanto, es el vector de características personales compuesto de la posición en el hogar, el estado civil, el género, la edad, la escolaridad, la asistencia escolar y el nivel escolar más alto alcanzado; el vector J está compuesto de las ramas de actividad y la posición ocupacional del jefe; T es un vector que contiene interacciones entre las variables enunciadas anteriormente con las dummies de género y ciudad, ya que se quieren analizar estos dos niveles de desagregación; mt son dummies trimestrales y e son innovaciones de carácter aleatorio.

La especificación de este modelo presenta diferencias importantes respecto a los de Lasso (2002). En primer lugar, acá se propone un único modelo que mediante interacciones calcula los efectos estacionales y la estructura serial. En segundo lugar, también mediante interacciones, se capturan los efectos por ciudad y género con el fin de tener información más detallada de estos grupos para cada una de las variables. En último lugar, la especificación del modelo logit para los desocupados no incluye las variables de rama de ocupación del jefe del hogar ni la posición ocupacional de éste10.

Para efectos empíricos se utilizaron los datos de la ECH en el período 2001-2005 (60 etapas). En el caso de la estimación de la probabilidad de ser reclasificado como inactivo cuando originalmente se clasificó como desocupado, se utilizó una muestra de 114.545 individuos. En el caso de la reclasificación como inactivo o desocupado hacia TFSR, se utilizó una muestra de 471.327 individuos. Con estos datos se construyeron estadísticas11 con las cuales se da cuenta de la importancia relativa de cada conjunto para determinar la probabilidad que se quiere modelar. Las tablas 1 y 2 del anexo 1 presentan los promedios de cada una de las variables consideradas en el período 2001-2005 y en el periodo 1984-2000 (correspondiente a 68 etapas de la ENH).

Con esta información se estiman modelos logit para cada caso, haciendo la corrección de Huber-White a los residuales. Con dichos modelos se estima la probabilidad de que un desempleado, de la época de la ENH, fuese clasificado ahora como inactivo y de que un desocupado (inactivo) se clasifique como TFSR con menos de 15 horas. Las tablas 1 y 2 presentan los efectos marginales correspondientes.

Tabla 1. Modelo logit para desocupados susceptibles de ser reclasificados como inactivos. Efectos marginales.

Tabla 2. Modelo logit para desocupados e inactivos susceptibles de ser reclasificados como TFSR. Efectos marginales.

Los modelos fueron utilizados para hacer los pronósticos que permitieran reorganizar la información de la fuerza de trabajo corrigiendo en primer lugar la cifra de los desocupados que pasan a ser inactivos y luego la de los desocupados o inactivos que pasan a TFSR. Los resultados de estos ejercicios, incluyendo las estimaciones de Lasso (2002) para modelos trimestrales, aparecen en los gráficos 4, 5 y 6, en los que se presentan las nuevas trayectorias de la TD, la TGP y la TO, respectivamente. En el anexo 2 se presentan las mismas tasas desagregadas por género y ciudad.

Gráfico 4. Tasa de desempleo siete ciudades con metodología de ENH y ECH. 1984 - 2005.

Gráfico 5. Tasa global de participación siete ciudades con metodología de ENH y ECH. 1984 - 2005.

Gráfico 6. Tasa de ocupación siete ciudades con metodología de ENH y ECH. 1984 - 2005.

Si bien los resultados permiten realizar una reclasificación confiable, la concordancia y el ajuste sugieren buscar otra alternativa de empalme. Así, teniendo en cuenta los agregados del mercado laboral se encuentran estrechas correlaciones que permiten estimar la recomposición de la población económicamente activa y la población en edad de trabajar entre 1984 y 2000. Dichos resultados se presentan en la siguiente sección.

IV. Modelos basados en variables agregadas del mercado laboral: enfoque agregado (‘macro')

Después de analizar las dinámicas de la TD, la TGP y la TO, se encontró una estrecha relación entre el comportamiento de la TGP, siete ciudades, y el porcentaje de reclasificados tanto para los desocupados como para los TFSR; en el primer caso, se observa una relación negativa que indica que un aumento en la TGP implica la disminución del porcentaje de desocupados que no tienen disponibilidad inmediata para trabajar, mientras que para el segundo caso el signo de la correlación cambia.

Se encontró, entonces, que la TGP es un buen mecanismo para pronosticar el porcentaje de reclasificados en los casos ya mencionados, pero dado que el objetivo es predecir dicho comportamiento en el período 1984-2000, la TGP debía ser corregida bajo la metodología de ENH (véase gráfico 7). Como resultado, la TGP, corregida con la metodología de ENH, es, en promedio, 0,98 pp más alta que la misma tasa construida con la metodología de la ECH. De todas maneras, al corregir la TGP, se mantuvo la correlación existente con los flujos de poblaciones reclasificadas.

Gráfico 7. TGP ECH y TGP corregida a ENH. Siete ciudades. Enero 2001 - diciembre 2005.

Para la corrección de la TGP se identificaron los desocupados reclasificados como inactivos, y los inactivos y desocupados reclasificados como TFSR. Para ello, se clasificaron como desocupados o inactivos aquellos TFSR que trabajaban entre 1 y 14 horas y como desocupados, aquellos individuos que cumplían con las características de los desocupados, excepto por la disponibilidad inmediata a trabajar o tener una razón válida de desempleo.

En el caso del flujo de inactivos-desocupados, no se presentan problemas de identificación, pero en el caso de los TFSR no se tiene suficiente información para conocer si estas personas fueron consideradas inactivas o desocupadas en la ENH. Para resolver este inconveniente se adoptó el criterio de hacer el ajuste de tal forma que las proporciones de desocupados e inactivos respecto del total de ellos se mantuvieran. Esto es, que:

En la cual D y PEI son los desocupados e inactivos en ECH, respectivamente, y y PEI´ sus similares para la ENH.

A partir de estos datos se estimaron modelos OLS para el período 2001-2005, en frecuencia mensual, cuyas variables dependientes correspondían a los porcentajes de reclasificados en cada caso expuesto y utilizaban la TGP corregida de la ECH como única variable explicativa, que controla por efectos estacionales en frecuencia trimestral.

Empíricamente se estimó una ecuación de la forma:

en la cual y es el porcentaje de reclasificados en cada caso (véanse gráficos 2 y 3), dti dummies de frecuencia trimestral, TGP corregida la tasa global de participación corregida con metodología de ENH, ddj dummies de corrección para outliers y cambios estructurales y ei innovaciones. Una vez ajustada la ecuación de regresión (haciendo la corrección de Newey-West para heterocedasticidad y correlación serial) y las pruebas de estabilidad de parámetros de ambos modelos12, se obtuvieron los resultados presentados en las tablas 3 y 4 para el caso de los desocupados y los TFSR, respectivamente.

Tabla 3. Modelo para desocupados reclasificados como inactivos.

Tabla 4. Modelo para desocupados e inactivos reclasificados como TFSR.

Se observa allí que los signos de los coeficientes correspondientes a la TGP corregida son los esperados, dadas las correlaciones negativa y positiva que tienen los flujos de dichas poblaciones reclasificadas. En el anexo 1 se verifica que en períodos en los cuales la TGP era relativamente más alta, el porcentaje de reclasificados era menor en el caso de los desocupados y mayor para el caso de los TFSR con menos de 15 horas. A partir de los resultados de estos modelos se pronosticó el porcentaje de reclasificados durante la vigencia de la ENH y con esta información se corrigieron las tasas de desempleo considerando en primer lugar el efecto del paso de desocupados a inactivos y de desocupados e inactivos a TFSR. Estos resultados se presentan en los gráficos 4, 5 y 6.

Utilizando este mismo enfoque se ajustaron los agregados del mercado laboral por género y por ciudades; los resultados se resumen en los anexos 2 y 3. Para la desagregación por género se usa la misma metodología que para el modelo agregado del total de siete ciudades, es decir, se estiman modelos OLS haciendo la corrección de Newey-West (véase tabla 5).

Tabla 5. Modelos para desocupados reclasificados como inactivos. Desagregación por género.

Para el caso de la desagregación por ciudad se estimó un panel por tipo de reclasificación ya que los modelos individuales no reportaron resultados satisfactorios. Los coeficientes obtenidos por el modelo panel parecen ser compatibles con los obtenidos en los modelos individuales, por lo menos en magnitud. El panel se estimó por efectos aleatorios teniendo en cuenta los resultados de la prueba de Hausman. Los resultados aparecen en la tabla 6.

Tabla 6. Modelo panel para ciudades.

El cambio de metodología provocó una reducción en la medida de la tasa de desempleo, cuyo efecto se concentra básicamente en la reclasificación de los desocupados como inactivos, pues este factor contribuye casi con 95% del cambio en el nivel de la tasa de desempleo. Para los indicadores agregados de siete ciudades, los modelos construidos a partir la TGP corregida arrojan un mayor cambio en comparación con los modelos logit: son en promedio de 1,7 y 1,2 pp en el caso de la TD, y de 0,9 y 0,4 pp en la TGP y aumentos de 0,2 y 0,5 pp en la TO, respectivamente.

Las estimaciones por género presentan resultados similares a los datos agregados, pero las tasas empalmadas con la metodología macro sufren variaciones de hasta 1 pp en comparación con los resultados obtenidos con el modelo logit, como ocurre en el caso de la tasa de desempleo para las mujeres. Sin embargo, a mayor nivel de desagregación, como es el caso por ciudades, los modelos elaborados con información individual tienen mayor capacidad que los macro; pues, a este nivel de desagregación, la correlación existente entre los porcentajes de reclasificados y la TGP corregida para cada ciudad es muy baja, en especial para el caso de los modelos de los TFSR. Así, cuanto mayor es el nivel de desagregación (por género o ciudad) mayor es el poder de predicción del modelo microeconómico (logit) en cuanto a la dinámica del mercado laboral.

Lo anterior señala la pertinencia de definir cuál de las estimaciones es más apropiada para realizar análisis que abarquen el período 1984-2005: la logit o la macro. El primer criterio es que la serie mantenga las propiedades estadísticas de la serie original. El segundo es la capacidad de pronosticar tanto para el año 2000, utilizando la muestra 1984-1999, como para el período 2001 y 2001-2002 utilizando la muestra completa (1984-2000).

La tabla 3 del anexo 4 presenta las pruebas de raíz unitaria (ADF y ADF-ERS, en este caso) tanto para la serie original como para las estimadas bajo los dos métodos. Se puede observar que las propiedades seriales de las estimaciones por ambos modelos se mantienen; además, se presentan el segundo, tercer y cuarto momentos ‘muestrales' de la primera diferencia tanto de la serie de ENH como de las series estimadas y se observa, en general, bastante similitud entre éstas, especialmente entre la serie generada por el modelo microeconómico (logit) y la serie de ENH. A pesar de esto, es difícil afirmar que la serie del modelo micro es la mejor, ya que los cambios producidos en la encuesta de hogares pudieron haber variado la estructura de la serie, pues como se demostró en el modelo agregado, estos cambios tienen una estrecha relación con la TGP, la cual ha sufrido variaciones importantes en el período 1984-2000.

Con respecto al segundo criterio, se empleó la raíz del error cuadrático medio de pronóstico, comparando los valores obtenidos, para el 2000, con cada serie estimada y los valores oficiales de ECH para el mismo año; y, además, se estimó un modelo ARIMA para las series obtenidas por ambas metodologías (el mismo modelo ARIMA se aplicó a las dos series estimadas), para realizar pronósticos a un horizonte de ocho trimestres, es decir, 2001:1-2002:413, para así definir cuál de las series tenía mayor precisión para explicar la dinámica del mercado laboral (véase tabla 4 del anexo 4).

Con base en este análisis comparativo se puede señalar que para la tasa de desempleo urbano (siete ciudades) y para la correspondiente a cada una de las siete ciudades es más adecuado usar estimaciones basadas en el modelo microeconómico (logit). Sin embargo, por género la decisión cambia, aunque la diferencia entre los modelos es bastante pequeña14. En tal sentido, identificamos las estimaciones del modelo microeconómico como las más adecuadas para realizar el empalme con las series del mercado laboral derivadas de la ECH.

Una vez sugerida una serie, vale la pena señalar que los datos presentados en este documento tienen una diferencia con los datos oficiales presentados por el Dane para el período comprendido entre el primer trimestre de 2000 y el primer trimestre de 2001. Tal diferencia se debe a que, como lo advierte el pie de página 1, en el año 2000 todavía no se habían realizado todos los cambios metodológicos y éstos terminaron solamente en junio de 2001. Por tal razón, para ese período también se realizaron estimaciones al igual que se hizo para el resto del periodo de la ENH. Las estimaciones nuestras de las tasas de desempleo, participación y ocupación con las correspondientes series oficiales del Dane se presentan en los gráficos 8 a 10. Las diferencias aparecen entonces durante el año 2000 y el primer semestre de 2001.

Gráfico 8. Tasas de desempleo oficiales del Dane y tasa estimada con el modelo microeconómico (micro). Siete ciudades. 1984 - 2005.

Gráfico 9. Tasas de globales de participación oficiales del Dane y estimada con el modelo microeconómico (micro). Siete ciudades. 1984 - 2005.

Gráfico 10. Tasas de ocupación oficiales del Dane y estimada con el modelo microeconómico (micro). Siete ciudades. 1984 - 2005.

V. Conclusiones

El sistema de encuestas de hogares sufrió un profundo cambio metodológico, lo cual ha permitido tener un flujo de información más frecuente y nutrido, pero esto causó una discontinuidad en las series del mercado laboral. Esto ha hecho más difícil realizar análisis de largo plazo y ha obligado a proponer alternativas para compatibilizar la vieja metodología (ENH) con la actual (ECH).

El criterio de disponibilidad inmediata para trabajar, en el caso de la medición del desempleo, ha causado el mayor efecto en las series del mercado laboral, pues entre 2001 y 2005 se reclasificaron en promedio 11% de los desocupados, lo cual redujo la medida de la tasa de desempleo hasta en 1,9 pp. Mientras que la reclasificación de los TFSR con menos de 15 horas, que en promedio se reclasificaron 0,8% entre desocupados e inactivos, tan sólo alcanza a reducir la tasa de desempleo en 0,1 pp.

Con el propósito de usar los datos del mercado laboral desde 1984 hasta ahora, presentamos dos metodologías de empalme. La primera sigue el enfoque de Lasso (2002), mientras que la segunda se basa en algunas regularidades observadas en el caso del mercado laboral de Colombia.

El enfoque basado en variables agregadas presenta buenos resultados en niveles de alta agregación, mientras que en el caso contrario el modelo microeconómico (logit) presenta un mejor desempeño como lo evidencia el ejercicio realizado para las siete principales ciudades; más aún, un análisis estadístico de los momentos muestrales de cada serie y su poder de pronóstico sugiere que el modelo microeconómico (logit) es el más adecuado para el empalme de las series del mercado laboral. La base de datos con las series se encuentra disponible, junto al Borrador de Economía, en la página del Banco de la República en Internet.

Anexo 1

Tabla 1. Promedio de las principales variables del modelo logit para el caso de los desocupados.

Tabla 2. Promedio de las principales variables del modelo logit para el caso de los TFSR.

Anexo 2

Gráfico 1. Tasa de desempleo empalmada por género y ciudad. 1984-2005.

Gráfico 2. Tasa global de participación empalmada desagregada por género y ciudad. 1984-2005.

Gráfico 3. Tasa de ocupación empalmada desagregada por género y ciudad. 1984-2005.

Anexo 3

Gráfico 4. Porcentaje de desocupados reclasificados como inactivos. 2001-2005.

Gráfico 5. Porcentaje de desocupados e inactivos reclasificados como TFSR. 2001-2005.

Anexo 4

Tabla 3. Pruebas de raíz unitaria para las series estimadas de desempleo para el total nacional y desagregadas por género y ciudad.

Tabla 4. Raíz del error cuadrático medio para los pronósticos del modelo agregado y el modelo logit.


NOTAS AL PIE

1. LA CIET es una conferencia de expertos de la Organización Internacional del Trabajo (OIT) que se reúne desde 1923. Las conferencias claves para efectos metodológicos fueron

la de 1983, en la cual se establecieron algunos referentes de medición principalmente del subempleo; la de 1998, que se centró en el sector informal, y en 1998 fue el subempleo el concepto clave.

2. Se debe tener en cuenta que en el año 2000 todavía no se habían realizado todos los cambios metodológicos; estos terminaron en junio de 2001. En consecuencia, la diferencia en la tasa de desempleo podría ser menor. Al comparar la tasa global de participación con la tasa de ocupación para el año 2000 según ENH y ECH, se tiene que la primera es menor, en promedio, en 0,58 pp, mientras que la tasa de ocupación es mayor, en promedio, en 1,42 pp.

3. Lo cual dejaba amplios períodos sin información que ignoraban aspectos relativos a la estacionalidad y movilidad laborales.

4. A propósito de modificaciones Guataquí y Taborda (2006) muestran en qué consistieron los cambios metodológicos llevados a cabo en el Reino Unido, Trinidad y Tobago, España e Italia, cuyos resultados fueron las caídas en las tasas estimadas de desempleo en, aproximadamente, 2 pp, en promedio.

5. Descrito por el Dane como una serie continuada de ‘ciclos' de encuesta.

6. Lo cual se explica gracias a que la población económicamente activa (PEA) aumenta, al menos en el caso de que un inactivo se clasifique como TFSR.

7. Se consideran razones no válidas de desempleo las siguientes: considerarse muy joven o muy viejo, tener responsabilidades familiares, problemas de salud, estar estudiando o tener otra razón diferente. Las razones válidas de desempleo son: haber encontrado trabajo, no hay trabajo disponible en la ciudad, estar esperando a que lo llamen, no saber cómo buscarlo, estar cansado de buscar, no encontrar trabajo en su oficio o profesión, estar esperando la temporada alta, carecer de la experiencia necesaria, no tener recursos para instalar un negocio, o los empleadores lo consideran muy viejo o muy joven.

8. La presencia de niños menores de seis años se modela mediante una dummy que toma el valor de 1 si hay al menos un niño menor de seis años. De igual manera se hace para la variable de presencia de cónyuge en el hogar.

9. En el modelo de TFSR se incluye la presencia de patrones en el hogar diferentes del jefe de hogar, construida a partir de una variable dummy que toma el valor de 1 si hay al menos un individuo en el hogar que tenga la posición de patrón y no sea el jefe.

10. En el caso de los TFSR se incluyen estas variables pero condicionadas a que el individuo no sea jefe de hogar para evitar la repetición de información. De la misma manera se modelan las variables de género, edad y escolaridad del jefe, tanto para el modelo de desocupados como para el de TFSR.

11. Expandidas con los factores del Dane.

12. Las pruebas de estabilidad son: residuales recursivos, CUSUM, CUSUM cuadrado y coeficientes recursivos.

13. Se estimaron varios modelos ARIMA y se utilizaron los criterios de información de Schwarz y Akaike para la elección del mejor modelo.

14. Para la desagregación por género, no se tienen datos oficiales para comparar el año 2000.


Referencias

1. DANE. Metodología de la Encuesta Continua de Hogares, (2001).        [ Links ]

2. GUATAQUÍ, J. C. and TABORDA, R. "Theoretical and empirical implications of the new definition of unemployment in Colombia", Revista de Economía del Rosario, 9(1), (2006):21-38.        [ Links ]

3. LASSO, F. "Nueva metodología de encuesta de hogares: ¿más o menos desocupados?", Archivos de Economía, 213, (2002), DNP.        [ Links ]

4. SUÁREZ, Á. y BURITICÁ, A. "Empalme de las series de tasa de desempleo, ocupación y participación entre la Encuesta Transversal y la Continua", Dane, (2002).        [ Links ]

Creative Commons License All the contents of this journal, except where otherwise noted, is licensed under a Creative Commons Attribution License