UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS FACULTAD DE CIENCIAS MATEMÁTICAS E.A.P. DE. ESTADÍSTICA Modelos Probit y Tobit aplicados al estudio de la oferta laboral de los trabajadores secundarios en el Perú Anexos MONOGRAFÍA Para optar el Título de Licenciado en Estadística AUTOR Edgard Abanto Millones LIMA – PERÚ 2003 ANEXOS A.1 ECUACIÓN SALARIAL El ingreso o costo de oportunidad de los trabajadores secundarios sólo se conoce para aquellos que se encuentran laborando. Por lo tanto, de la ecuación salarial con la muestra total no se puede inferir el costo de oportunidad para toda la población estudiada. Esto es lo que se conoce como sesgo de selección. Heckman, propone un método de dos pasos que soluciona estos problemas. Dicho modelo de dos etapas que suele utilizarse en situaciones donde aparezca el “sesgo de selección”. Heckman afirma que el problema de utilizar MCO para estimar la ecuación de regresión es que proporciona estimadores sesgados debido a la presencia de una variable omitida, donde la cantidad (que se denomina razón inversa de Mills). ë = ö( Xâ ) / Ö( Xâ ) es una variable omitida. Si dicha variable omitida se incluyera en la regresión MCO, como en Wi=Xiâ+ ö( Xâ ) / Ö ( Xâ ) donde: Wi: variable dependiente Xi: Variables independientes Las estimaciones resultarían consistentes, Heckman afirma que dicho modelo se estima fácilmente mediante el siguiente estimador en dos etapas: 1. Realizar un modelo Probit sobre las variables Xâ y obtener las estimaciones que permiten construir la variable ë que representa el sesgo de la selección. 2. Se estima la ecuación de costo de oportunidad por MCO incluyendo como regresor a ë, y se realiza la prueba de significación de dicha variable. Si se rechaza que su coeficiente es cero puede afirmarse que efectivamente existe sesgo de selección. A.1.1 ESTIMACIÓN DE LA VARIABLE COSTO DE OPORTUNIDAD. La Estimación de los datos de la variable ingresos por hora (Ln_ingresos) se realizaron siguiendo la metodología anterior. Las variables usadas son: Variable dependiente. 1. Ln_ingresos. Logaritmo de los ingresos mensuales . Variable cuantitativa continua. Variable explicativas. 1. Secundaria . Si el individuo tiene estudios hasta nivel secundario o no. 2. 1 : Nivel secundario. 0 : Otros. Superior . 1 : Si el individuo tiene estudios nivel superior o no. Nivel superior. 0 : 6. Otros. Se la define como dummy que identifica a los trabajadores Sexo. varones. 7. 1 : Hombre. 0 : Mujer. Independientes no formal. Se la define como dummy que identifica a los trabajadores secundarios que laboran de manera informal. 1 : Trabajador informal. 0 : Otros. 3. Exp_lab2 . Se refiere a la experiencia laboral al cuadrado del trabajador. 4. Exp_lab . Se refiere a la experiencia laboral del trabajador. 5. Ratio de Mill . Representa el sesgo de la selección. 6. Lima_met. Se refiere si el trabajador reside en Lima Metropolitana. Resultados: ANOVAb Model 1 Regression Residual Total Sum of Squares 549096.2 2064224 2613320 df 8 2303756 2303764 Mean Square F 68637.027 76601.646 .896 Sig. .000 a a. Predictors: (Constant), LIMA_MET, recode de sexo, dumi superior o no, EXP_LAB2, independiente no formal, dumi secundaria o no, RAT_MILL, EXPE_LAB b. Dependent Variable: Logaritmo natural del ingreso por hora Coefficientsa Unstandardized Coefficients Model 1 B (Constant) secundaria superior sexo independiente no formal EXP_LAB2 EXPE_LAB RAT_MILL LIMA_MET 1.5214 Std. Error .002 .3545 .9660 95% Confidence Interval for B t 697.021 Sig. .000 Lower Bound 1.517 Upper Bound 1.526 .001 .002 243.357 473.676 .000 .000 .352 .962 .357 .970 -.4021 .002 -196.899 .000 -.406 -.398 -.4486 -.0009 .001 .000 -313.921 -237.418 .000 .000 -.451 -.001 -.446 -.001 .0423 .000 257.489 .000 .042 .043 .4130 .3015 .003 .001 161.784 234.845 .000 .000 .408 .299 .418 .304 a. Dependent Variable: Logaritmo natural del ingreso por hora Calculados los parámetros de la ecuación de regresión, se estimaron los valores de la variable Y=Ln_ingresos (logaritmo de los ingresos por hora de los trabajadores secundarios). A.2. ENCUESTA NACIONAL DE HOGARES CARACTERÍSTICAS DE LA ENCUESTA 1. TIPO DE ENCUESTA La encuesta es de derecho, significa que, la población en estudio está constituida por todos los residentes habituales del hogar. 2.COBERTURA DE LA ENCUESTA 2.1 Cobertura Geográfica.- La Encuesta se realizará en el área urbana del territorio nacional. Se considera área urbana a aquella conformada por centros poblados con más de 2 mil habitantes. 2.2 Cobertura Temporal.- La Encuesta se efectuó durante los meses de Agosto y Septiembre . 2.3 Cobertura Temática.- La Cobertura Temática de la investigación comprende: -Características de los Miembros del Hogar -Empleo e Ingreso: • Condición de Actividad • Sindicalización • Ingresos • Trabajo Anterior • Trabajo Habitual -Educación y Calificación para el trabajo -Seguridad Social -Migración -Uso de Computadora e Internet en el centro de trabajo 3. MÉTODO DE LA ENTREVISTA Se empleará el método de entrevista directa, con personal debidamente capacitado y entrenado para tal fin y que visitará las viviendas seleccionadas durante el periodo de recolección de información. 4. PERÍODOS DE REFERENCIA Los periodos de referencia para las variables a investigarse en el III Trimestre son los siguientes: -Características de los Miembros del Hogar: • Día de la entrevista • Residencia habitual: Últimos 30 días • Semana pasada -Empleo • Condición de actividad: Semana pasada -Búsqueda de Otro Empleo: Día de la entrevista 5. FINALIDAD Y OBJETIVOS 5.1 FINALIDAD Suministrar información estadística demográfica, social y económica provenientemente de los hogares, que proporcionen una adecuada base cuantitativa para el estudio de la realidad nacional, la formulación y evaluación de los planes de desarrollo y la toma de decisiones. 5.2 OBJETIVOS GENERALES 1 Obtener información sobre la estructura y tendencias de cambio en la fuerza laboral a través de sus características socioeconómicas básicas, tales como: los niveles de empleo e ingreso, grupos y categorías ocupacionales, trabajo habitual, migración calificación para el trabajo y otros datos referentes a la disponibilidad y utilización de los recursos humanos en el país. 2 Proveer información periódica, sistemática y oportuna en los periodos íntercensales. 3 Servir de fuente de información a instituciones publicas y privadas, así como; a investigadores. 4 Permitir la comparabilidad con investigaciones similares, en relación a las variables investigadas. 5.3 OBJETIVOS ESPECÍFICOS - Determinar la población económicamente activa (PEA), relacionada con sus características en cuanto a sexo, edad, educación, estado civil o conyugal, concisión de actividad, migración, ocupación, categoría de ocupación, rama de actividad económica, etc. - Determinar la PEA Ocupada relacionándola con sus característica en cuanto a sexo, edad, educación, estado civil o conyugal, migración, ocupación, categoría de ocupación, rama de actividad económica, horas trabajadas, nivel de ingreso percibido, etc. - Determinar la Población Desempleada relacionándola con sus características en cuanto a sexo, edad, educación, estado civil o conyugal, migración, etc. - Determinar la población económicamente inactiva, relacionándola con sus características en cuanto a sexo, edad, educación, trabajo anterior, estado civil, migración, etc. - Determinar la tasa de desempleo y subempleo. - Obtener indicadores del ingreso por trabajo. - Obtener información sobre educación y calificación para el trabajo. - Ingreso por trabajo: Ordinarios: Día, semana, quincena, mes anterior o 2 meses o anteriores. o En Especie: Últimos 12 meses. o Extraordinarios: Últimos 12 meses. - Ingresos por Transferencias Corrientes: Últimos 6 meses. - Ingresos por Rentas de la Propiedad: Últimos 12 meses. - Otros Ingresos Extraordinarios: Últimos 12 meses. - Trabajo Anterior para los desocupados e inactivos: Ultimo trabajo realizado. - Trabajo Habitual para los ocupados, desocupados e inactivos: Últimos 12 meses. - Ingreso por Actividad Agropecuaria: Últimos 12 meses. 6 DISEÑO MUESTRAL 6.1 Población Bajo Estudio.- Comprende las viviendas particulares y sus ocupantes del área urbana del país. 6.2 Marco Muestral.- El Marco Muestral está basado en la información del Precenso de 1999 y el material cartográfico respectivo. La información de este marco ha sido actualizada a 2001 en los conglomerados seleccionados para la muestra. 6.3 Unidades de Muestreo.- La unidad Primaria de Muestreo (UPM) es el centro poblado urbano con 2 mil y más habitantes. La unidad Secundaria de Muestreo (USM) es el conglomerado que tiene en promedio 80 viviendas particulares. La unidad Terciaria de Muestreo (UTM) es la vivienda particular. 6.4 Tipo de Muestreo.- La muestra es probabilística, estratificada y de áreas. La selección de la muestra es sistemática, proporcional al tamaño en la primera y segunda etapa de muestreo, y de selección sistemática simple de una muestra compacta en la tercera etapa. El nivel de confianza de los resultados muestrales es del 95%. 6.5 Tamaño Muestral.- El tamaño de la muestra en le ámbito nacional urbano e de 10 395 viviendas, distribuidas en 725 conglomerados. El número de viviendas a seleccionarse por conglomerados es igual a doce (12) en el dominio de Lima Metropolitana y quince (15) en el resto de dominios urbanos. 7. NIVELES DE INFERENCIA Los resultados de la Encuesta tendrán los siguientes niveles de inferencia: • Nacional Urbano • Dominios Geográficos: - Costa Urbana - Sierra Urbana - Selva Urbana • Ciudades: - Área Metropolitana de Lima y Callao - Arequipa - Chimbote - Cajamarca - Lambayeque - Puno y Juliaca - Pucallpa De acuerdo al diseño muestral, se podrá producir resultados para diferentes arreglos de unidades y su nivel de desagregación dependerá fundamentalmente de la precisión con que se estime el dato, y ésta del tamaño de la muestra para cada caso.