Fichero: capitulo 9 nuevo.doc CAPÍTULO 9 HETEROCEDASTICIDAD. 1. CAUSAS MUESTRALES Y ESTRUCTURALES Como sabemos, la heterocedasticidad consiste en que las observaciones 2 muestrales tienen varianzas del error diferentes entre sí: var(Ui)= σ i, i=1,2,...n. Viola la hipótesis clásica de homocedasticidad, o igual varianza de los n errores aleatorios, y es un caso particular, junto a la autocorrelación, de perturbaciones no esféricas. Las figuras 9.1 y 9.2 presentan los casos de perturbaciones homocedásticas y heterocedásticas respectivamente. ______________________________________ Manual de Econometría. Capítulo 9, página 1 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC A lo largo de este capítulo se abordan las siguientes cuestiones: cuándo y por qué surge; cuáles son las consecuencias de estimar por MCO un modelo heterocedástico; cómo hacer un diagnóstico correcto del problema, es decir, qué contrastes ponen a prueba la hipótesis de homocedasticidad frente a la evidencia de los datos muestrales; y por último, cómo estimar un modelo heterocedástico, y cómo evitar que surja la heterocedasticidad, eliminándola, si llega el caso. La heterocedasticidad puede surgir por causas estructurales o muestrales, es decir, su presencia puede ser sugerida por la teoría o por el propio diseño muestral y plan de muestreo en la recogida de la información para estimar el modelo. Las causas estructurales o teóricas suelen darse en modelos de corte transversal con unidades muestrales de diferente "tamaño". Consideremos, por ejemplo, un modelo de decisiones de gasto en vivienda de las familias en función de la renta familiar y de otras características. Podemos suponer que el grado de aleatoriedad del gasto de las familias crece con los ingresos; las familias de ingresos bajos son muy homogéneas entre sí, es decir, gastarán cantidades similares, ya que su margen de maniobra para tomar decisiones de gasto es reducido. En cambio, las familias de renta alta tendrán pautas de gasto más heterogéneas entre sí. La variabilidad del gasto entre familias "ricas" es mucho mayor que entre familias "pobres". En este ejemplo, la propia teoría sugiere la forma o pauta de la heterocedasticidad: la varianza del error depende positivamente de la renta. Otros ejemplos donde posiblemente surja el problema de la heterocedasticidad 'estructural' son los siguientes: un modelo que explica el reparto de dividendos (en millones de ptas.) de una sociedad en función de los beneficios obtenidos en el ejercicio (también en millones de ptas.) y de otras variables como el tamaño de la sociedad; un modelo de gastos en publicidad de diferentes marcas comerciales en ______________________________________ Manual de Econometría. Capítulo 9, página 2 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC función de sus ventas y otras variables; un modelo que explica las ventas de una compañía en función de su marketing-mix. Nótese que en todos los ejemplos los datos muestrales son transversales, las unidades muestrales tienen diferente "tamaño" (familias de bajos y altos ingresos, empresas de dimensión reducida y grande, etc.) y que la variable dependiente se mide en términos absolutos (millones de ptas. por ejemplo). Un hecho frecuente es que la dispersión absoluta sea mayor en las unidades de mayor volumen precisamente por este motivo 'estructural', si bien es posible que la dispersión relativa sea más homogénea. Así, aunque los dividendos distribuídos por las sociedades grandes estén muy dispersos en torno al valor esperado, es posible que el ratio dividendos distribuídos sobre beneficios, dados los beneficios y demás características de la sociedad, tenga una dispersión similar, independiente del tamaño de las sociedades. Los errores de especificación de la forma funcional también pueden producir 1 heterocedasticidad . Así, si el verdadero modelo, homocedástico, es doble-log y estimamos un modelo lineal, las perturbaciones de éste son heterocedásticas, como demostramos en el apéndice 9.1. Hay un tipo de modelos heterocedásticos con datos temporales que está despertando creciente interés por su potencial de aplicación en econometría financiera, con series de cotizaciones o de rendimientos de valores. Son los modelos ARCH, o GARCH, de varianza condicionada heterocedástica, en los que el riesgo condicional de un valor (varianza de sus rendimientos en el día t, dada toda la información disponible hasta ese día) va variando a lo largo del tiempo. A diferencia de las situaciones anteriores, en las que la heterocedasticidad se consideraba un 'problema' a evitar o tratar, en este caso es una fuente de información que mejora sensiblemente la capacidad predictiva del modelo. 1 Para los alumnos de Bea: ya nos hemos encontrado un caso en la práctica 1 ______________________________________ Manual de Econometría. Capítulo 9, página 3 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC La heterocedasticidad puede surgir también por causas muestrales, en el sentido de que el propio diseño de recogida de información o plan de muestreo genera perturbaciones con varianzas distintas. Por ejemplo, cuando trabajamos con datos agregados o medios procedentes de distintas submuestras, siendo variable el tamaño de las mismas. Supongamos un modelo lineal que explica el gasto en publicidad de las empresas en función de las ventas del año anterior y de otras variables que omitimos por simplicidad. Supongamos también que el modelo desagregado es homocedástico: Y i = β 0 + β 1 X i + U i ; (i = 1,2,...n); var( U i ) = σ 2 (9.1) donde Yi y Xi representan respectivamente los gastos de publicidad y las ventas desfasadas un año de la empresa i-ésima, y Ui es el error aleatorio y homocedástico del modelo. Supongamos que solamente tenemos datos medios por zonas, obtenidos a partir de muestras de empresas de cada una de las J zonas. El plan de muestreo ha sido una estratificación por zonas con afijación proporcional, es decir, en cada estrato (zona) se tomó una muestra proporcional al número de empresas radicadas en la misma, resultando J submuestras de empresas de tamaño nj (j=1,2,...J), de forma que Σnj=n. Nuestro modelo explica el gasto medio en publicidad en cada zona en función de las ventas del año previo. El modelo se estima con J observaciones: Y j = β 0 + β 1 X j +U j ; (j = 1,2,...J) Los errores Uj de este modelo son la media de los nj errores de las empresas de la zona j. Tienen esperanza nula y son por construcción heterocedásticos, ya que la ______________________________________ Manual de Econometría. Capítulo 9, página 4 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC varianza de la media es la varianza de la población dividida entre el tamaño muestral. En nuestro caso, la varianza del error de cada observación es inversamente proporcional al número de empresas en la muestra de la zona: U j= ∑in=1j U i ; (j = 1,2,...J) nj E( U j ) = 0 ∀j = 1,2,...J (9.2) Var( U j ) = σ ; (j = 1,2,...J) nj 2 Ejercicio 9.1.- Si en el ejemplo anterior los J datos son valores agregados en vez de medios (ventas y gastos en publicidad totales de las nj empresas del grupo) obtenga la expresión de las varianzas de las perturbaciones Heterocedasticidad por grupos. En ocasiones, la heterocedasticidad aparece en modelos de datos agrupados. Pongamos a título de ejemplo la ecuación de salarios de licenciados universitarios que propusimos en el capítulo 6. El logaritmo del salario depende de los años de experiencia laboral (EXPER), con una relación cuadrática, es decir, como explicativas incluímos la experiencia y su cuadrado. Además, el modelo hipotetiza que hay diferencias sistemáticas entre los hombres y las mujeres, y entre las cuatro titulaciones (Humanidades, Economía, Medicina e Ingeniería). La muestra, de 600 licenciados, se reparte entre las titulaciones con n1(Humanidades) = 172; n2(Ingeniería) = 345; n3(Medicina) = 148; n4(Economía) = 335; El modelo que proponíamos en el capítulo 6 era el siguiente, en el que se suponía que las perturbaciones eran independientes, con media cero y varianza constante: ______________________________________ Manual de Econometría. Capítulo 9, página 5 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC Y i = Log ( Salarioi ) = β 1 + β 2 S i + β 3 T 1i + β 4 T 2i + β 5 T 3i + β 6 E i + β 7 E 2 i + u i ; S i = MUJERi ; T 1i = Dummy de Medicina; T 2 i = Dummy de Economía T 3i = Dummy de Ingeniería; E = exp eriencia laboral Ahora supongamos que la varianza del error aleatorio difiere entre las titulaciones. 2 A la titulación j (j=1,...4) corresponde una varianza σ j. Esto puede ocurrir porque, por ejemplo, los salarios de los de Humanidades, para un nivel dado de experiencia, son muy homogéneos, al trabajar en su mayoría como enseñantes, mientras que los ingenieros presentan un abanico salarial mayor dependiendo del puesto de trabajo y las funciones desempeñadas. En este ejemplo, hay heterocedasticidad por grupos. El modelo contiene tantas varianzas del error desconocidas, a estimar, como grupos y hay un número suficientemente grande de observaciones en cada grupo para estimarlas, basándose en las sumas de cuadrados de los respectivos errores. Más adelante veremos un contraste de homocedasticidad por grupos. 2. FORMAS FUNCIONALES. HETEROCEDASTICIDAD ADITIVA Y MULTIPLICATIVA. Hemos visto que cuando la heterocedasticidad es un problema producido por el plan de muestreo o por la agregación de variables, generalmente conocemos, excepto por un factor de escala, las varianzas de los errores de cada una de las observaciones, que dependen del número de unidades muestrales desagregadas contenido en cada observación agregada. Conocemos, pues, la matriz Σ y el método de MCG puede aplicarse sin dificultad, obteniendo estimadores ELIO como se indicaba en la lección anterior. El único parámetro a estimar, aparte de los 2 coeficientes de regresión, es σ , el factor de escala en la expresión Ε(UU') =V = ______________________________________ Manual de Econometría. Capítulo 9, página 6 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC 2 σ ∑. Pero cuando la heterocedasticidad obedece a otras causas, que hemos llamado 'estructurales' o bien es consecuencia de una especificación incorrecta de la forma funcional, las varianzas de los n errores son desconocidas. Si no hay autocorrelación, la matriz V es diagonal y contiene n valores desconocidos. Con una muestra de tamaño n no se pueden estimar libremente esas n varianzas y los K parámetros de regresión por falta de grados de libertad. Pero para aplicar MCGF es preciso tener, como sabemos, una estimación consistente de la matriz V ( o Σ, ya que en este caso podemos considerarlas equivalentes). Una posibilidad es 2 i. parametrizar el comportamiento de las varianzas σ La propia teoría, el tipo de variables, la experiencia previa o la propia voz de los datos pueden sugerir un determinado esquema funcional de comportamiento. Por ejemplo, en el modelo explicativo del gasto familiar en turismo y ocio una hipótesis teóricamente plausible y avalada por diversos estudios previos sugiere que la varianza del error del gasto es proporcional a la renta familiar. Las siguientes son algunas formas funcionales posibles para la varianza de las perturbaciones: 1)Var( U i ) = δ Z i ; ( δ > 0); i = 1,2,...N 2)Var( U i ) = δ Z i2 ; δ > 0; i = 1,2,...N 3)Var( U i ) = δ 0 + δ 1 Z i ; ( δ 1 > 0); i = 1,2,...N (9.3) δ 0+δ 1 Z i ; i = 1,2,...N 4)Var( U i ) = e 5)Var( U i ) = σ 12 ; (i = 1,2,... n1 ) = σ 22 ; (i = n1 + 1,...N ) donde Zi representa alguna variable explicativa del modelo u otra ajena al mismo. En las formas 1) y 2) la varianza del error es directamente proporcional a la ______________________________________ Manual de Econometría. Capítulo 9, página 7 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC variable Z y a su cuadrado respectivamente. En 2) se evita la posibilidad absurda de tener varianzas negativas. El esquema 3) recibe el nombre de heterocedasticidad aditiva, ya que la varianza de los errores es una función lineal de Z, con término constante. La forma 4) se llama heterocedasticidad multiplicativa. En ella, la varianza de los errores es una función exponencial de Z. En ambos casos, se puede generalizar para incluir varias variables Zp (p=1,2,...P). El caso 5) indica que la muestra contiene dos submuestras diferentes en cuanto a la dispersión de las perturbaciones, y admite también una generalización a más de dos submuestras. Por ejemplo, con datos trimestrales podría ocurrir que la varianza del error fuera homogénea dentro de cada trimestre pero diferente para los cuatro trimestres del año; en ese caso, tendríamos cuatro submuestras. En otras ocasiones tendremos menos suerte, y no seremos capaces de encontrar una 2 i especificación adecuada para σ compatible con los datos. Aún en este caso, como veremos en el apartado 4, podremos estimar el modelo por MCGF estimando consistentemente Σ mediante los residuos de la regresión por MCO. 3. DIAGNÓSTICO DE LA HETEROCEDASTICIDAD. CONTRASTES En este apartado se reseñan varios métodos, incluyendo, de menor a mayor formalización, desde la inspección visual de algunos gráficos hasta los contrastes cuya hipótesis nula es la homocedasticidad del modelo, frente a la hipótesis alternativa de heterocedasticidad, en alguna de sus múltiples formas. El tipo de datos y de problema nos previene sobre la posible presencia de heterocedasticidad. En general, cuando trabajemos con datos transversales y unidades de "tamaños" diferentes, debemos estar prevenidos. Por otra parte, como vimos en el primer apartado, si los datos son agregados o medias de ______________________________________ Manual de Econometría. Capítulo 9, página 8 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC distintas submuestras sabemos que el modelo es heterocedástico. El análisis visual de algunos gráficos hará que aumente o disminuya nuestra ______________________________________ Manual de Econometría. Capítulo 9, página 9 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC sospecha, e incluso nos puede ayudar a detectar las variables (Z) responsables de los cambios de varianza entre observaciones. En abscisas se representan las posibles Z (generalmente, los regresores, uno cada vez), o los valores ajustados de Y. En ordenadas, los residuos de la regresión MCO en valor absoluto o sus cuadrados. Veamos algunos ejemplos: La figura 9.3 representa una situación homocedástica: los errores son independientes de los valores de Y ajustados, y por tanto, podemos pensar que también lo son del conjunto de regresores. En la figura 9.4, los errores cuadráticos crecen linealmente con Xr (una de las variables explicativas del modelo): sospechamos una forma 1) de heterocedasticidad, donde Zi es Xri. En la figura 9.5, la relación parece ser cuadrática (heterocedasticidad de la forma 2). Existen múltiples test estadísticos para detectar la heterocedasticidad, cuya hipótesis nula es siempre que los errores son homocedásticos. Uno de los contrastes clásicos es el de Goldfeld y Quandt (1972), adecuado cuando sospechamos que dos o más submuestras o grupos de individuos perfectamente identificables pueden diferenciarse en la varianza de sus respectivos errores. Es el caso 5) del apartado anterior. Por ejemplo, supongamos que para explicar el precio de los coches en España se recurre a un conjunto de variables de prestación: velocidad máxima, potencia del motor, etc.. La muestra abarca una amplia gama de modelos incluyendo los pequeños utilitarios y los familiares. Es posible que el grupo de modelos base, los más pequeños, baratos y sencillos de cada marca, tengan desviaciones respecto al precio esperado, dadas sus características, que los modelos familiares, más grandes y de mayor precio. Supongamos, pues, un modelo con heterocedasticidad de la forma 5), es decir, hay dos submuestras independientes de tamaños respectivos n1 y n2, con n1>k y 2 1 n2>k y n1+n2 = n, con varianzas del error σ 2 2 yσ respectivamente. Podríamos ______________________________________ Manual de Econometría. Capítulo 9, página 10 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC estimar dos modelos de regresión independientes, uno para cada submuestra: 2 Y 1 = X 1 β 1 + U 1 ; U 1 ~ N(0;σ 1 I 1 ) (9.4) 2 Y 2 = X 2 β 2 + U 2 ; U 2 ~ N(0;σ 2 I 2 ) Como sabemos, en cada regresión se verifica que la suma de cuadrados de los residuos MCO dividida entre la varianza de la perturbación aleatoria sigue una 2 distribución χ y ambas son independientes: SCERR1 σ1 2 = S1 σ1 2 ~ χ n 1-k 2 (9.5) SCERR2 σ 2 2 = S2 σ 2 2 ~ χ n 2- k 2 Para contrastar la hipótesis nula de homocedasticidad: 2 1 H0: σ 2 2 =σ construimos una distribución F a partir de las dos distribuciones, como cociente 2 entre ambas distribuciones χ , cada una de ellas dividida entre sus grados de libertad. Si se cumple H0, se verifica que: S2 n2 - k ~ F n 2 - k,n 1- k S1 n1 - k (9.6) Si el estadístico de prueba [9.6] calculado para nuestro problema es mayor que el valor crítico de la F, decidimos rechazar la hipótesis nula. ______________________________________ Manual de Econometría. Capítulo 9, página 11 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC Este contraste es exacto para muestras finitas admitiendo la posibilidad de que los coeficientes de regresión β de ambas submuestras sean diferentes. Para el modelo restringido (coeficientes iguales), solamente es válido asintóticamente. Este contraste de Goldfeld y Quandt puede extenderse al caso de g grupos, y muestra de tamaño n. La hipótesis nula de homocedasticidad es: H 0 : σ 12 = σ 22 = ... = σ g2 = σ 2 E (uu ' ) = V = σ I n 2 (9.7) La hipótesis alternativa de heterocedasticidad es: σ 12 I n 0 E (uu ' ) = V = M 0 1 0 σ 22 I n M 0 ... 0 ... 0 O M ... σ g2 I n 2 g (9.8) El contraste, basado en el proncipio del ratio de verosimilitudes, consiste en estimar por MV el modelo restringido (bajo la hipótesis nula) y el no restringido (permitiendo varianzas diferentes entre grupos). El estadístico de prueba y su distribución asintótica bajo la hipótesis nula es: g RV = n Ln σˆ 2 − ∑ ni Lnσˆ i2 ~ χ 2 g −1 2 (9.9) i =1 Goldfeld y Quandt partieron de los resultados anteriores para diseñar un contraste de heterocedasticidad que no valiera solamente para aplicar a dos submuestras ______________________________________ Manual de Econometría. Capítulo 9, página 12 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC previamente identificables sino también para esquemas de dependencia funcional desconocida. Supongamos un modelo en que la varianza del error es proporcional a una variable Zi conocida, que generalmente será alguno de los regresores. La idea es formar dos submuestras, una con los individuos para los que Zi presenta los valores más pequeños y otra de individuos con Zi mayor, estimar el modelo para ambas muestras por separado y hacer el contraste [9.6]. Los pasos a seguir son: 1) ordenar la muestra en orden creciente de valores de Zi; 2) eliminar las h observaciones centrales; 3) Estimar el modelo para las dos submuestras extremas, ambas de igual tamaño (N-h)/2; 4) Realizar el contraste [9.6]. El estadístico de prueba es S2/S1 porque las dos submuestras tienen el mismo tamaño. La elección del número de datos centrales a descartar, h, debe garantizar que las dos muestras extremas resulten bastante 'separadas' pero a la vez que tengan un tamaño suficiente para estimar el modelo. Es recomentable descartar aproximadamente un tercio de la muestra. Un segundo tipo de contrastes se basa en hacer una regresión de los residuos mínimocuadráticos de la regresión (en valor absoluto o al cuadrado) contra un conjunto de variables Z que se suponen conjuntamente causantes de la heterocedasticidad. Supongamos, por ejemplo, una pauta lineal de heterocedasticidad: Var( U i ) = E( U i2 ) = σ i2 = δ 0 + δ 1 Z 1i + ...+ δ p Z p i ; i = 1,2,...n Aproximando el cuadrado de las perturbaciones, desconocidas, mediante el cuadrado de los residuos MCO, se estima por regresión la ecuación que 'explica' linealmente el cuadrado de los residuos MCO en función de las Z: ei = d 0 + d 1 Z 1 i + ...+ d p Z p i + vi ; (i = 1,2,...n) La hipótesis nula de homocedasticidad es la de nulidad conjunta de los coeficientes d, excluyendo el término independiente, que se pone a prueba con el ______________________________________ Manual de Econometría. Capítulo 9, página 13 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC estadístico F: H 0 : d 1 = d 2 = ... = d p = 0 Esta es la base de una prolífica familia de contrastes, entre los cuales el más destacado representante es el de Breusch y Pagan. El contraste de Breusch y Pagan, que ya se ha presentado en el capítulo 5, detecta incluso pautas no lineales de comportamiento de la varianza de la perturbación: σ i2 = f ( δ 0 + δ 1 Z 1 i + ...+ δ p Z p i ) La hipótesis nula, de homocedasticidad, es que todos los coeficientes excepto δ0 son nulos: H 0 : δ 1 = δ 2 = ... = δ p = 0 Para realizar el test se siguen los siguientes pasos: 1) se estima el modelo original por MCO y se calculan los residuos MCO; 2) se calcula la serie eN de residuos tipificados, restando a cada uno la media y dividiendo entre la desviación típica. Si el modelo tiene constante, la media de los residuos es cero y en este caso tipificar es simplemente dividir entre la desviación típica ( N^2 serie e e' e ). n Se calcula también la de residuos tipificados al cuadrado; 3) se hace la regresión lineal de N^2 estos últimos, e contra el conjunto de variables Z, incluyendo una constante y se calcula la suma de cuadrados explicada; 4) si la hipótesis nula es cierta, la mitad de la suma de cuadrados explicada se distribuye asintóticamente como una 2 χ con p grados de libertad. Si el valor del estadístico de prueba supera el valor crítico tabulado, dado el nivel de significación elegido, rechazamos la hipóteis nula decidiendo que el modelo presenta heterocedasticidad. ______________________________________ Manual de Econometría. Capítulo 9, página 14 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC El contraste de White es el más general. Es un contraste asintótico que no necesita especificar la lista de variables responsables de la heterocedasticidad. Se estima una regresión auxiliar en la que los cuadrados de los residuos minimocuadráticos vienen “explicados” por una constante, cada una de las variables explicativas, sus respectivos cuadrados y todos los productos cruzados entre cada dos variables explicativas. Bajo la hipótesis nula de homocedasticidad, el estadístico nR 2 ~ χ 2 (q ) , 2 donde R es el coeficiente de determinación de la regresión auxiliar y q es el número de variables explicativas de dicha regresión auxiliar, excluyendo la constante. La ventaja de este contraste es que es muy flexible, detectando heterocedasticidad bajo condiciones muy generales. Su principal problema es que, en caso de detectarla, no nos da pista alguna sobre la forma de la heterocedasticidad o la lista de variables responsables de la misma. Una dificultad adicional, si la muestra no es muy grande, es el escaso número de grados de libertad que quedan, ya que la lista de regresores es tan ampli. Ejercicio 9.2. Si en el modelo original, del que queremos averiguar si hay o no heterocedasticidad, hay K=6 variables explicativas, incluyendo la constante, y la muestra es de tamaño 100, calcula el número de grados de libertad de la regresión auxiliar para el test de White. Otros contrastes basados en regresiones auxiliares de los residuos o sus cuadrados, son los de Glejser y de Park. Puedes consultar detalles en los manuales de econometría. 4. TRATAMIENTO DE LA HETEROCEDASTICIDAD. ESTIMACION DE UN MODELO HETEROCEDASTICO O TRANSFORMACIÓN DEL MODELO Al ser un caso particular de perturbaciones no esféricas, ya conocemos los ______________________________________ Manual de Econometría. Capítulo 9, página 15 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC efectos de la estimación por MCO de un modelo heterocedástico: los estimadores de MCO son insesgados y consistentes, pero no eficientes. Los estimadores de MCG son óptimos o eficientes, es decir, los de varianza mínima. Además, recordemos que si estimamos por MCO el modelo suponiendo homocedasticidad cometemos un sesgo en la estimación de la matriz de covarianzas de 2 -1 estimadores, ya que calcularemos σ (X'X) los cuando en realidad su matriz de covarianzas es [7.3]. Recordemos también que las medidas de bondad del ajuste y los contrastes de significación y de restricciones sobre los parámetros pueden ser engañosas debido a la mala estimación de la precisión de los estimadores, sin que a priori pueda conocerse la dirección del sesgo. En el caso concreto de un modelo heterocedástico pero sin autocorrelación, los estimadores de MCG son de hecho estimadores de mínimos cuadrados ponderados porque, la transformación [7.10] consiste en ponderar a cada individuo de la muestra inversamente a la desviación típica de su respectiva perturbación. En efecto, en este caso la matriz V=Σ es diagonal de forma que la matriz C de [7.5] es la matriz identidad y P es también diagonal: ______________________________________ Manual de Econometría. Capítulo 9, página 16 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC 1 1 V = Σ = Λ ; C = I n ; P = Σ- 2 = V - 2 σ 12 2 σ2 V = ... 2 σ n * * ri de forma que Y i = Yi/σi y X 1 σ 2 1 P= 1 σ 22 ... 1 σ 2n = Xri/σi. La función a minimizar es ahora la suma de cuadrados de los residuos ponderada según la fiabilidad de cada dato: si la variaza de la perturbación de un individuo es grande, el dato muestral de la variable dependiente de ese individuo tiene un intervalo de confianza grande, no debemos asignar demasiado peso a los individuos poco fiables. Piense en la situación opuesta: si supiéramos que la perturbación de un individuo tiene varianza casi nula, esto significa que el dato de su endógena es (casi) exactamente la función de regresión poblacional, o sea, el valor esperado de Y dadas las X. Al ser una estimación muy fiable de un punto de la FRP, es lógico que asignemos a ese individuo mucho peso. Ejercicio 9.3.- Un modelo de gastos en vivienda Queremos estimar un modelo con datos de N=20 familias que explique el gasto anual en vivienda de cada una (Y) en función de la renta (X). El modelo es: Y i = α + β X i +U i ; (i = 1,2,...20) donde Yi son los gastos anuales en vivienda de la familia i-ésima en miles de unidades monetarias, y Xi son sus ingresos anuales expresados en las mismas unidades. Los datos muestrales son los siguientes: ______________________________________ Manual de Econometría. Capítulo 9, página 17 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC GR UP O DE FA MIL IAS INGRESOS NETOS/AÑ O (Millones de ptas.) GASTOS EN VIVIENDA/AÑO (MILES DE PTAS.) Y X Gasto medio de las familias del grupo Varianza del gasto dentro del grupo S2y 1 210 220 230 235 240 0.8 227 116 2 405 415 450 540 580 2 478 4866 3 650 600 790 820 900 4 752 12296 4 550 700 1020 1200 980 6 890 54560 a) Estimar por MCO el modelo de regresión lineal. b) Suponiendo que la varianza de las perturbaciones sea proporcional al cuadrado de la renta, reestimar el modelo por mínimos cuadrados ponderados. Solución: a) La estimación del modelo por MCO es la siguiente: Y i = 186 . 648 + 125 . 9694 X (t R 2 = 0 . 7486 ; = 7 . 3220 i ) F = 53 . 61 b) La transformación adecuada para convertir el modelo en homocedástico consiste en dividir cada variable del modelo entre la renta disponible Xi. El modelo resultante, estimado por MCO, es: Y X R = 154 . 9167 i 2 + 110 . 5 (t = 0 . 6289 ; 1 Xi = 5 . 5227 ) F = 30 . 50067 Si la pauta de heterocedasticidad es como hemos supuesto, estos últimos estimadores son los de varianza mínima (óptimos) y las medidas de bondad del ajuste del modelo original están basadas en una estimación errónea de la matriz de ______________________________________ Manual de Econometría. Capítulo 9, página 18 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC 2 covarianzas de U. Por tanto, los R de ambos modelos no pueden compararse. ¿Han cambiado mucho los resultados de la estimación (coeficientes estimados)? Observación: para contestar esta pregunta, piensa qué coeficientes de ambos modelos son comparables entre sí. Ejercicio 9.4.- Para el modelo de regresión lineal siguiente: Y i = β 1 + β 2 X 2 i + β 3 X 3 i +U i a) σ i2 = σ 2 X 2i b) σ i2 = σ 2 X 22i c) σ i2 = σ 2 X 1i2 X 22i d) σ i2 = σ 2 X 1i X 2i indicar cuál es el modelo (homocedástico) transformado en cada uno de los siguientes casos: Solución: a) Yi X = β1 2i 1 X + β 2 X + β 3 2i X 1 b) Y i = β + β2 + β3 1 X 2i X 2i X c) 2i 3i 2i + X 3i X 2i Ui X 2i Yi Ui 1 1 1 = β1 + β2 + β3 + X 2 i X 3i X 21 X 3 i X 3i X 2 i X 2 i X 3i EL MÉTODO DE MCGF. CÓMO ESTIMAR CONSISTENTEMENTE LA MATRIZ Σ Como sabemos, para aplicar MCG es preciso estimar previamente la matriz de 2 covarianzas de los errores σ Σ, es decir, determinar los pesos wi por los que ponderar a cada individuo de la muestra. Hay dos posibilidades para determinar dichos pesos. La primera consiste en admitir alguna hipótesis específica acerca de ______________________________________ Manual de Econometría. Capítulo 9, página 19 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC la forma funcional de la heterocedasticidad, como en el ejercicio anterior y aplicar mínimos cuadrados ponderados, estimando el modelo transformado : wiY i = wi β 1+ wi β 2 X + ... + w i β 1 con w i = σˆ i 2i K X Ki + Observe que en general el modelo resultante no tiene término independiente, por lo que las medidas de bondad del ajuste basadas en la fórmula habitual de descomposición de la varianza pierden validez. Pero hay ocasiones en las que no tenemos base teórica ni empírica para apostar por una determinada hipótesis en este sentido. En este caso, podríamos estimar 2 2 σ i mediante e i, es decir, el cuadrado del residuo MCO correspondiente a cada observación. El modelo a estimar sería, pues: Y i = β 1 + β X 2i + ...+ β X Ki + U i 1 2 K ei e1 ei ei ei Ejercicio 9.5. ¿Qué desventajas tiene esta propuesta?, ¿Cómo será el ajuste?. Aplíquelo con E-Views a un ejemplo concreto Como se advirtió en el capítulo anterior, las propiedades en muestras pequeñas de los estimadores de MCGF son desconocidas y en la práctica es posible que, cuando trabajamos con muestras pequeñas, sea incluso preferible estimar el modelo por MCO que al menos proporciona estimadores insesgados. En este caso, ______________________________________ Manual de Econometría. Capítulo 9, página 20 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC si la muestra es grande, conviene emplear la corrección de White para estimar sus varianzas. Los estimadores de White de las varianzas de los estimadores MCO Si optamos por el método de MCO, hay, como sabemos, un problema adicional. La matriz de varianzas covarianzas de los estimadores MCO, como sabemos, es 2 [7.3], fórmula que contiene las varianzas desconocidas σ i. White (1980) demostró 2 i que [7.3] se puede estimar consistentemente sustituyendo en ella σ 2 por e i, siendo como de costumbre ei el residuo minimocuadrático de la observación iésima. Todos los paquetes econométricos dan la opción de calcular los “estimadores consistentes de White”, o la “corrección de White” de la s varianzas de los estimadores. Con esos términos, se están refiriendo a la estimación de la matriz de varianzas-covarianzas de los estimadores MCO que acabamos de presentar. Ejemplo. Observa atentamente y comenta los siguientes resultados, del modelo explicativo del salario de 600 licenciados universitarios con el que ya hemos trabajado en el capítulo 6. ¿Qué se ha hecho en cada estimación y por qué? Estimación 1 Dependent Variable: LOG(SALARIO) Method: Least Squares Sample: 1 600 Included observations: 600 ______________________________________ Manual de Econometría. Capítulo 9, página 21 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC Variable Coefficient Std. Error t-Statistic Prob. C EXPER EXPER^2 INGENIERO MEDICINA ECONOMIA MUJER HARVARD POSGRADO 12.58346 0.017376 -0.000711 0.188897 0.145605 0.093852 -0.091262 0.195579 0.031638 0.016769 0.002316 9.23E-05 0.013384 0.016136 0.013465 0.009081 0.016143 0.009881 750.3996 7.503810 -7.706221 14.11378 9.023679 6.970193 -10.04968 12.11571 3.202046 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0014 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.476313 0.469224 0.110915 7.270516 472.5676 1.944500 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 12.75184 0.152242 -1.545225 -1.479271 67.19209 0.000000 Estimación 2 Dependent Variable: LOG(SALARIO) Method: Least Squares Date: 10/28/01 Time: 18:25 Sample: 1 600 Included observations: 600 Weighting series: 1/RESID Variable Coefficient Std. Error t-Statistic Prob. C EXPER EXPER^2 INGENIERO MEDICINA ECONOMIA MUJER HARVARD POSGRADO 12.58582 0.017251 -0.000705 0.187151 0.141893 0.091417 -0.091320 0.193591 0.032478 0.002295 0.000291 1.03E-05 0.001405 0.001816 0.001488 0.000286 0.002048 0.000723 5484.304 59.25447 -68.17610 133.1850 78.13480 61.43859 -318.7607 94.54385 44.90079 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 Weighted Statistics R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 1.000000 1.000000 0.017002 0.170843 1597.819 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic 12.79008 211.6233 -5.296063 -5.230109 22658.27 ______________________________________ Manual de Econometría. Capítulo 9, página 22 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC Durbin-Watson stat 0.028731 Prob(F-statistic) 0.000000 0.476236 0.469146 0.110923 1.942783 Mean dependent var S.D. dependent var Sum squared resid 12.75184 0.152242 7.271588 Unweighted Statistics R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat Estimación 3 Dependent Variable: LOG(SALARIO) Method: Least Squares Sample: 1 600 Included observations: 600 White Heteroskedasticity-Consistent Standard Errors & Covariance Variable Coefficient Std. Error t-Statistic Prob. C EXPER EXPER^2 INGENIERO MEDICINA ECONOMIA MUJER HARVARD POSGRADO 12.58346 0.017376 -0.000711 0.188897 0.145605 0.093852 -0.091262 0.195579 0.031638 0.017261 0.002524 0.000100 0.012327 0.015941 0.012654 0.009088 0.020375 0.011118 729.0193 6.885542 -7.113170 15.32370 9.133909 7.416805 -10.04158 9.598800 2.845817 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0046 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.476313 0.469224 0.110915 7.270516 472.5676 1.944500 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 12.75184 0.152242 -1.545225 -1.479271 67.19209 0.000000 OTRAS FORMAS DE AFRONTAR LA HETEROCEDASTICIDAD: LAS SOLUCIONES “AD HOC” ______________________________________ Manual de Econometría. Capítulo 9, página 23 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC Se han sugerido otras soluciones prácticas para eliminar la heterocedasticidad, mediante ciertas transformaciones del modelo, entre las que destacan: a) Estimar el modelo con las variables en logaritmos b) Tomar valores relativos (porcentaje de gasto sobre la renta en lugar de la cifra de gasto en unidades monetarias) c) Emplear deflactores cuando los datos son temporales y corresponden a series largas d) Dividir la muestra en submuestras más homogéneas en cuanto al 'tamaño' de sus individuos y estimar por separado. Esos son procedimientos 'ad hoc' cuya justificación estadística se encuentra fácilmente. Por ejemplo, podría ocurrir que el modelo 'verdadero' fuera doble-log y la heterocedasticidad provocada por la especificación incorrecta de la relación, de ahí que al tomar logaritmos se corrija el problema. (Está el lector capacitadopara descubrir en qué casos las transformaciones b), c) y d) sugeridas pueden eliminar la heterocedasticidad?). 5. LOS MODELOS ARCH DE HETEROCEDASTICIDAD CONDICIONAL AUTOREGRESIVA Engle (1982) propuso una clase de modelos llamados genéricamente ARCH (Autoregressive Conditional Heterocedasticity) que han demostrado ser muy útiles para explicar el comportamiento de muchas series financieras, como las cotizaciones bursátiles o los tipos de cambio de las monedas y en general los ______________________________________ Manual de Econometría. Capítulo 9, página 24 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC 2 precios en mercados especulativos . Se trata de modelos para datos temporales que por construcción tienen varianzas condicionadas variables a lo largo del período muestral. El término 'condicional' se refiere al conjunto de información disponible en el momento t, es decir, a los datos históricos previos observados. Un modelo ARCH sencillo es el ARCH(1): Y t = δ Y t -1 + β X t + U t ; U t ~ N(0, ht ) Var( U t ) = ht = α 0 + α 1 U t2-1 La variable endógena depende de su propio valor con un retardo, en una regresión de Y contra sí misma por lo que recibe el nombre autoregresivo y de alguna/s exógenas. En este modelo, la varianza de la perturbación aleatoria en el momento t condicionada a la información disponible hasta el período anterior, depende del cuadrado de la propia perturbación en t-1 (de ahí que el orden de este sencillo modelo ARCH sea 1) y por tanto el modelo es heterocedástico, en la medida en que U va variando a lo largo del tiempo también lo hace la varianza ht. Los modelos ARCH se estiman por procedimientos iterativos de estimación no lineal. La propia existencia de efectos ARCH, es decir, de heterocedasticidad condicional, puede contrastarse mediante contrastes específicos que se pueden encontrar descritos en la literatura especializada. ───────────────────────────────────────────── Caso .- Un modelo ARCH para los rendimientos de la bolsa de Madrid A título ilustrativo, se presenta la salida de una estimación GARCH de los rendimientos de las acciones en la bolsa de Madrid. Los datos corresponden a cotizaciones diarias al IBEX35 desde el 28-03-96 al 21-09-99. El alumno puede consultar la ayuda el E-Views para interperetar esos resultados 2 Estos modelos se han generalizado a los GARCH, como el del ejemplo ______________________________________ Manual de Econometría. Capítulo 9, página 25 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC ───────────────────────────────────────────── CAPÍTULO 9. RESUMEN La heterocedasticidad consiste en que las varianzas de las perturbaciones difieren entre unidades muestrales o 'individuos'. Generalmente, surge en muestras transversales: a) cuando los individuos son agregados o promedios de unidades muestrales homocedásticas; b) cuando los individuos tienen 'tamaño' muy diferente (grandes empresas y PYMES en la misma muestra); c) cuando por error de especificación se ha estimado incorrectamente la forma funcional. Un caso frecuente ocurre cuando el modelo es doble-log y se estima una ecuación lineal. Surge también en modelos de precios en mercados especulativos, para datos temporales. En los modelos ARCH, que explican satisfactoriamente el comportamiento de cotizaciones bursátiles y tipos de cambio, la varianza de la perturbación Ut condicionada a la información disponible hasta t-1 depende de 2 ______________________________________ U t-1 y por tanto, al variar a lo largo de la muestra, es heterocedástica. Manual de Econometría. Capítulo 9, página 26 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 heterocedasticidad existen diversos contrastes. Su Pompeu hipótesis Catedrático Universidad Fabra 2 Universidad de Las Palmasque de GC homocedasticidad y difieren Catedrática en la hipótesis alternativa, Para detectar la nula siempre es puede ser más o menos general. Hemos estudiado los test de Goldfeld y Quandt y sus extensiones, el de Breusch y Pagan y el de White Los estimadores MCO de un modelo heterocedásticos son insesgados pero no óptimos. Para estimar su matriz de varianzas-covarianzas es recomendable emplear el estimador consistente de White, que aplica [7.3] sustituyendo los 2 elementos de Σ por los cuadrados de los residuos MCO e i. APENDICE 9.1 Si el verdadero modelo es log-lineal y se estima un modelo lineal, éste es heterocedástico. Demostración: El modelo verdadero, log-lineal, suponiendo sin pérdida de generalidad un solo regresor, es: 2 β Y i = α X i eu i ; ui _N (0,σ ) ln Y i = α ′ + β ln X i + ui con α ′ = ln α El modelo estimado es lineal en x. Queremos demostrar que su error, vi, es heterocedástico: Y i = γ 0 + γ 1 X i + vi i Puesto que ui es normal, eu sigue una distribución log-normal, con: 1 i E( eu ) = e 2 σ i 2 2 2 Var( eu ) = eσ ( eσ - 1) de forma que la esperanza del error del modelo estimado, vi, es: E( vi ) = E( Y i - γ 0 - γ 1 X i ) = E( α X iβ eui - γ 0 - γ 1 X i ) 1 = α X iβ e 2 σ - γ 0 - γ 1 X i 2 y su varianza resulta ser: ______________________________________ Manual de Econometría. Capítulo 9, página 27 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC Var( vi ) = E[ vi - E( vi ) ] 2 1 = E[ α X iβ eui - γ 0 γ 1 X i - α X iβ e 2 σ + γ 0 γ 1 X i ] 1 2 = E[ α X iβ ( eui - e 2 σ ) ] 2 2 = α 2 X i2 β eσ ( eσ - 1) 2 2 Vemos que vi es heterocedástica, ya que su varianza depende de los datos muestrales de la variable exógena Xi. Concretamente, si β>0 es una función creciente y si β<0 es una función decreciente de Xi. ______________________________________ Manual de Econometría. Capítulo 9, página 28 . 1 2 © Carlos Murillo Fort y Beatriz González López-Valcárcel (2000) 1 Catedrático Universidad Pompeu Fabra 2 Catedrática Universidad de Las Palmas de GC