Matemáticas Contrastes de Hipótesis CONTRASTES DE HIPÓTESIS Resumen 1) Contrastes de Hipótesis Estadísticas Un contraste de hipótesis es un procedimiento para saber si los datos de una muestra avalan el valor que suponemos que tiene un parámetro poblacional. 2) Procedimiento El procedimiento, una vez extraída la muestra, consiste en: 1) Se realiza una afirmación sobre el valor del parámetro poblacional objeto de estudio. A esta afirmación se le llama Hipótesis nula. Se la designa por H0. La H0 se formula mediante los signos =, ≤ ó , pero nunca ≠ ni < ni >. Por ejemplo: H0 : = 10. Al mismo tiempo, se formula la Hipótesis alternativa, que recogerá una afirmación contraria a la nula. Se la designa por H1. Lo que afirma H1 puede ser exactamente lo contrario de H0 o, según las condiciones del problema, otra situación incompatible con H0. Por ejemplo: H1: 10. 2) Se escoge el estadístico de contraste, a partir de un estimador del parámetro objeto de estudio cuya distribución es conocida. Hay un estadístico de contraste específico para cada tipo de parámetro poblacional objeto de estudio. Por ejemplo, si estudiamos la media poblacional , el estadístico de contraste estará basado en x , cuyo valor es un estimador del valor de (su valor se aproxima al de ). El estadístico de contraste es una variable aleatoria, pues su valor depende de la muestra, que es aleatoria. Siempre trabajaremos con estadísticos que tendrán una distribución Normal si sabemos que la población que estudiamos también es Normal. En caso contrario, aplicaremos el Teorema Central del Límite que, para tamaños muestrales mayores o iguales que 30, permite suponer que la distribución es Normal con resultados aceptables. La distribución de dicho estadístico la tendremos si suponemos cierta la afirmación realizada en H0. Por ejemplo, si H0 : = 10 y trabajamos con tamaño muestral n = 50, si conocemos que = 3 x N 10; 3 / 100 = N(10; 0.3). Nótese que precisamos conocer . Si no es así y las muestras son de tamaño mayores o iguales que 30, podría estimarse por la cuasidesviación típica muestral. El estadístico de contraste se toma tipificado: su distribución será una N(0; 1). x 0 Por ejemplo, el estadístico de contraste cuando H0 : = 0 es: Z = N(0;1). / n 3) Se elige el nivel de significación . Éste valor será la probabilidad de que, con los datos de la muestra, se acepte que lo válido es H1. O sea, que supuesta cierta la H0, la muestra aporte datos tan discrepantes como para rechazar que sea realmente cierta: = P(H1 / H0) Se llama nivel de confianza a 1 – (probabilidad de aceptar H0, supuesta cierta H0: el contraste se construye con esta suposición): 1 – = P(H0 / H0). IES Fernando de Herrera – Prof. R. Mohigefer http://www.e-matematicas.es Página 1 de 4 Matemáticas Contrastes de Hipótesis 4) A partir se construye la región de aceptación: RA, y / o su complementaria, la región crítica: RC. Como son complementarias, conocida una, tendremos la otra. Si el valor del estadístico de contraste está en la región de aceptación, daremos como válida la hipótesis nula H0 con un nivel de confianza 1 – . Y si está en la región crítica, aceptaremos H1 con un nivel de significación . La región de aceptación depende de que el contraste sea bilateral o unilateral. El contraste es bilateral si la H0 se formula con un =. Por ejemplo: H0 : = 10. Si lo que afirma H0 es válido, el estadístico de contraste, que está tipificado, tomará valores cercanos a su media, que es 0. Sólo si los valores están muy alejados de 0 hay que suponer que H0 no puede darse por válida, porque las diferencias no se deben al azar. Por tanto: RA = (–z/2, z/2), siendo P(–z/2 Z z/2) = 1 – Como: P(–z/2 Z z/2) = P(Z z/2) – P(Z –z/2) = (por simetría de la Normal) = P(Z z/2) – P(Z z/2) = (por suceso contrario) = P(Z z/2) – [1 – P(Z z/2)] = = 2 P(Z z/2) – 1 se tiene que: P(–z/2 Z z/2) = 1 – 2 P(Z z/2) – 1 = 1 – P(Z z/2) = 1 – /2 El contraste es unilateral si H0 se formula con un ó . Si contiene un (ej: H0 : 10), habrá que dar como válida H0 si los valores del estadístico de contraste están por debajo de 0 o si rebasan un poco, pero de forma que dicho exceso deba a factores aleatorios. En este caso: RA = (–, z), siendo P(Z z) = 1 – Si contiene un (ej: H0 : 10), habrá que dar como válida H0 si los valores del estadístico de contraste están por encima de 0 o si rebasan un poco por debajo, pero de forma se deba a factores aleatorios. En este caso: RA = (–z , +), siendo P(Z –z) = 1 – P(Z z) = 1 – IES Fernando de Herrera – Prof. R. Mohigefer http://www.e-matematicas.es Página 2 de 4 Matemáticas Contrastes de Hipótesis 3) Estadísticos de contraste Contraste para la media poblacional Como siempre, suponemos que la muestra procede de una población Normal o que n 30. x 0 Z= / n siendo: 0 el valor contenido en la hipótesis nula x la media muestral n el tamaño de la muestral la desviación típica de la población, que debemos conocer. Si no se conoce pero n 30, puede estimarse por la cuasidesviación típica muestral. Contraste para la proporción de una distribución Binomial Suponemos n 30: pˆ p0 Z= p0 q0 n siendo: p0 el valor contenido en la hipótesis nula, y q0 = 1 – p0. p̂ la proporción muestral n el tamaño de la muestral Contraste para la diferencia de medias poblacionales Como siempre, suponemos que las dos muestras proceden de poblaciones Normales o que sus tamaños son mayores o iguales a 30. H0 : 1 – 2 = 0 H1 : 1 – 2 0 x1 x2 Z= 12 n1 22 n2 siendo: x1 y x 2 las medias muestrales n1 y n2 los tamaños de las muestras 1 y 2 las desviaciones típicas de las poblaciones, que debemos conocer. Si no se conocen las desviaciones típicas poblacionales pero los tamaños muestrales son mayores o iguales que 30, para ambas muestras, pueden estimarse por las cuasidesviaciones típicas muestrales. 4) Errores Error de Tipo I: Se comete cuando el contraste decide rechazar H0 cuando en realidad es cierta. Es decir: = P(H1 / H0). Coincide con el nivel de significación. Error de Tipo II: Se comete cuando no rechazamos H0 cuando en realidad es falsa. Es decir: = P(H0 / H1). IES Fernando de Herrera – Prof. R. Mohigefer http://www.e-matematicas.es Página 3 de 4 Matemáticas Contrastes de Hipótesis Potencia del contraste es 1 – = P(H1 / H1). Podemos disminuir el error de tipo I tanto como queramos, pero esto hace que aumente el error de tipo II. Pero al agrandar el tamaño de la muestra n, disminuye el error de tipo II. No siempre puede calcularse la potencia del contraste: sólo cuando la hipótesis alternativa no se limita a negar la hipótesis nula, sino que realiza una cuantificación del valor del parámetro que se estudia. Cuando se intenta disminuir el error de tipo I (disminuyendo el valor de ), aumenta el error de tipo II. La forma de disminuir ambos a la vez es aumentar el tamaño muestral n. IES Fernando de Herrera – Prof. R. Mohigefer http://www.e-matematicas.es Página 4 de 4