Actividad 4: IC y Contraste de Hipótesis (1 y 2 poblac.) ACTIVIDAD 4: IC y Contraste de Hipótesis (1 y 2 poblac.) CASO 4-1: LÁMINAS DE ALUMINIO____________________________________ Sabemos que una determinada máquina produce láminas de aluminio cuya longitud sigue una distribución aproximadamente normal, cuya media debería ser de 40 cm y cuya desviación típica es de 0,4 cm. A fin de comprobar si la máquina funciona correctamente, el operario encargado de la misma toma, de forma periódica, muestras compuestas por 5 láminas cada una. La última de dichas muestras ha proporcionado los siguientes datos en cuanto a longitudes (en cm.) de las láminas: 40,1 39,2 39,4 39,8 39,0 La media de esta muestra es de 39,5 cm., valor que difiere de la media ideal. ¿Es esta diferencia estadísticamente significativa?, es decir: ¿se debe esta diferencia a fluctuaciones aleatorias o por el contrario debemos concluir que la máquina está funcionando mal? 1. Realizar un contraste de hipótesis para un nivel de significación α = 0,05. Tomaremos como hipótesis nula H0 : µ = 40 , y como hipótesis alternativa H1 : µ ≠ 40 Colocamos los datos anteriores en C1 y seleccionamos Stat > Basic Statistics > 1Sample Z : Z-Test Test of mu = 40,000 vs mu not = 40,000 The assumed sigma = 0,400 Variable C1 N 5 Mean 39,500 StDev 0,447 SE Mean 0,179 Z -2,80 P 0,0053 A4 - 1 Estadística Aplicada con Minitab Como el p-valor obtenido es de 0,0053 < 0,5 concluiremos que hay indicios suficientes como para pensar que la máquina no está funcionando correctamente. 2. Realizar un contraste similar suponiendo ahora que desconocemos σ. En este caso deberemos seleccionar Stat > Basic Statistics > 1-Sample t : T-Test of the Mean Test of mu = 40,000 vs mu not = 40,000 Variable C1 N 5 Mean 39,500 StDev 0,447 SE Mean 0,200 T -2,50 P 0,067 Observar que ahora p-valor = 0,067 > 0,05 . Por tanto, en caso de desconocer la desviación estándar deberíamos quedarnos con la hipótesis nula de que la media poblacional es de 40 pues no tenemos indicios suficientes como para rechazarla. A4 - 2 Actividad 4: IC y Contraste de Hipótesis (1 y 2 poblac.) CASO 4-2: ZAPATOS PARA CHICOS___________________________________ Una empresa productora de zapatos para chicos quiere comparar dos materiales, A y B, que se usan en la elaboración de las suelas. Para ello, selecciona 10 chicos y les entrega un par de zapatos, uno elaborado con suela tipo A y el otro con suela tipo B. Pasado un mes, se recogen los zapatos y se mide el nivel de desgaste de cada uno de ellos, obteniendo los siguientes resultados (a mayor número, mayor desgaste): Chico 1 2 3 4 5 6 7 8 9 10 1. Material A 13,2 8,2 10,9 14,3 10,7 6,6 9,5 10,8 8,8 13,3 Material B 14,0 8,8 11,2 14,2 11,8 6,4 9,8 11,3 9,3 13,6 Estudiar mediante un gráfico Plot la variabilidad existente entre los diferentes chicos (variabilidad entre muestras), comparándola con la variabilidad existente, para cada chico, entre los dos materiales (variabilidad dentro de cada muestra). Seleccionamos Graphs > Plot : Para visualizar mejor el gráfico, pulsaremos sobre Edit Attributes : A4 - 3 Estadística Aplicada con Minitab Ahora, para superponer ambos gráficos, pulsamos sobre Frame > Múltiple Graphs : El resultado será algo similar al siguiente: GRÁFICO DE DESGASTE VS CHICO SEGÚN MATERIAL material A material B 15 Desgaste de Materiales 14 13 12 11 10 9 8 7 6 0 1 2 3 4 5 6 7 8 9 10 Chicos El gráfico nos muestra una gran diferencia entre el desgaste entre chico y chico. Así, p.e., el chico 6 desgastó mucho menos las suelas que el chico 4. Por otra parte, para cada uno de los chicos, la diferencia entre los dos materiales no es demasiado grande. En resumen: observamos una gran variabilidad entre las diferentes muestras, mientras que la variabilidad dentro de cada muestra no parece muy significativa. Observar también lo siguiente: en 6 de los 10 casos los materiales A están por encima de los B mientras que en los 4 restantes están los dos muy juntos. A4 - 4 Actividad 4: IC y Contraste de Hipótesis (1 y 2 poblac.) 2. Construir una nueva columna con las diferencias entre C3 y C2. Hallar el intervalo de confianza a nivel del 95% para la media de dichas diferencias. Seleccionamos Calc > Calculator : Observar que con ello generamos una nueva columna formada por las diferencias entre las dos anteriores: Seleccionamos Stat > Basic Statistics > 1-Sample t : A4 - 5 Estadística Aplicada con Minitab T Confidence Intervals Variable C4 N 10 Mean 0,410 StDev 0,387 SE Mean 0,122 ( 95,0 % CI 0,133; 0,687) Podemos interpretar el resultado obtenido como: “estamos 95% seguros de que la diferencia media entre ambos materiales es un valor comprendido entre 0,133 y 0,687”. Observar que hubiéramos podido obtener este mismo intervalo sin necesidad de generar la columna C4: Seleccionamos Stat > Basic Statistics > Paired t : Paired T-Test and Confidence Interval Paired T for Material B - Material A Material Material Difference N 10 10 10 Mean 11,040 10,630 0,410 StDev 2,518 2,451 0,387 SE Mean 0,796 0,775 0,122 95% CI for mean difference: (0,133; 0,687) T-Test of mean difference = 0 (vs not = 0): T-Value = 3,35 0,009 P-Value = A4 - 6 Actividad 4: IC y Contraste de Hipótesis (1 y 2 poblac.) 3. Realizar un contraste de hipótesis, a un nivel de significación α = 0,05, para determinar si las dos medias muestrales son significativamente diferentes. El segundo método utilizado en el apartado 2 para hallar un intervalo de confianza también nos ha proporcionado el p-valor asociado al siguiente contraste de hipótesis bilateral para un nivel de significación α = 0,05: H0 : µA = µB vs. H1 : µA ≠ µB Dicho p-valor era de 0,009. Otra forma de obtener dicho p-valor sería plantearnos el contraste equivalente: H0 : µB-A = µB – µA = 0 vs. H1 : µB-A = µB - µA ≠ 0 Seleccionamos Stat > Basic Statistics > 1-Sample t : El resultado será: T-Test of the Mean Test of mu = 0,000 vs mu not = 0,000 Variable C4 N 10 Mean 0,410 StDev 0,387 SE Mean 0,122 T 3,35 P 0,0085 Observar que, nuevamente, el p-valor obtenido es de 0,009. Como dicho p-valor es menor que 0,05, hay indicios suficientes como para rechazar la hipótesis nula, i.e.: todo parece indicar que las dos medias son significativamente diferentes, lo que significa que los datos parecen apuntar a que material A es más resistente que el B. A4 - 7 Estadística Aplicada con Minitab CASO 4-3: ENFERMEDAD DE PARKINSON_____________________________ La enfermedad de Parkinson afecta, entre otras cosas, a la capacidad de hablar. Se realizó un estudio con enfermos de Parkinson en el cual ocho de los enfermos que participaron en el mismo recibieron el tratamiento médico habitual en estos casos. Este tratamiento pareció mejorar las condiciones generales de los pacientes, pero nos preguntamos sobre cómo afectó a su capacidad de hablar. A fin de dar un poco de luz sobre este tema, se les realizó un test de habla a los pacientes. Los resultados de dicho test se muestran a continuación (a mayor puntuación, mayores dificultades en el habla): Tratamiento 2,6 2,0 1,7 2,7 2,5 2,6 2,5 3,0 1. No tratamiento 1,2 1,8 1,8 2,3 1,3 3,0 2,2 1,3 1,5 1,6 1,3 1,5 2,7 2,0 Hallar el intervalo de confianza a nivel del 95% para la diferencia entre ambas medias muestrales. Contrastar, para α = 0,05, la hipótesis de que ambas medias coinciden. Seleccionamos Stat > Basic Statistics > 2-Samples t : A4 - 8 Actividad 4: IC y Contraste de Hipótesis (1 y 2 poblac.) Two Sample T-Test and Confidence Interval Two sample T for Tratamiento vs No tratamiento Tratamie No trata N 8 14 Mean 2,450 1,821 StDev 0,411 0,556 SE Mean 0,15 0,15 95% CI for mu Tratamie - mu No trata: ( 0,19; 1,07) T-Test mu Tratamie = mu No trata (vs not =): T = 3,02 18 P = 0,0073 DF = Obtenemos que, para un nivel de confianza del 95%, la diferencia entre ambas medias muestrales estará comprendida entre 0,19 y 1,07 (observar que este intervalo no contiene al 0, por lo que ya podemos deducir el que, para un α = 1 – 0,95 = 0,05, rechazaremos la hipótesis nula de que ambas medias son iguales). En cuanto al p-valor, éste es 0,0073 < 0,05 por lo que rechazaremos la hipótesis nula, i.e., hay indicios suficientes como para pensar que ambas medias difieren. 2. Contrastar, para α = 0,01, la hipótesis de que ambas medias coinciden frente a la hipótesis alternativa de que la media de los pacientes tratados es mayor. Seleccionamos Stat > Basic Statistics > 2-Samples t : Two Sample T-Test and Confidence Interval Two sample T for Tratamiento vs No tratamiento Tratamie No trata N 8 14 Mean 2,450 1,821 StDev 0,411 0,556 SE Mean 0,15 0,15 99% CI for mu Tratamie - mu No trata: ( 0,03; 1,23) T-Test mu Tratamie = mu No trata (vs >): T = 3,02 P = 0,0036 DF = 18 Observar que el p-valor obtenido es de 0,0036 < 0,01 por lo que, para este nivel de significación, rechazaremos la hipótesis nula de que ambas medias son iguales a favor de la hipótesis alternativa de que la media de los que han recibido tratamiento médico es mayor que la de los que no. En definitiva, parece pues que el tratamiento recibido tiene efectos negativos sobre la capacidad del habla. A4 - 9