UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.1. El ANOVA de múltiples factores: - Factorial (ortogonal): los no ortogonales no los veremos - Factores fijos, aleatorios y mixtos (consecuencias prácticas) - El Anova encajado La variable que vamos a estudiar (dependiente) = valor de HDL en sangre Igual número de réplicas en cada combinación de los dos factores: Los factores: Enfermo/Sano Fumador/No fumador Muestra 1 (10 enfermos): Muestra 2 (10 sanos): Enfermo Fumador 5 casos No fumador 5 casos Sano 5 casos 5 casos Porcentage de HDL en sangre No fumador Fumador 120, 116, 114, 117, 114, 112, 107, 110, 111, 113 107, 108, 105, 107, 106, 111, 111 110, 111, 110 1 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.2. El ANOVA de dos factores fijos: - Ejemplo y datos - Interpretación unifactorial versus multifactorial (las interacciones) - La importancia de las interacciones Los 2 factores y la interacción Factor Enfermedad I.C. 95% 115.00 Vicio ] 112.50 ] 107.50 HDL HDL 110.00 112 Fumador No Fumador ] 116 ] Sano Enfermedad Funifactorial = 12,14** 114.00 112.00 ] ] 110.00 ] 108.00 108 Enfermo Factor Vicio HDL Muestra 1 (10 enfermos): Muestra 2 (10 sanos): Porcentage de HDL en sangre No fumador Fumador 120, 116, 114, 117, 114, 112, 107, 110, 111, 113 107, 108, 105, 107, 106, 111, 111 110, 111, 110 ] Fumador 104 Enfermo Sano Enfermedad Fenfermedad Fvicio Finteracción = 135,17*** = 0,03ns = 35,17*** no Fumador Vicio Funifactorial = 0,20ns 2 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.2. El ANOVA de dos factores fijos: - Descripción de los posibles efectos: . Enfermedad (E); Vicio (V) e interacción (I) 116 Vicio Vicio Vicio Fumador No Fumador Fumador No Fumador Fumador No Fumador 116 ] ] ] 116 ] ] ENS VNS INS 108 104 Enfermo HDL ] ] 112 108 104 Sano E*** VNS INS ] 108 104 ] ] ENS V*** INS Enfermo Vicio Fumador No Fumador Sano Enfermedad ] 116 HDL HDL 112 Sano 112 Vicio Vicio Fumador No Fumador Fumador No Fumador 108 ] 104 Enfermo Sano Enfermedad ] ] ] Enfermo Enfermedad ] ] ] ENS VNS I*** ] 104 Enfermo Enfermedad 116 112 108 Sano Enfermedad 116 HDL 112 HDL HDL ] E*** V*** INS ] 112 ] 108 ] ] 104 Enfermo ENS V*** I*** Sano Enfermedad 3 Tema V. EL ANOVA multifactorial UNIVERSIDAD DE VIGO 5.2. El ANOVA de dos factores fijos: - Las fórmulas son una extensión del ANOVA unifactorial - Se aplican igual para dos o más factores… No fumador (1) Enfermos (1): xab1, xab2, xab3,… xabn Sanos (a): xab1, xab2, xab3,… xabn Fumador (b) xab1, xab2, xab3,… xabn xab1, xab2, xab3,… xabn 4 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.2. El ANOVA de dos factores fijos: - Los componentes de varianza y el test estadísticos: . La mayoría de los PROGRAMAS aplican el modelo III (no se corrigen) . Realización del test No fumador (1) Enfermos (1): xab1, xab2, xab3,… xabn Sanos (a): xab1, xab2, xab3,… xabn Factores Enfermedad (E) Vicio (V) Interacción (EV) Residuo (w) Enfermedad (E) Vicio (V) Interacción (I= ExV) 1 Residuo Total Fumador (b) xab1, xab2, xab3,… xabn xab1, xab2, xab3,… xabn Componentes CME = CMV = CMEV = CMw = Test σ2w + bnσ2E/(a-1) σ2w + anσ2V/(b-1) σ2w + nσ2EV σ2w Gl 1 1 115 16 19 SC 115 3,2 115 52,4 CM 115 3,2 115 3,27 CME/CMw CMV/CMw CMEV/CMw Test F 115/3,3 = 35*** 3,2/3,3 = 0,9ns 115/3,3 = 35*** 5 Tema V. EL ANOVA multifactorial 5.2. El ANOVA de dos factores fijos: - El test estadístico (modelo I): . Salida de software especializado (SPSS/PC) Variable dependiente: HDL Fuente Modelo corregido Intersección Enfermedad Vicio Enfermedad * Vicio Error Total Total corregida Suma de cuadrados tipo I 233.600a 246420.000 115.200 3.200 115.200 52.400 246706.000 286.000 gl 3 1 1 1 1 16 20 19 Media cuadrática 77.867 246420.000 115.200 3.200 115.200 3.275 F 23.776 75242.748 35.176 .977 35.176 Significación .000 .000 .000 .338 .000 a. R cuadrado = .817 (R cuadrado corregida = .782) ¡En cualquier caso la interacción es importante! 6 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.2. El ANOVA de dos factores fijos: - La magnitud de los efectos (uso de los eta2): . Comparación de dos factores significativos Enfermedad Vicio Enfermedad * Vicio Error Factores Enfermedad (E) Vicio (V) Interacción (EV) Residuo (w) 115.200 3.200 115.200 52.400 1 1 1 16 Componentes Test CME = σ2w + bnσ2E/(a-1) CMV = σ2w + anσ2V/(b-1) CMEV = σ2w + nσ2EV CMw = σ2w CME/CMw CMV/CMw CMEV/CMw 115.200 3.200 115.200 3.275 35.176 .977 35.176 .000 .338 .000 eta2EV = (CMEV – CMw) = 22,4 n eta2E = (CME – CMw)(a-1) = 11,2 bn Efecto EV >> Efecto E ] HDL 116 112 ] ¡La interacción es de hecho LO MÁS IMPORTANTE! ] 108 ] 104 Enfermo Sano Enfermedad 7 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.3. El ANOVA de dos factores aleatorios y mixto: - Si imaginamos otro ejemplo con distintos factores: . Aleatorio: la evaluación de los componentes E (aleatorio) V (aleatorio) . Mixto: la evaluación de los componentes E (fijo) V (aleatorio) - Se pueden deducir los componentes de cualquier ANOVA, a partir del sencillo - Los software comerciales realizan estos cálculos automáticamente - Se pueden estimar los componentes de la varianza (de forma parecida a los eta2) ANOVA aleatorio Factores Enfermedad (E) Vicio (V) Interacción (EV) Residuo (w) Componentes CME = CMV = CMEV = CMw = σ2w + nσ2EV + bnσ2E/(b-1) σ2w + nσ2EV + anσ2V/(a-1) σ2w + nσ2EV σ2w Test CME/CMEV CMV/CMEV CMEV/CMw ANOVA mixto Factores Enfermedad (E) Vicio (V) Interacción (EV) Residuo (w) Componentes CME = CMV = CMEV = CMw = σ2w + nσ2EV + bnσ2E/(a-1) σ2w + anσ2V σ2w + nσ2EV σ2w Test CME/CMEV CMV/CMw CMEV/CMw 8 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.3. El ANOVA de dos factores aleatorio y mixto: - El ejemplo anterior pero analizado mediante modelos mixto ó aleatorio: Porcentage de HDL en sangre No fumador Fumador 120, 116, 114, 117, 114, 112, 107, 110, 111, 113 107, 108, 105, 107, 106, 111, 111 110, 111, 110 Muestra 1 (10 enfermos): Muestra 2 (10 sanos): ANOVA aleatorio p Fuente Intersección Enfermedad Vicio Enfermedad * Vicio Hipótesis Error Hipótesis Error Hipótesis Error Hipótesis Error Suma de cuadrados tipo I 246420.000 3.200 115.200 115.200 3.200 115.200 115.200 52.400 a. MS(Vicio) b. MS(Enfermedad * Vicio) c. MS(Error) gl 1 1 1 1 1 1 1 16 Media cuadrática F 246420.000 77006.250 3.200a 115.200 1.000 b 115.200 3.200 .028 b 115.200 115.200 35.176 c 3.275 Significación .002 .500 .895 .000 El mixto es muy parecido FV = 3,2/3,27 9 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.4. El ANOVA de dos factores encajado: - En algunos casos interesa la variación de un factor superpuesta a la variación en otro - Factores encajados: los niveles dentro de cada tratamiento no son idénticos Datos Antiguos No fumador Enfermos: 120, 116, 114, 117, 114, Sanos: 107, 108, 105, 107, 106, Fumador 112, 107, 110, 111, 113 111, 111 110, 111, 110 Datos Nuevos Enfermos Sanos Año 1 Año 2 Año 1 Año 2 120 116 114 117 114 112 107 110 111 113 107 108 105 107 106 111 111 110 111 110 Año 1 y Año 2 no serían los mismos, necesariamente, en Enfermos y Sanos…. 10 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.4. El ANOVA de dos factores encajado: - La partición de un ANOVA encajado: Enfermedad (Fijo), Año (encajado) E (FIJO) y A (FIJO) Factores Enfermedad (E) Año (A) Interacción (EA) Residuo (w) G.L. S.C. a-1 SCE b-1 SCA (a-1)(b-1) SCEA ab(n-1) SCw Componentes Test CME = σ2w + bnσ2E/(a-1) CMA = σ2w + anσ2A/(b-1) CMEA = σ2w + nσ2EA CMw = σ2w CME/CMw CMA/CMw CMEA/CMw E (FIJO) y A (ENCAJADO) Factores Enfermedad (E) Año (A(E)) Residuo (w) G.L. S.C. Componentes Test a-1 a(b-1) ab(n-1) SCE SCA+SCEA SCw CME = σ2w+ nσ2A+bnσ2E/(a-1) CME/CMA CMA = σ2w+ nσ2A CMA/CMw 2 CMw= σ w 11 UNIVERSIDAD DE VIGO Tema V. EL ANOVA multifactorial 5.4. El ANOVA de dos factores encajado: - El ejemplo Datos Nuevos Enfermos Sanos Año 1 Año 2 Año 1 Año 2 120 116 114 117 114 112 107 110 111 113 107 108 105 107 106 111 111 110 111 110 Enfermedad Año Enfermedad * Año Error Enfermedad (E) Año (A(E)) Residuo Total 115.200 3.200 115.200 52.400 1 1 1 16 Gl 1 2 16 19 SC 115 118,4 52,4 115.200 3.200 115.200 3.275 CM 115 59,2 3,27 35.176 .977 35.176 .000 .338 .000 Test F 115/59,2 = 1,9ns 59,2/3,3 = 18,1*** Los efectos de la enfermedad no son reales si se promedian en años diferentes 12 Tema V. EL ANOVA multifactorial UNIVERSIDAD DE VIGO 5.5. El ANOVA de más de dos factores: - No hay límite teórico, pero muchos diseños no son prácticos - Hay que evaluar los grados de libertad del numerador y denominador (test F) 13 Referencias Bibliográficas UNIVERSIDAD DE VIGO LIBROS: Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York Underwood, A.J. 1981. Techniques of analysis of variance in experimental marine biology and ecology. Oceanogr. Mar. Biol. Ann. Rev., 19: 513-605. PÁGINAS WEB: http://www.provalisresearch.com/simstat/simstatv.html (Ejemplo de software aplicado de estadística que se puede descargar gratis por 30 días) 14