Tema V. EL ANOVA multifactorial 5.1. El ANOVA de múltiples

Anuncio
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.1. El ANOVA de múltiples factores:
- Factorial (ortogonal): los no ortogonales no los veremos
- Factores fijos, aleatorios y mixtos (consecuencias prácticas)
- El Anova encajado
La variable que vamos a estudiar (dependiente) = valor de HDL en sangre
Igual número de réplicas en cada combinación
de los dos factores:
Los factores:
Enfermo/Sano
Fumador/No fumador
Muestra 1 (10 enfermos):
Muestra 2 (10 sanos):
Enfermo
Fumador
5 casos
No fumador
5 casos
Sano
5 casos
5 casos
Porcentage de HDL en sangre
No fumador
Fumador
120, 116, 114, 117, 114,
112, 107, 110, 111, 113
107, 108, 105, 107, 106,
111, 111 110, 111, 110
1
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.2. El ANOVA de dos factores fijos:
- Ejemplo y datos
- Interpretación unifactorial versus multifactorial (las interacciones)
- La importancia de las interacciones
Los 2 factores y la
interacción
Factor Enfermedad
I.C. 95%
115.00
Vicio
]
112.50
]
107.50
HDL
HDL
110.00
112
Fumador
No Fumador
]
116
]
Sano
Enfermedad
Funifactorial = 12,14**
114.00
112.00
]
]
110.00
]
108.00
108
Enfermo
Factor Vicio
HDL
Muestra 1 (10 enfermos):
Muestra 2 (10 sanos):
Porcentage de HDL en sangre
No fumador
Fumador
120, 116, 114, 117, 114,
112, 107, 110, 111, 113
107, 108, 105, 107, 106,
111, 111 110, 111, 110
]
Fumador
104
Enfermo
Sano
Enfermedad
Fenfermedad
Fvicio
Finteracción
= 135,17***
= 0,03ns
= 35,17***
no Fumador
Vicio
Funifactorial = 0,20ns
2
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.2. El ANOVA de dos factores fijos:
- Descripción de los posibles efectos:
. Enfermedad (E); Vicio (V) e interacción (I)
116
Vicio
Vicio
Vicio
Fumador
No Fumador
Fumador
No Fumador
Fumador
No Fumador
116
]
]
]
116
]
]
ENS
VNS
INS
108
104
Enfermo
HDL
]
]
112
108
104
Sano
E***
VNS
INS
]
108
104
]
]
ENS
V***
INS
Enfermo
Vicio
Fumador
No Fumador
Sano
Enfermedad
]
116
HDL
HDL
112
Sano
112
Vicio
Vicio
Fumador
No Fumador
Fumador
No Fumador
108
]
104
Enfermo
Sano
Enfermedad
]
]
]
Enfermo
Enfermedad
]
]
]
ENS
VNS
I***
]
104
Enfermo
Enfermedad
116
112
108
Sano
Enfermedad
116
HDL
112
HDL
HDL
]
E***
V***
INS
]
112
]
108
]
]
104
Enfermo
ENS
V***
I***
Sano
Enfermedad
3
Tema V. EL ANOVA multifactorial
UNIVERSIDAD DE VIGO
5.2. El ANOVA de dos factores fijos:
- Las fórmulas son una extensión del ANOVA unifactorial
- Se aplican igual para dos o más factores…
No fumador (1)
Enfermos (1): xab1, xab2, xab3,… xabn
Sanos
(a): xab1, xab2, xab3,… xabn
Fumador (b)
xab1, xab2, xab3,… xabn
xab1, xab2, xab3,… xabn
4
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.2. El ANOVA de dos factores fijos:
- Los componentes de varianza y el test estadísticos:
. La mayoría de los PROGRAMAS aplican el modelo III (no se corrigen)
. Realización del test
No fumador (1)
Enfermos (1): xab1, xab2, xab3,… xabn
Sanos
(a): xab1, xab2, xab3,… xabn
Factores
Enfermedad (E)
Vicio (V)
Interacción (EV)
Residuo (w)
Enfermedad (E)
Vicio (V)
Interacción (I= ExV) 1
Residuo
Total
Fumador (b)
xab1, xab2, xab3,… xabn
xab1, xab2, xab3,… xabn
Componentes
CME =
CMV =
CMEV =
CMw =
Test
σ2w + bnσ2E/(a-1)
σ2w + anσ2V/(b-1)
σ2w + nσ2EV
σ2w
Gl
1
1
115
16
19
SC
115
3,2
115
52,4
CM
115
3,2
115
3,27
CME/CMw
CMV/CMw
CMEV/CMw
Test F
115/3,3 = 35***
3,2/3,3 = 0,9ns
115/3,3 = 35***
5
Tema V. EL ANOVA multifactorial
5.2. El ANOVA de dos factores fijos:
- El test estadístico (modelo I):
. Salida de software especializado (SPSS/PC)
Variable dependiente: HDL
Fuente
Modelo corregido
Intersección
Enfermedad
Vicio
Enfermedad * Vicio
Error
Total
Total corregida
Suma de
cuadrados
tipo I
233.600a
246420.000
115.200
3.200
115.200
52.400
246706.000
286.000
gl
3
1
1
1
1
16
20
19
Media
cuadrática
77.867
246420.000
115.200
3.200
115.200
3.275
F
23.776
75242.748
35.176
.977
35.176
Significación
.000
.000
.000
.338
.000
a. R cuadrado = .817 (R cuadrado corregida = .782)
¡En cualquier caso la interacción es importante!
6
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.2. El ANOVA de dos factores fijos:
- La magnitud de los efectos (uso de los eta2):
. Comparación de dos factores significativos
Enfermedad
Vicio
Enfermedad * Vicio
Error
Factores
Enfermedad (E)
Vicio (V)
Interacción (EV)
Residuo (w)
115.200
3.200
115.200
52.400
1
1
1
16
Componentes
Test
CME = σ2w + bnσ2E/(a-1)
CMV = σ2w + anσ2V/(b-1)
CMEV = σ2w + nσ2EV
CMw = σ2w
CME/CMw
CMV/CMw
CMEV/CMw
115.200
3.200
115.200
3.275
35.176
.977
35.176
.000
.338
.000
eta2EV = (CMEV – CMw) = 22,4
n
eta2E = (CME – CMw)(a-1) = 11,2
bn
Efecto EV >> Efecto E
]
HDL
116
112
]
¡La interacción es de hecho LO MÁS IMPORTANTE!
]
108
]
104
Enfermo
Sano
Enfermedad
7
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.3. El ANOVA de dos factores aleatorios y mixto:
- Si imaginamos otro ejemplo con distintos factores:
. Aleatorio: la evaluación de los componentes E (aleatorio) V (aleatorio)
. Mixto: la evaluación de los componentes E (fijo) V (aleatorio)
- Se pueden deducir los componentes de cualquier ANOVA, a partir del sencillo
- Los software comerciales realizan estos cálculos automáticamente
- Se pueden estimar los componentes de la varianza (de forma parecida a los eta2)
ANOVA aleatorio
Factores
Enfermedad (E)
Vicio (V)
Interacción (EV)
Residuo (w)
Componentes
CME =
CMV =
CMEV =
CMw =
σ2w + nσ2EV + bnσ2E/(b-1)
σ2w + nσ2EV + anσ2V/(a-1)
σ2w + nσ2EV
σ2w
Test
CME/CMEV
CMV/CMEV
CMEV/CMw
ANOVA mixto
Factores
Enfermedad (E)
Vicio (V)
Interacción (EV)
Residuo (w)
Componentes
CME =
CMV =
CMEV =
CMw =
σ2w + nσ2EV + bnσ2E/(a-1)
σ2w + anσ2V
σ2w + nσ2EV
σ2w
Test
CME/CMEV
CMV/CMw
CMEV/CMw
8
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.3. El ANOVA de dos factores aleatorio y mixto:
- El ejemplo anterior pero analizado mediante modelos mixto ó aleatorio:
Porcentage de HDL en sangre
No fumador
Fumador
120, 116, 114, 117, 114,
112, 107, 110, 111, 113
107, 108, 105, 107, 106,
111, 111 110, 111, 110
Muestra 1 (10 enfermos):
Muestra 2 (10 sanos):
ANOVA aleatorio
p
Fuente
Intersección
Enfermedad
Vicio
Enfermedad
* Vicio
Hipótesis
Error
Hipótesis
Error
Hipótesis
Error
Hipótesis
Error
Suma de
cuadrados
tipo I
246420.000
3.200
115.200
115.200
3.200
115.200
115.200
52.400
a. MS(Vicio)
b. MS(Enfermedad * Vicio)
c. MS(Error)
gl
1
1
1
1
1
1
1
16
Media
cuadrática
F
246420.000 77006.250
3.200a
115.200
1.000
b
115.200
3.200
.028
b
115.200
115.200
35.176
c
3.275
Significación
.002
.500
.895
.000
El mixto es muy parecido FV = 3,2/3,27
9
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.4. El ANOVA de dos factores encajado:
- En algunos casos interesa la variación de un factor superpuesta a la variación en otro
- Factores encajados: los niveles dentro de cada tratamiento no son idénticos
Datos Antiguos
No fumador
Enfermos: 120, 116, 114, 117, 114,
Sanos:
107, 108, 105, 107, 106,
Fumador
112, 107, 110, 111, 113
111, 111 110, 111, 110
Datos Nuevos
Enfermos
Sanos
Año 1
Año 2
Año 1
Año 2
120
116
114
117
114
112
107
110
111
113
107
108
105
107
106
111
111
110
111
110
Año 1 y Año 2 no serían los mismos, necesariamente, en Enfermos y Sanos….
10
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.4. El ANOVA de dos factores encajado:
- La partición de un ANOVA encajado: Enfermedad (Fijo), Año (encajado)
E (FIJO) y A (FIJO)
Factores
Enfermedad (E)
Año (A)
Interacción (EA)
Residuo (w)
G.L.
S.C.
a-1
SCE
b-1
SCA
(a-1)(b-1) SCEA
ab(n-1) SCw
Componentes
Test
CME = σ2w + bnσ2E/(a-1)
CMA = σ2w + anσ2A/(b-1)
CMEA = σ2w + nσ2EA
CMw = σ2w
CME/CMw
CMA/CMw
CMEA/CMw
E (FIJO) y A (ENCAJADO)
Factores
Enfermedad (E)
Año (A(E))
Residuo (w)
G.L.
S.C.
Componentes
Test
a-1
a(b-1)
ab(n-1)
SCE
SCA+SCEA
SCw
CME = σ2w+ nσ2A+bnσ2E/(a-1) CME/CMA
CMA = σ2w+ nσ2A
CMA/CMw
2
CMw= σ w
11
UNIVERSIDAD DE VIGO
Tema V. EL ANOVA multifactorial
5.4. El ANOVA de dos factores encajado:
- El ejemplo
Datos Nuevos
Enfermos
Sanos
Año 1
Año 2
Año 1
Año 2
120
116
114
117
114
112
107
110
111
113
107
108
105
107
106
111
111
110
111
110
Enfermedad
Año
Enfermedad * Año
Error
Enfermedad (E)
Año (A(E))
Residuo
Total
115.200
3.200
115.200
52.400
1
1
1
16
Gl
1
2
16
19
SC
115
118,4
52,4
115.200
3.200
115.200
3.275
CM
115
59,2
3,27
35.176
.977
35.176
.000
.338
.000
Test F
115/59,2 = 1,9ns
59,2/3,3 = 18,1***
Los efectos de la enfermedad no son reales si se promedian en años diferentes
12
Tema V. EL ANOVA multifactorial
UNIVERSIDAD DE VIGO
5.5. El ANOVA de más de dos factores:
- No hay límite teórico, pero muchos diseños no son prácticos
- Hay que evaluar los grados de libertad del numerador y denominador (test F)
13
Referencias Bibliográficas
UNIVERSIDAD DE VIGO
LIBROS:
Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York
Underwood, A.J. 1981. Techniques of analysis of variance in
experimental marine biology and ecology. Oceanogr. Mar.
Biol. Ann. Rev., 19: 513-605.
PÁGINAS WEB:
http://www.provalisresearch.com/simstat/simstatv.html
(Ejemplo de software aplicado de estadística que se puede descargar gratis por 30 días)
14
Descargar