Universidad Autónoma de Madrid Muestreo 1 Tema 1 1. Muestreo 2. Muestreo aleatorio 3. Tipos de muestreo aleatorio 3.1. Muestreo aleatorio sin reposición 3.2. Muestreo aleatorio con reposición (muestreo aleatorio simple) 3.3. Muestreo aleatorio en población infinita (muestreo aleatorio simple) 4. Distribución muestral 4.1. Distribución muestral de la media 4.2. Distribución muestral de la proporción Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 2 1. Muestreo Población Parámetros (fijos) µ: media σ2 : varianza π : probabilidad Inferencia: Estimación Contraste Muestreo Muestra Estadísticos (variables o aleatorios) X : media Sn2 : varianza P : proporción Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 3 Muestreo: Proceso de obtención de una muestra procedente de una población Muestreo aleatorio: Todos los elementos de la población tienen la misma probabilidad de aparecer en la muestra. Se denomina muestra aleatoria Ejemplo. Población: Persona A B C Edad 1 2 3 N =3 1+ 2 + 3 µ= =2 3 12 + 2 2 + 3 2 2 σ = − 2 2 = 0,67 3 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 4 3. Tipos de muestreo aleatorio 3.1. Muestreo aleatorio sin reposición Los elementos no son devueltos a la población. Sólo pueden aparecer una vez en la muestra. N! Número de muestras V N ,n = ( N − n )! posibles: Ejemplo Población: N=3. Elementos = (1, 2, 3) µ = 2, σ 2 = 0,67 Muestras con n = 2 Muestra 1 2 3 4 5 6 X1 1 1 2 2 3 3 Análisis de Datos en Psicología II X2 2 3 1 3 1 2 V N ,n N! 3! = = =6 ( N − n )! 1! X 1,5 2,0 1,5 2,5 2,0 2,5 Sn2 0,25 1 0,25 0,25 1 0,25 Prob. 1/6 1/6 1/6 1/6 1/6 1/6 Tema 1 Universidad Autónoma de Madrid 5 3.2. Muestreo aleatorio con reposición Los elementos son devueltos a la población. Pueden aparecer más de una vez en la muestra. Muestreo aleatorio simple (muestreo aleatorio) Número de muestras posibles: V Nn = N n Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 6 Ejemplo µ=2 σ 2 = 0,67 Población: N = 3 Muestras: n = 2 Elementos = (1, 2, 3) N n = 32 = 9 Muestra 1 2 3 4 5 6 7 8 9 X1 1 1 1 2 2 2 3 3 3 Análisis de Datos en Psicología II X2 1 2 3 1 2 3 1 2 3 X 1 1,5 2 1,5 2 2,5 2 2,5 3 Sn2 0 0,25 1 0,25 0 0,25 1 0,25 0 Prob. 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 Tema 1 Universidad Autónoma de Madrid 7 3. 3. Muestreo aleatorio en población infinita • Se asume que la población tiene infinitos elementos. • El número de posibles muestras es infinito. • Muestreo aleatorio simple: 1. Con reposición. 2. En población infinita. Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 8 4. Distribución muestral Distribución de un estadístico en todas las posibles muestras de tamaño n que es posible extraer de una población Ejemplo. Muestreo sin reposición Muestra 1 2 3 4 5 6 X f (X) 1,5 2/6 2 2/6 2,5 2/6 Sn2 f ( Sn2 ) 0,25 4/6 1 2/6 X1 1 1 2 2 3 3 X2 2 3 1 3 1 2 E ( X ) = 1,5 X 1,5 2,0 1,5 2,5 2,0 2,5 2 +2 2 6 6 Var ( X ) = 0,166 Sn2 0.25 1 0,25 0,25 1 0,25 + 2,5 2 6 Prob. 1/6 1/6 1/6 1/6 1/6 1/6 =2 E ( S n2 ) = 0,5 Var ( S n2 ) = 0,125 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 9 4.1. Distribución muestral de la media Se asume muestreo aleatorio simple 2 2 E ( X ) = µ σ = σ y X . Sea X una variable con Se cumple que: E( X ) = µ σ X2 = σ2 n Además: Si X es normal o si n es grande (aún no siendo X normal) X es normal ( µ , σ / n) Por tanto Z= X −µ σ/ n X es normal (0,1) Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 10 Distribución muestral de la media con σ2 desconocida En caso de que se desconozca σ2 puede calcularse: T = = X −µ Sn / n − 1 X −µ S n −1 / n Cuya distribución es t con n-1 grados de libertad Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 11 Ejemplo La variable ‘edad de la clase’ tiene µ=20 y σ2=2. Asumiendo que X es normal: a) Tomamos todas las posibles muestras de n=4 y calculamos X . Obtener E(X ) y σ X2 b) Obtener la probabilidad de encontrar un sujeto con X > 22 c) Obtener la probabilidad de encontrar una muestra con X > 22 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 12 a) E ( X ) = µ = 20 σ 2 X σ2 2 = = = 0,5 n 4 b) Z= X −µ σ 22 − 20 = = 1,41 2 P ( X > 22 ) = P ( Z > 1, 41 ) = 0 , 0793 c) X − µ 22 − 20 Z= = = 2,83 2/ 4 σ/ n P ( X > 22 ) = P ( Z > 2 ,83 ) = 0 , 0023 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 13 4.2. Distribución muestral de la proporción n variables dicotómicas: X1, X2, ..., Xn E (Xi) = π Var (Xi) = π (1− π ) Ejemplo. El 20% de los pasajeros de un avión tienen fobia. Si se toma un pasajero al azar: E (Xi) = π = 0,2 Var (Xi) = π (1− π ) = 0,2 (0,8) = 0,16 Suma: X = X1 + L + X n = n ∑X i =1 i Proporción: P = X / n Ejemplo. Si hay tres pasajeros, uno con fobia y dos que no: X = X1 + X 2 + X 3 = 1 X 1 = = 0,33 P= n 3 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 14 El valor esperado y varianza de X y P son: E ( X ) = nπ σ X2 = nπ (1 − π ) E (P ) = π π (1 − π ) 2 σP = n Ejemplo. Entre tres pasajeros, cabe esperar que tengan fobia: E ( X ) = nπ = 3(0,2) = 0,6 σ X2 = nπ (1 − π ) = 3(0,2)0,8 = 0,48 Proporción con fobia: E ( P ) = π = 0,2 π (1 − π ) 0,2(0,8) 2 σP = = = 0,05 n 3 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 15 Muestras pequeñas: X es binomial (n, π) Muestras grandes (n>25): nπ (1 − π ) ) X es normal (nπ, P es normal (π, Z π (1 − π ) / n ) = = X − nπ nπ (1 − π ) P −π π (1 − π ) / n Es normal (0, 1) Ejemplo. La probabilidad de que haya más de 30 con fobia en un avión de 100 pasajeros es: X − nπ 30 − 100(0,2) Z= = = 2,5 nπ (1 − π ) 100(0,2)0,8 P (Z ≥ 2,5) = 0,0062 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 16 0,60 Binomial (3, 0,2) 0,50 E (X) = nπ = 3(0,2) = 0,6 f (x) 0,40 0,30 Var(X) = nπ(1-π) = 3(0,2)0,8 = 0,48 0,20 0,10 0,00 0 1 2 3 X 0,20 Binomial (30, 0,2) f (x) 0,15 E (X) = nπ = 30(0,2) =6 0,10 Var(X) = nπ(1-π) = 30(0,2)0,8 = 4,8 0,05 0,00 0 5 10 15 20 25 30 X Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 17 Ejemplo Un sujeto responde al azar un examen de 5 preguntas, cada una con 5 alternativas. a) Obtener n y π. b) Obtener E (X1) y σ2X1 c) Obtener E (X), σ2X, E (P) y σ2P d) Obtener P (X ≤ 3) e) Obtener P (P > 0,4) Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 18 a) n=5 π = 1/5 = 0,2 b) E (X1) = π = 0,2 σ2X1 = π (1-π) = 0,2(0,8) = 0,16 c) E (X) = nπ = 5(0,2) = 1 σ2X = nπ(1−π) = 5(0,2)0,8 = 0,8 E (P) = π = 0,2 σ2P = π (1−π)/n = 0,2(0,8) / 5 = 0,023 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 19 d) Binomial (5, 0,2), P (X ≤ 3) = 0,993 Z= X − nπ 3 −1 = = 2,24 nπ (1 − π ) 0,8 P (X ≤ 3) = P (Z ≤ 2,24) = 0,9875 e) P = X / n; 0,4 = X / 5; X = 2 Binomial (5, 0,2), P (X > 2) = 1 - P (X ≤ 2) = 1 - 0,942 = 0,058 Z= P −π 0,4 − 0,2 = = 1,32 π (1 − π ) / n 0,023 P (P > 0,4) = P (Z > 1,32) = 0,0934 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 20 Formulario del tema 1 Muestreo aleatorio sin reposición: V N ,n N! = ( N − n )! Muestreo aleatorio con reposición: V Nn = N n Distribución muestral de la media: X −µ Z= σ/ n Z ~ Normal (0, 1) T = = X −µ Sn / n − 1 X −µ S n −1 / n T ~ tn-1 Análisis de Datos en Psicología II Tema 1 Universidad Autónoma de Madrid 21 Distribución muestral de la proporción: Z = = Análisis de Datos en Psicología II X − nπ nπ (1 − π ) P −π π (1 − π ) / n Tema 1 Universidad Autónoma de Madrid 22 Ejercicios recomendados del libro 1.1 1.2 1.3 1.4 1.5 1.9 1.15 1.16 Análisis de Datos en Psicología II Tema 1