Muestreo Tema 1 1. Muestreo 2. Muestreo aleatorio 3. Tipos de

Anuncio
Universidad Autónoma de Madrid
Muestreo
1
Tema 1
1. Muestreo
2. Muestreo aleatorio
3. Tipos de muestreo aleatorio
3.1. Muestreo aleatorio sin reposición
3.2. Muestreo aleatorio con reposición
(muestreo aleatorio simple)
3.3. Muestreo aleatorio en población infinita
(muestreo aleatorio simple)
4. Distribución muestral
4.1. Distribución muestral de la media
4.2. Distribución muestral de la proporción
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
2
1. Muestreo
Población
Parámetros (fijos)
µ: media
σ2 : varianza
π : probabilidad
Inferencia:
Estimación
Contraste
Muestreo
Muestra
Estadísticos (variables o aleatorios)
X : media
Sn2 : varianza
P : proporción
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
3
Muestreo: Proceso de obtención de una
muestra procedente de una población
Muestreo aleatorio: Todos los elementos
de la población tienen la misma
probabilidad de aparecer en la muestra. Se
denomina muestra aleatoria
Ejemplo.
Población:
Persona
A
B
C
Edad
1
2
3
N =3
1+ 2 + 3
µ=
=2
3
12 + 2 2 + 3 2
2
σ =
− 2 2 = 0,67
3
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
4
3. Tipos de muestreo aleatorio
3.1. Muestreo aleatorio sin reposición
Los elementos no son devueltos a la
población. Sólo pueden aparecer una vez
en la muestra.
N!
Número de muestras V
N ,n =
( N − n )!
posibles:
Ejemplo
Población: N=3.
Elementos = (1, 2, 3) µ = 2, σ 2 = 0,67
Muestras con n = 2
Muestra
1
2
3
4
5
6
X1
1
1
2
2
3
3
Análisis de Datos en Psicología II
X2
2
3
1
3
1
2
V N ,n
N!
3!
=
= =6
( N − n )! 1!
X
1,5
2,0
1,5
2,5
2,0
2,5
Sn2
0,25
1
0,25
0,25
1
0,25
Prob.
1/6
1/6
1/6
1/6
1/6
1/6
Tema 1
Universidad Autónoma de Madrid
5
3.2. Muestreo aleatorio con reposición
Los elementos son devueltos a la
población.
Pueden aparecer más de una vez en la
muestra.
Muestreo aleatorio simple (muestreo
aleatorio)
Número de muestras posibles:
V Nn = N n
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
6
Ejemplo
µ=2
σ 2 = 0,67
Población: N = 3
Muestras: n = 2
Elementos = (1, 2, 3)
N n = 32 = 9
Muestra
1
2
3
4
5
6
7
8
9
X1
1
1
1
2
2
2
3
3
3
Análisis de Datos en Psicología II
X2
1
2
3
1
2
3
1
2
3
X
1
1,5
2
1,5
2
2,5
2
2,5
3
Sn2
0
0,25
1
0,25
0
0,25
1
0,25
0
Prob.
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
1/9
Tema 1
Universidad Autónoma de Madrid
7
3. 3. Muestreo aleatorio en población
infinita
• Se asume que la población tiene
infinitos elementos.
• El número de posibles muestras es
infinito.
• Muestreo aleatorio simple:
1. Con reposición.
2. En población infinita.
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
8
4. Distribución muestral
Distribución de un estadístico en todas las
posibles muestras de tamaño n que es
posible extraer de una población
Ejemplo. Muestreo sin reposición
Muestra
1
2
3
4
5
6
X f (X)
1,5 2/6
2 2/6
2,5 2/6
Sn2 f ( Sn2 )
0,25 4/6
1
2/6
X1
1
1
2
2
3
3
X2
2
3
1
3
1
2
E ( X ) = 1,5
X
1,5
2,0
1,5
2,5
2,0
2,5
2
+2
2
6
6
Var ( X ) = 0,166
Sn2
0.25
1
0,25
0,25
1
0,25
+ 2,5
2
6
Prob.
1/6
1/6
1/6
1/6
1/6
1/6
=2
E ( S n2 ) = 0,5
Var ( S n2 ) = 0,125
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
9
4.1. Distribución muestral de la media
Se asume muestreo aleatorio simple
2
2
E
(
X
)
=
µ
σ
=
σ
y X
.
Sea X una variable con
Se cumple que:
E( X ) = µ
σ X2 =
σ2
n
Además:
Si X es normal o si
n es grande (aún no siendo X normal)
X es normal ( µ , σ /
n)
Por tanto
Z=
X −µ
σ/ n
X es normal (0,1)
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
10
Distribución muestral de la media con σ2
desconocida
En caso de que se desconozca σ2 puede
calcularse:
T
=
=
X −µ
Sn / n − 1
X −µ
S n −1 / n
Cuya distribución es t con n-1 grados de
libertad
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
11
Ejemplo
La variable ‘edad de la clase’ tiene µ=20 y
σ2=2. Asumiendo que X es normal:
a) Tomamos todas las posibles muestras
de n=4 y calculamos X . Obtener E(X ) y
σ X2
b) Obtener la probabilidad de encontrar un
sujeto con X > 22
c) Obtener la probabilidad de encontrar una
muestra con X > 22
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
12
a)
E ( X ) = µ = 20
σ
2
X
σ2
2
=
= = 0,5
n
4
b)
Z=
X −µ
σ
22 − 20
=
= 1,41
2
P ( X > 22 ) = P ( Z > 1, 41 ) = 0 , 0793
c)
X − µ 22 − 20
Z=
=
= 2,83
2/ 4
σ/ n
P ( X > 22 ) = P ( Z > 2 ,83 ) = 0 , 0023
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
13
4.2. Distribución muestral de la proporción
n variables dicotómicas: X1, X2, ..., Xn
E (Xi) = π
Var (Xi) = π (1− π )
Ejemplo. El 20% de los pasajeros de un
avión tienen fobia. Si se toma un pasajero
al azar:
E (Xi) = π = 0,2
Var (Xi) = π (1− π ) = 0,2 (0,8) = 0,16
Suma:
X = X1 + L + X n =
n
∑X
i =1
i
Proporción: P = X / n
Ejemplo. Si hay tres pasajeros, uno con
fobia y dos que no:
X = X1 + X 2 + X 3 = 1
X 1
= = 0,33
P=
n 3
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
14
El valor esperado y varianza de X y P son:
E ( X ) = nπ
σ X2 = nπ (1 − π )
E (P ) = π
π (1 − π )
2
σP =
n
Ejemplo. Entre tres pasajeros, cabe esperar
que tengan fobia:
E ( X ) = nπ = 3(0,2) = 0,6
σ X2 = nπ (1 − π ) = 3(0,2)0,8 = 0,48
Proporción con fobia:
E ( P ) = π = 0,2
π (1 − π ) 0,2(0,8)
2
σP =
=
= 0,05
n
3
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
15
Muestras pequeñas: X es binomial (n, π)
Muestras grandes (n>25):
nπ (1 − π ) )
X es normal (nπ,
P es normal (π,
Z
π (1 − π ) / n )
=
=
X − nπ
nπ (1 − π )
P −π
π (1 − π ) / n
Es normal (0, 1)
Ejemplo. La probabilidad de que haya más
de 30 con fobia en un avión de 100
pasajeros es:
X − nπ
30 − 100(0,2)
Z=
=
= 2,5
nπ (1 − π )
100(0,2)0,8
P (Z ≥ 2,5) = 0,0062
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
16
0,60
Binomial (3, 0,2)
0,50
E (X) = nπ
= 3(0,2)
= 0,6
f (x)
0,40
0,30
Var(X) = nπ(1-π)
= 3(0,2)0,8
= 0,48
0,20
0,10
0,00
0
1
2
3
X
0,20
Binomial (30, 0,2)
f (x)
0,15
E (X) = nπ
= 30(0,2)
=6
0,10
Var(X) = nπ(1-π)
= 30(0,2)0,8
= 4,8
0,05
0,00
0
5
10
15
20
25
30
X
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
17
Ejemplo
Un sujeto responde al azar un examen de
5 preguntas, cada una con 5 alternativas.
a) Obtener n y π.
b) Obtener E (X1) y σ2X1
c) Obtener E (X), σ2X, E (P) y σ2P
d) Obtener P (X ≤ 3)
e) Obtener P (P > 0,4)
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
18
a)
n=5
π = 1/5 = 0,2
b)
E (X1) = π = 0,2
σ2X1 = π (1-π) = 0,2(0,8) = 0,16
c)
E (X) = nπ = 5(0,2) = 1
σ2X = nπ(1−π) = 5(0,2)0,8 = 0,8
E (P) = π = 0,2
σ2P = π (1−π)/n = 0,2(0,8) / 5 = 0,023
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
19
d) Binomial (5, 0,2), P (X ≤ 3) = 0,993
Z=
X − nπ
3 −1
=
= 2,24
nπ (1 − π )
0,8
P (X ≤ 3) = P (Z ≤ 2,24) = 0,9875
e)
P = X / n; 0,4 = X / 5; X = 2
Binomial (5, 0,2),
P (X > 2) = 1 - P (X ≤ 2) = 1 - 0,942 = 0,058
Z=
P −π
0,4 − 0,2
=
= 1,32
π (1 − π ) / n
0,023
P (P > 0,4) = P (Z > 1,32) = 0,0934
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
20
Formulario del tema 1
Muestreo aleatorio sin reposición:
V N ,n
N!
=
( N − n )!
Muestreo aleatorio con reposición:
V Nn = N n
Distribución muestral de la media:
X −µ
Z=
σ/ n
Z ~ Normal (0, 1)
T
=
=
X −µ
Sn / n − 1
X −µ
S n −1 / n
T ~ tn-1
Análisis de Datos en Psicología II
Tema 1
Universidad Autónoma de Madrid
21
Distribución muestral de la proporción:
Z
=
=
Análisis de Datos en Psicología II
X − nπ
nπ (1 − π )
P −π
π (1 − π ) / n
Tema 1
Universidad Autónoma de Madrid
22
Ejercicios recomendados del libro
1.1
1.2
1.3
1.4
1.5
1.9
1.15
1.16
Análisis de Datos en Psicología II
Tema 1
Descargar