TEMA: DISTRIBUCIONES MUESTRALES Los ejercicios, tablas y problemas planteados en estas diapositivas fueron tomadas del libro: Introducción a la probabilidad y estadística de Mendenhall Beaver Planes muestrales y diseños experimentales La forma en que una muestra se selecciona recibe el nombre de plan muestral o diseño experimental y determina la cantidad de información de la muestra. Saber el plan muestral empleado en una situación particular permitirá medir la confiabilidad de la inferencia. Muestreo aleatorio simple: Si una muestra de n elementos se selecciona de entre una población de N elementos, usando un plan muestral en el que cada una de las posibles muestras tiene la misma probabilidad de selección, entonces se dice que el muestreo es aleatorio y la muestra resultante es una muestra aleatoria simple. Planes muestrales y diseños experimentales Al efectuar un estudio muestral se presentan con frecuencia algunos problemas: • No respuesta • Cobertura demasiado baja • Sesgo verbal Se han diseñado métodos para resolver algunos de estos problemas, pero sólo si usted sabe que existen. Si su encuesta está sesgada por cualquiera de estos problemas, entonces sus conclusiones no serán muy confiables, aunque haya seleccionado una muestra aleatoria. Además del muestreo aleatorio simple, hay otros planes muestrales con carácter aleatorio y, por tanto, dan una base probabilista para hacer inferencias. Tres de esos planes están basados en muestreo estratificado, conglomerado y sistemático Planes muestrales y diseños experimentales Un muestreo aleatorio estratificado comprende seleccionar una muestra aleatoria simple de cada uno de un número dado de subpoblaciones o estratos. Una muestra de conglomerados es una simple muestra aleatoria tomada de los conglomerados disponibles en la población. Una muestra aleatoria sistemática 1 en k involucra la selección aleatoria de uno de los primeros k elementos de una población ordenada y luego la selección sistemática de cada k-ésimo elemento de ahí en adelante. Estadística y distribuciones muestrales Cuando se selecciona una muestra aleatoria de una población, las medidas numéricas descriptivas que se calculen de la muestra se denominan estadísticas. Las estadísticas varían o cambian para cada muestra aleatoria diferente que se escoja. Las distribuciones de probabilidad para estadísticas se llaman distribuciones muestrales porque en muestreos repetidos, dan esta información: • Qué valores de la estadística pueden presentarse • Con qué frecuencia se presenta cada valor Definición: La distribución muestral de una estadística es la distribución de probabilidad para los posibles valores de la estadística, que resulta cuando muestras aleatorias de tamaño n se sacan repetidamente de la población. Teorema del limite central: El teorema del límite central dice que, bajo condiciones más bien generales, las sumas y medias de muestras aleatorias de mediciones tomadas de una población tienden a tener una distribución aproximadamente normal. Distribución de la media muestral Si la media poblacional μ es desconocida, se pueden seleccionar varias estadísticas como estimador; la media muestral 𝑥ҧ y la mediana muestral m son dos que con facilidad puede seleccionarse. • Si una muestra aleatoria de n mediciones se selecciona de una población con media μ y desviación estándar s, la distribución muestral de la media muestral 𝑥ҧ tendrá media μ y desviación estándar 𝜎 𝑠= 𝑛 • Si la población tiene una distribución normal, la distribución muestral de 𝑥ҧ estará exactamente distribuida en forma normal, cualquiera que sea el tamaño muestral n. • Si la distribución poblacional es no normal, la distribución muestral de 𝑥ҧ estará distribuida normalmente en forma aproximada para muestras grandes (por el teorema del límite central). Distribución de la media muestral Error estándar: Definición: La desviación estándar de una estadística empleada como estimador de un parámetro poblacional también se denomina error estándar del estimador (abreviado SE) porque se refiere a la precisión 𝜎 denomina. Por tanto, la desviación estándar de 𝑥ҧ , dada por , se conoce 𝑛 como error estándar de la media (abreviada SE(𝑥)ҧ o sólo SE). Distribución de la media muestral ¿Cómo calcular las probabilidades para la media muestral 𝑥? ҧ 1. Encuentre μ y calcule SE (𝑥)= ҧ 𝜎 𝑛 2. Escriba el evento de interés en términos de 𝑥ҧ y localice el área apropiada en la curva normal. 3. Convierta los valores necesarios de 𝑥ҧ en valores z usando: 𝑥ҧ − 𝜇 𝑧= σ 4. Use la tabla 3 del apéndice I para calcular la probabilidad. Distribución de la media muestral Ejercicios: 1. En el último año, el peso de los recién nacidos en una maternidad se ha distribuido según una ley normal de media μ = 3100 g y desviación típica σ = 150 g. ¿Cuál será la probabilidad de que la media de una muestra de 100 recién nacidos sea superior a 3130 g? 2. Supongamos que la estatura media de las alumnas de un instituto es de 165 cm, con desviación típica de 8 cm. a) Halla los parámetros de una media muestral de tamaño n = 36. b) ¿Cuál es la probabilidad de que una muestra de 36 alumnas tenga una media de 167 cm o más centímetros? 3. Suponga que se selecciona una muestra aleatoria de n=25 observaciones de entre una población que está distribuida normalmente, con media igual a 106 y desviación estándar igual a 12. a) Dé la media y desviación estándar de la distribución muestral de la media muestral 𝑥.ҧ B) Encuentre la probabilidad de que 𝑥ҧ exceda de 110. c) Encuentre la probabilidad de que la media muestral se desvíe de la media poblacional μ=106 en no más de 4. Distribución de la media muestral Ejercicios: 1. Para simular la distribución muestral de 𝑥,ҧ hemos seleccionado 50 muestras más de tamaño n=10 con restitución y hemos calculado las correspondientes medias muestrales. Construya un histograma de frecuencia relativa para estos 50 valores de 𝑥.ҧ ¿Cuál es la forma de esta distribución? 2. Las estaturas de 1000 estudiantes se distribuyen aproximadamente de forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 de esta población y las medias se registran al décimo de centímetro más cercano, determine a) la media y la desviación estándar de la distribución muestral; b) La probabilidad de que las medias muestrales este entre 172.5 y 175.8 centímetros; c) la probabilidad de que la media muestral este por debajo de 172.0 centímetros.