Grado en Ciencias Ambientales - Estadística Práctica 2a (Variables Aleatorias) El número de huevos que pone una hembra de gorrión molinero (passer montanus) a lo largo de su vida sigue una distribución binomial de parámetros n=15 y p=0.16. Puesto que necesitamos trabajar con una distribución binomial B(15,0.16), y no con una muestra de datos, al arrancar Statgraphics aparecerá la siguiente pantalla: Debemos indicar que se desea “Realizar un Análisis que no Requiere Datos…” A continuación, seleccionar “Examinar una Distribución de Probabilidad”: Del menú que aparece a continuación, elegimos “Binomial”: Por defecto, SG trabaja con una binomial B(10, 0.1) (es decir, n=10, p=0.1) Lo que SG llama “probabilidad de evento”, es p, y lo que llama “número de ensayos”, n. Podemos cambiar esos valores con botón derecho + opciones de análisis. En nuestro caso, fijamos una probabilidad de evento de 0,16 (ojo, para los decimales debemos emplear una coma, no un punto) y un nº de ensayos de 15. 1. Calcula la probabilidad de que un individuo concreto ponga exactamente 3 huevos. Si llamamos X = “número de huevos puestos por la hembra”, que según el enunciado es B(15, 0.16), entonces nos están pidiendo P(X=3). Eso es lo que SG llama “probabilidad de masa”: Por defecto, SG proporciona P(X=0). Si lo que queremos es P(X=3), entonces botón derecho + opciones de ventana, y en “valores para la variable” introducimos 3. La probabilidad pedida es de 0.229997; en porcentaje, un 23% aprox. Distribución Acumulativa -----------------------Distribución: Binomial Variable 3 Area de cola inferior (<) Dist. 1 Dist. 2 0,560785 Dist. 3 Dist. 4 Dist. 5 Variable 3 Probabilidad de Masa (=) Dist. 1 Dist. 2 0,229997 Dist. 3 Dist. 4 Dist. 5 Variable 3 Area de cola Superior (>) Dist. 1 Dist. 2 0,209218 Dist. 3 Dist. 4 Dist. 5 2. Calcula la probabilidad de que ponga 4 huevos ó menos. Nos están pidiendo P(X ≤ 4) = P(X < 4) + P(X=4). Para ello, botón derecho + opciones de ventana, e introducimos en “valores para la variable” el valor 4. Ahora aparece: Distribución: Binomial Variable 4 Area de cola inferior (<) Dist. 1 Dist. 2 0,790782 Dist. 3 Dist. 4 Dist. 5 Variable 4 Probabilidad de Masa (=) Dist. 1 Dist. 2 0,131427 Dist. 3 Dist. 4 Dist. 5 Variable 4 Area de cola Superior (>) Dist. 1 Dist. 2 0,077791 Dist. 3 Dist. 4 Dist. 5 Arriba, donde dice “Área de cola inferior”, está P(X<4)=0.790782. En “Probabilidad de masa” aparece P(X=4) = 0.131427. Por lo tanto, basta con sumar ambas probabilidades (se puede hacer, por ejemplo, con la calculadora que lleva incorporada SG), casi debajo de la “Ayuda”. El resultado final es 0.922209, o si se prefiere una probabilidad del 92.2209%. 3. ¿A partir de qué valor está el 25% de los gorriones que menos huevos llegan a poner? En este caso se nos está pidiendo el valor “a” tal que P(X≤ a)=0.25. Obsérvese que se trata, de algún modo, del problema “inverso” al apartado anterior. Para resolver esta cuestión, botón amarillo (también llamado botón de opciones tabulares) + CDF inverso. En la pantalla aparecen, en CDF, los valores de distintas probabilidades, y en la columna llamada “Dist. 1”, los valores “a” correspondientes. Por ejemplo, se tiene que P(X≤0)=0.01, o que P(X≤1)=0.1. Lo que nosotros querríamos es que en la columna CDF apareciera el valor 0.25: en ese caso, el valor que apareciera en la columna Dist. 1, sería el valor “a” que estamos buscando. Para ello, botón derecho + Opciones de ventana, e introducimos, en CDF, el valor 0,25. El valor que aparece, entonces, es 1. Por lo tanto, el 25% de gorriones que pone menos huevos, pone 1 huevo, o ninguno. 4. Genera 100 números aleatorios según la distribución indicada (esta podría ser una muestra real de gorriones). Compara la distribución de frecuencias obtenida con la distribución de probabilidad que la ha originado. Sobre la muestra generada, ¿qué porcentaje de los gorriones han puesto 3 huevos? Activamos el botón “Guardar resultados”. Después, hacemos clic en la casilla “Números aleatorios para la distribución Dist1” y le damos el nombre que queramos a la Variable Destino. Lo que va a hacer SG es simular la extracción de una muestra de tamaño 100 de una población que siga exactamente una binomial como la que estamos considerando. Puesto que estamos tomando una muestra, lo que obtendremos no se corresponderá exactamente con la binomial, pero sí tendrá un comportamiento similar. Tras aceptar, veremos que en la hoja de datos se han generado 100 valores de una nueva variable (nosotros la hemos llamado ALEAT1). Sobre la muestra generada, ¿qué porcentaje de los gorriones han puesto 3 huevos? Para responder a la pregunta, por ejemplo acudimos a Descripción + Datos cualitativos + Tabulación (no es que la variable sea cualitativa, simplemente esta ruta es apropiada). Ahí vemos que la frecuencia relativa del valor 3 es 0.20, y en consecuencia, que un 20% de los gorriones de la muestra han puesto 3 huevos (IMPORTANTE: los datos que SG genera son aleatorios; por lo tanto, lo esperable es que a vosotros os queden otros datos, y otros resultados, aunque probablemente las cantidades serán parecidas). Observermos que en la pregunta 1 obtuvimos, para la población, una probabilidad de 23%; por lo tanto, hay obvias similitudes entre lo que se da en la población, y lo que aparece en la muestra. 5. ¿Cuál es el primer cuartil? La pregunta se refiere a la variable que hemos generado de forma aleatoria a partir de la distribución binomial. En consecuencia, Descripción + Datos Numéricos + Análisis Unidimensional; en Datos escribimos ALEAT1. El primer cuartil, en nuestro caso, es 1, que coincide con el ejercicio 3 (que respondía a esta pregunta, pero sobre la población). 6. Compara la media calculada sobre la binomial con la obtenida sobre la muestra. La media de nuestra muestra es 2.28 (la vuestra será probablemente diferente). La media de la población es n*p=15*0.16=2.4. De nuevo están cerca. 7. Haz lo mismo que en el apartado 4 pero sólo con 25 números. Con el botón “Guardar resultados” no podemos controlar el tamaño de la muestra aleatoria. Así que en este caso volvemos a la ventana de la distribución binomial, y activamos botón amarillo + números aleatorios. Ahí podemos cambiar el tamaño de la muestra. Después, procedemos como antes. El tiempo de vida de los gorriones sigue una distribución exponencial de media 3 años. 8. Calcula la probabilidad de que un gorrión viva más de 3 años. Vamos a Descripción + Distribuciones + Distribuciones de probabilidad, y elegimos “Exponencial” (en la columna de la izquierda, abajo del todo). Por defecto, SG trabaja con una exponencial de media 10; para cambiar la media, botón derecho + opciones de análisis, y la cambiamos a 3. Nos están pidiendo P(X>3). Como por defecto aparecen cálculos relativos al valor 0, botón derecho + opciones de ventana, y en valores para la variable introducimos 3. En este caso, la probabilidad que nos piden aparece en lo que SG llama “Área de cola superior”, y su valor es de 0.367879. La probabilidad P(X<3) aparece en “Área de cola superior”. Lo que SG llama “Densidad de probabilidad” es el valor de la función de densidad para x=3, y NO TIENE NINGUN SIGNIFICADO EN TÉRMINOS DE PROBABILIDAD. Distribución Acumulativa -----------------------Distribución: Exponencial Variable 3 Area de cola inferior (<) Dist. 1 Dist. 2 0,632121 Dist. 3 Dist. 4 Dist. 5 Variable 3 Densidad de Probabilidad Dist. 1 Dist. 2 0,122626 Dist. 3 Dist. 4 Dist. 5 Variable 3 Area de cola Superior (>) Dist. 1 Dist. 2 0,367879 Dist. 3 Dist. 4 Dist. 5 Por lo tanto, la prob. Pedida es del 36.79% 9. ¿A partir de qué tiempo de vida está el 10% de los gorriones más longevos? Nos preguntan el valor “a” tal que P(X>a)=0,10. En consecuencia, botón amarillo de opciones tabulares + CDF inverso. Inversa CDF ----------Distribución: Exponencial CDF 0,01 0,1 0,5 0,9 0,99 Dist. 1 0,030151 0,316082 2,07944 6,90776 13,8155 Dist. 2 Dist. 3 Dist. 4 Dist. 5 El valor pedido es 6.9 (es decir, unos 7 años). 10. Genera aleatoriamente una muestra de 100 tiempos de vida según la distribución especificada y compara el histograma obtenido sobre la muestra con la función de densidad de la exponencial. Botón Guardar resultados + activar la casilla de “Guardar números aleatorios para Dist. 1” + dar nombre a la variable (en nuestro caso, el nombre es ALEAT2). Puesto que los números son aleatorios, los resultados serán diferentes en cada caso. Para visualizar el histograma de la muestra aleatoria generada, Descripción + Datos Numéricos + Análisis Unidimensional + Datos = ALEAT2. Después, botón de opciones gráficas + histograma. En nuestro caso, el histograma obtenido es: Histograma frecuencia 50 40 30 20 10 0 -1 3 7 11 15 19 23 ALEAT2 Nótese que el histograma recuerda la forma de la función de densidad de la exponencial (asimetría a la derecha muy acusada, con los datos concentrados a la izquierda del histograma) 11. Comprueba qué porcentaje de la muestra llega a superar los 3 años de edad. Calcula el decil 9 y compáralo con el punto crítico obtenido en el apartado 9. Compara la media y varianza de la distribución exponencial con las obtenidas sobre la muestra. ¿Qué coeficiente de asimetría presentan los datos generados? El porcentaje se obtiene con botón amarillo+ Tabla de frecuencias+botón derecho+opciones de ventana+límite superior=3. El decil 9 (percentil 90) de la muestra se calcula con botón amarillo + percentiles. En nuestro caso es de 7.55, mientras que en el apartado 9 se proporcionaba un valor próximo a 7. Resumen Estadístico para ALEAT2 Frecuencia = 100 Media = 3,26595 Mediana = 2,34497 Moda = Varianza = 9,26614 Desviación típica = 3,04403 Mínimo = 0,0336664 Máximo = 18,202 Rango = 18,1683 Primer cuartil = 1,01572 Segundo cuartil = 4,73506 Rango intercuar. = 3,71934 Asimetría = 1,75987 Asimetría tipi. = 7,18466 Curtosis = 4,79433 Curtosis típificada = 9,78638 Coef. de variación = 93,205% La media muestral es 3.26, similar al valor de la media de la exponencial (3); la varianza muestral es 9.27, similar a la varianza poblacional (9; nótese que la desviación típica y la media de una distribución exponencial son iguales, y en consecuencia la varianza es la media al cuadrado). El coeficiente de asimetría es de 1.76, y el de asimetría tipificado es de 7.18, revelando una asimetría a la derecha muy acusada (en particular, no aceptable para una distribución normal, por ejemplo). 12. Si tenemos 10 gorriones, ¿qué probabilidad hay de que exactamente 4 de ellos vivan más de 3 años? Para contestar a esto, tendríamos que calcular, en una binomial B(10,0.367879) (nótese que el valor p=0.367879 corresponde a la probabilidad calculada en el ejercicio 8), la probabilidad P(X=4). El valor pedido es 0.245381.