Estadística para la toma de decisiones ESTADÍSTICA PARA LA TOMA DE DECISIONES. Sesión No. 4 Nombre: Estadística descriptiva: Medidas numéricas. Parte II Objetivo Al término de la sesión el estudiante calculará las medidas de dispersión para datos no agrupados, a través de la solución de ejercicios para practicar los cálculos de rango, varianza, desviación estándar y coeficiente de correlación. Contextualización En esta sesión aprenderás a calcular las medidas estadísticas de dispersión y concentración. A través de diferentes medidas de dispersión tales como el rango, la varianza y la desviación estándar aprenderemos a interpretar el conjunto de datos que se tiene para el estudio. Y con ello a interpretar la concentración de datos que se tiene en la distribución. Fuente: http://www.cetic.edu.ve/files/imagecache/imagen_CED/imagen_ficha/medidas_dispersion.gif 1 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Introducción al Tema “Las medidas de tendencia central ofrecen una idea aproximada del comportamiento de una serie estadística. No obstante, no resultan suficientes para expresar sus características: una misma media puede provenir de valores cercanos a la misma o resultar de la confluencia de datos estadísticos enormemente dispares. Para conocer en qué grado las medidas de tendencia central son representativas de la serie, se han de complementar con medidas de dispersión como la varianza o la desviación típica.” 1 1 (s.f.). Medidas de dispersión. Recuperado de: http://www.hiru.com/matematicas/medidas-de-dispersion 2 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Explicación Medidas de dispersión. Además de las medidas de centralización y de posición, suele ser útil considerar las medidas de dispersión, las cuales pueden definirse como los valores numéricos cuyo objetivo es analizar el grado de separación de éstos de una distribución estadística con respecto a las medidas de tendencia central consideradas. Ahora mostraremos el estudio de algunas medidas más usadas y sus fórmulas: Rango: 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 Rango intercuartílico: 𝐼𝑄𝑅 = 𝑄3 − 𝑄1 Varianza Poblacional: 𝜎 2 = Varianza muestral: 𝑠 2 = ∑(𝑥𝑖 −𝜇)2 𝑁 ∑(𝑥𝑖 −𝑥̅ )2 𝑛−1 Desviación estándar muestral: 𝑠 = √𝑠 2 Desviación estándar poblacional: 𝜎 = √𝜎 2 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 Coeficiente de variación: 𝑐𝑣 = � 𝑚𝑒𝑑𝑖𝑎 � 𝑋100% Ejemplo 1. Para la serie de números 27, 84, 9, 40, 49, 84, 70, 93. Calcular el rango, varianza, desviación estándar y coeficiente de variación. Rango: 𝑅 = 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟 = 93 − 9 = 84 Para el cálculo de la varianza primeramente se calcula el promedio de los datos: Media: 𝑥̅ = 27+84+9+40+49+84+70+93 8 = 57 3 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Varianza muestral: 𝑠2 = ∑(𝑥𝑖 −𝑥̅ )2 𝑛−1 s2= 925.71 = (27−57)2 +(84−57)2 +(9−57)2 +(40−57)2 +(49−57)2 +(84−57)2 +(70−57)2 +(93−57)2 7 Desviación estándar. Muestral: 𝑠 = √𝑠 2 = √925.71 = 30.4255 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖𝑜𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 Coeficiente de variación: 𝑐𝑣 = � CV = 53.38% 𝑚𝑒𝑑𝑖𝑎 30.4255 � 100% = � 57 � 100 Ejemplo 2. Se tienen dos grupos universitarios de ocho personas y se desea comparar dichos grupos en el número de errores obtenidos por cada uno de sus ocho integrantes; al aplicarles una prueba que consta de 20 reactivos. Tabla 1 Grupo A Grupo B x =5 x =5 ~ x =5 ~ x =5 xˆ = 5 xˆ = 5 Observe en la Tabla 1 que aparentemente no hay diferencia entre el Grupo A y el Grupo B, pero si se observan detenidamente los datos iniciales que se presentan en la Tabla 2 se observará que ambos grupos no son iguales. 4 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Tabla 2 Puntuación más baja Puntuación más alta Grupo A Grupo B 1 3 1 4 2 5 5 5 5 5 5 5 9 6 12 7 Puntuación más baja Puntuación más alta En la Tabla 2 se observa que los errores del Grupo A se dispersan más que los del Grupo B, que parecen concentrarse alrededor del valor promedio (5). ¿Qué ocurre? ¿Por qué la medida de tendencia central, en este caso la media aritmética, no nos da suficiente información acerca de estos resultados? Porque es necesario contar con algo que señale la dispersión o desviación respecto a la media aritmética; en otras palabras, conocer la densidad de los datos, es decir, cuán concentrados se encuentran, cuán homogéneos son, o qué variados están dichos datos. Rango (R) Para el Grupo A es: R = 12 - 1 = 11 puntos de variación Para el Grupo B es: R = 7 - 3 = 4 puntos de variación 5 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Grupo A x−x Grupo B x−x (x − x )2 (x − x )2 1–5=–4 (– 4)2 = 16 3–5=–2 (– 2)2 = 4 1–5=–4 (– 4)2 = 16 4–5=–1 (– 1)2 = 1 2–5=–3 (– 3)2 = 9 5–5=0 (0)2 = 0 5–5=0 (0)2 = 0 5–5=0 (0)2 = 0 5–5=0 (0)2 = 0 5–5=0 (0)2 = 0 5–5=0 (0)2 = 0 5–5=0 (0)2 = 0 9–5=4 (4)2 = 16 6–5=1 (1)2 = 1 12 – 5 = 7 (7)2 = 49 7–5=2 (2)2 = 4 106 2 10 (x − x)2 106 106 ∑ = = = 15.14 = n −1 8 −1 7 Varianza del grupo A es: s Varianza del grupo B es: s2 = 10 10 = = 1.42 8 −1 7 Desviación estándar del grupo A es: s = s2 = 15.14 = 3.89 Desviación estándar del grupo B es: s = 1.42 = 1.19 Coeficiente de variación (CV) El coeficiente de variación o de Pearson, expresa la proporción en la que la media aritmética no es representativa del conjunto de datos de donde proviene. 6 ESTADÍSTICA PARA LA TOMA DE DECISIONES. 7 Coeficiente de variación para el Grupo A es: CV = s 3.89 (100) = (100) = 77.8% x 5 (Mayor porcentaje es menos representativa la media) Es decir, se tiene un 77.8% de que la media no es representativa del Grupo A. Coeficiente de variación para el Grupo B es: CV = s 1.19 (100) = (100) = 23.8% x 5 (Menor porcentaje es más representativa la media) Es decir, se tiene un 23.8% de que la media no es representativa del Grupo B. Confiabilidad de la media (CM) Esta medida muestra la confiabilidad de la media, su fórmula: CM = 100% – CV Confiabilidad de la media para el Grupo A es: CM = 100% – CV = 100% – 77.8% = 22.2%. (Menor porcentaje es menos confiable la media) Es decir, se tiene una confiabilidad del 22.2% de que la media es representativa del Grupo A. Confiabilidad de la media para el Grupo B es: CM = 100% – 23.8% = 76.2%. (Mayor porcentaje es más confiable la media) Es decir, se tiene una confiabilidad del 76.2% de que la media es representativa del Grupo B. ESTADÍSTICA PARA LA TOMA DE DECISIONES. Medidas de concentración. De acuerdo a lo que nos dice la Universidad Complutense de Madrid (2006): Las medidas o índices de concentración tienen como objetivo fundamental cuantificar el grado de desigualdad en el reparto o distribución de una magnitud económica (rentas, negocio, beneficios, etc...), entre un número determinado de “unidades” (individuos, familias, empresas, etc...). La forma de la distribución de una magnitud, representada por una variable estadística, ya se ha estudiado a través de diversas medidas de posición, dispersión, asimetría y apuntamiento. Lo que ahora nos interesa es la mayor o menor equidad en el reparto de la suma total observada de una magnitud entre los integrantes del conjunto perceptor de dicha suma. Para ello, deberemos recoger de cada elemento perteneciente al conjunto perceptor, la información de la cuantía individual recibida en el reparto. La dificultad reside en que, en muchas ocasiones, esa información viene agrupada en clases y, por tanto, el estudio de la concentración no se podrá hacer con la precisión debida. Es evidente que las dos situaciones extremas que podemos considerar, respecto a la equidad en el reparto, son: - Mínima concentración o máxima igualdad: cuando a todos los integrantes el conjunto perceptor se les asigna la misma cantidad en el reparto del monto total. - Máxima concentración o mínima igualdad: cuando un único perceptor recibe la suma total a repartir y los demás no perciben nada. Curva de Lorenz. La curva de Lorenz o curva de concentración es una gráfica que se deduce a partir de la información suministrada para el cálculo del índice de Gini y que, por tanto, refleja la mayor o menor concentración en la distribución de una magnitud Ejemplo: 8 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Fuente: http://4.bp.blogspot.com/_yRlfSW3MB1A/SHvmldARdOI/AAAAAAAAAvQ/3cDXNjqniM/s400/CurvaLorenz_CoeficienteGine.jpg 9 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Conclusión En esta sesión aprendimos a calcular las medidas de dispersión para datos no agrupados considerando que estas medidas son útiles, ya que se utilizan para medir el grado de variabilidad que existe en la distribución o serie de datos. En la siguiente sesión aprenderemos a calcular Probabilidades. Fuente: http://nuneznjaimer.mex.tl/imagesnew2/0/0/0/1/1/7/3/8/8/6/loteria(1).jpg 10 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Para aprender más En este apartado encontrarás más información acerca del tema para enriquecer tu aprendizaje. Puedes ampliar tu conocimiento visitando los siguientes sitios de Internet. • Medidas de dispersión. http://brd.unid.edu.mx/medidas-de-dispersion-2/ • Medidas de dispersión. http://brd.unid.edu.mx/medidas-de-dispersion-3/ • Medidas de concentración. http://brd.unid.edu.mx/medidas-de-concentracion/ http://maestriapedagogia2013.files.wordpress.com/2013/05/hernandez-s2010-metodologia-de-la-investigacion.pdf Es de gran utilidad visitar el apoyo correspondiente al tema, porque te permitirá desarrollar los ejercicios con más éxito. 11 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Actividad de Aprendizaje Con lo aprendido en esta sesión acerca de Medidas de dispersión y concentración, deberás realizar los siguientes ejercicios: 1.- Considere una muestra con valores 27,25, 0, 15, 30, 34, 28 y 25. Calcule el rango, la varianza y la desviación estándar. 2.- A home theater in a box es la manera más sencilla y económica de tener sonido envolvente en un centro de entretenimiento en casa. A continuación se presenta una muestra de precios que corresponden a modelos con y sin reproductor de DVD. Modelo con Reproductor Precio ($) Modelo DVD DVD sin reproductor Precio ($) Sony HT-1800DP 450 Pioneer HTP-230 300 Pioneer HTD-330DV 300 Sony HT-DDW750 300 Sony HT-C800DP 400 Kenwood HTB-306 360 Panasonic SC-HT900 500 RCA RT-2600 290 Panasonic SC-MTI 400 Kenwood HTB-206 300 a) Calcule el precio medio de los modelos de reproductor con DVD y el precio medio de los modelos de reproductor sin DVD. ¿Cuánto es lo que se paga de más por tener un reproductor de DVD en casa? b) Calcule el rango, la varianza y la desviación estándar de las dos muestras. ¿Qué le dice esta información acerca de los precios de los modelos con y sin reproductor de DVD? Entregar esta actividad en formato de Práctica de Ejercicios y súbelo a la plataforma. Recuerda que la actividad vale el 5% de la calificación final. 12 ESTADÍSTICA PARA LA TOMA DE DECISIONES. Bibliografía • Anderson, D., Sweeney, D., Williams, T. (2008). Estadística para administración y economía. (10ª ed.). México: Editorial Cengage Learning. ISBN: 970-686-278-1 • Hernández Sampieri Roberto, Fernández-Collado Carlos y Baptista Lucio Pilar. (2010). Metodología de la investigación. México: McGraw-Hill. • Levine, David M., Krehbiel, Timothy C. y Berenson, Mark L. (2012): Estadística descriptiva. México: Pearson Educación • Lind Douglas A., Marchal William G. y Wathen Samuel A. (2008): Estadística aplicada a los negocios y la economía. México: McGraw-Hill. Cibergrafía. • (s.f.). Medidas de dispersión. Recuperado de: http://www.hiru.com/matematicas/medidas-de-dispersion • Universidad Complutense de Madrid (2006). Tema 7: Medidas de concentración. Introducción a la econometría Recuperado de: http://pendientedemigracion.ucm.es/info/eiop/licenciaturas/pdfs_econo metria/tema_7_curso2006-07.pdf 13