ESTADÍSTICA DESCRIPTIVA Y PRESENTACIÓN DE RESULTADOS DE UNA INVESTIGACIÓN (PARTE I) DR SEBASTIÁN GENERO APS, EPIDEMIOLOGÍA E INFORMÁTICA II [email protected] [email protected] Objetivos Describir la utilidad de las medidas de resumen Conocer su calculo e interpretación Identificar los tipos de presentación de datos Interpretar la información expuesta en gráficos Escala Tipo de Medida Medida de Resumen Cualitativa Cifras Relativas Proporciones Tasas Razones Cuantitativa Medidas de posición Central Media Mediana Modo Medidas de Posición No centrales Cuantiles o fractiles Medidas de Variabilidad o dispersión Amplitud Desvío Medio Desvío estándar Intervalo intercuartílico Donde existe mas riesgo de Dengue? Localidad Casos de Dengue Población Tasa A 200 1000 20% B 1000 1000000 0.1% Totales 1200 1001000 0.11% …se observa una relación de 9:1 a favor del sexo femenino… “ “ RAZON: es una relación entre 2 fenómenos o entre dos categorías de una misma variable, se expresa según la unidad del denominador, tampoco expresa Riesgo. EJEMPLO 9 mujeres / 1 varón La Provincia del Chaco tiene 984446 habitantes distribuidos en 99633 Km2 de superficie territorial. Cual es la densidad poblacional? Habitantes Km2 “En la población estudiada se observa un predomino de pacientes del sexo femenino (90%) “ Proporción: es un cociente en donde el numerador forma parte del denominador, NO EXPRESA riesgo, sólo da una idea del peso de una parte en relación a un todo, utiliza factor de amplificación y puede utilizarse para comparar diferentes poblaciones. Fig. Nº 1 Proporcion de consultantes según sexo al Cosnultorio de Obesidad del Hospital X durante el año 2006 n=10 10……………..100% 9...................... 90% Femenino 9 X 100/10= 90 Masculino 10% O bien: 9 x 100 10 Tasa: es una cifra relativa que relaciona un fenómeno ocurrido (*) con la población expuesta estimada a mitad de período. 1000 casos de TBC (durante el año 2006 en Corrientes) 100000 habitantes (a mitad del año 2006 en Corrientes) (*) en un tiempo y lugar dados Una Tasa Indica El riesgo que la Población tiene de ese evento (extrapolable a nivel individual) La velocidad de ocurrencia del fenómeno Clasificación Según el fenómeno que miden De mortalidad De fecundidad Demográficas Otras Según la Población de referencia Generales (es decir no seleccionada por una variable en especial) Específicas Según el control de variables de confusión Crudas o Brutas Ajustadas INDICADORES DE MORTALIDAD INDICADORES MATERNO INFANTILES Medidas de Resumen: Escala Tipo de Medida Medida de Resumen Cualitativa Cifras Relativas Proporciones Tasas Razones Cuantitativa Medidas de posición Central Media Mediana Modo Medidas de Posición No centrales Cuantiles o fractiles Medidas de Variabilidad o dispersión Amplitud Desvío Medio Desvío estándar Intervalo intercuartílico Medidas de Tendencia Central: Tienden a ubicarse en el centro de una serie de observaciones y sirven como valores representativos de la misma MEDIA: se obtiene por la sumatoria de los valores de cada una de las observaciones dividido el numero de observaciones. Dadas estas edades de consultantes a un centro de Salud : 2-2-3-4-4-5-5-5-6 Cual es la media de edad de los pacientes? 2+2+3+4+4+5+5+5+6 =36/9= 4 Que ocurre si se introduce un valor extremo? 2-2-3-4-4-5-5-5-30 Media= 6.6 Mediana:Es el valor que deja igual numero de observaciones por delante y por detras del mismo. 1) se ordenan las observaciones de menor a mayor 223445556 2) Se halla la ubicación de la mediana mediante la formula: n+1/2 9+1/2 =5 3) se busca entonces el valor de la mediana 2 2 3 4 4 5 5 5 6 1° 2° 3° 4° 5° 6° 7° 8° 9° Si el numero de observaciones fuese par: 2234455568 el calculo de la posicion daría 10+1/2 =5,5 o sea entre el 5º y 6º lugar: 2234455568 Modo: es el valor mas repetido en se obtiene entonces la media : 4+5 =9/2 = 4,5 La mediana es una4.5 serie 1 2 3 4 5 5 5 6 8 Que ocurre si se introduce 1 2 un 2 valor 2 4 aberrante 5 5 5 6 o si faltan datos ? 2 2 3 4 4 5 5 5 35 Posición de las MTC en curvas simétricas y no simétricas Media Mediana Modo Media Modo Mediana Modo Media Mediana Medidas de Resumen: Escala Tipo de Medida Medida de Resumen Cualitativa Cifras Relativas Proporciones Tasas Razones Cuantitativa Medidas de Tendencia Central Media Mediana Modo Medidas de Posición No centrales Cuantiles o fractiles Medidas de Variabilidad o dispersión Amplitud Desvío Medio Desvío estándar Intervalo intercuartílico Medidas de posicion no centrales : No se ubican en el centro de las observaciones sino que surgen de divisiones de la serie en tramos iguales de observaciones.. Se denominan Cuantiles o Fractiles. observaciones Fractiles. Glucemia 67 75 83 87 91 95 98 100 105 112 200 280 320 360 380 400 50 60 75 90 95 100 Cantidad de observ. Percentilo 4 40 120 160 1 10 25 40 C1 D1 D2 D3 C2 D4 D5 C3 D6 D7 D8 D9 D10 El gráfico de caja o Box Plot. 68 D1 98 98 D2 D3 Q1 101 D4 103 D5 Q2 107 108 D6 D7 117 D8 Q3 123 D9 132 D10 El gráfico de caja o Box Plot. Outliers o valores extremos Bigote, bisagra o límite inferior Q1 Q2 Q3 Bigote, bisagra o límite superior Medidas de Resumen: Escala Tipo de Medida Medida de Resumen Cualitativa Cifras Relativas Proporciones Tasas Razones Cuantitativa Medidas de Tendencia Central Media Mediana Modo Medidas de Posición No centrales Cuantiles o fractiles Medidas de Variabilidad o dispersión Amplitud Desvío Medio Desvío estándar Intervalo intercuartílico Medidas de dispersion: expresan como se distribuyen las observaciones de una serie alredeor de una medida de posición central a) 1, 2, 3, 4 ,5 MEDIA= 3 b) -40, -25, -15, -10, -6, -5, 5, 6, 10, 110 MEDIA=3 Calculo del DE 2 2 3 4 (2 (2--4) 2 =4 (2 (2--4 )2 =4 (3 (3--4)2 =1 (4 (4--4)2 =0 (4 (4--4)2 =0 (5 (5--4)2 =1 (5 (5--4)2 =1 (5 (5--4)2 =1 (6 (6--4)2 =4 16 4 5 5 5 6 16/9 =1, 77 La raíz cuadrada de 1.77 es 1.3 Es el DE 4 ± 1.3 años el 68.3 % de la población 4 ± 2.6 años el el 95.4% de la población 4 ± 3.9 años el 99.7% de la población -1DE +1DE -2DE +2DE -3DE +3DE X 68,3% 95.4% 99.7% TABLAS Y GRAFICOS PRESENTACION DE DATOS ESTADISTICOS TEXTUAL TABULAR SEMITABULAR GRAFICA TABLAS Titulo Tabla N° 1 Tasa de mortaldad (por 100000 habitantes) según tipos de cáncer seleccionados y sexo, Provincia "X", año 2012 Femenino Cáncer de Pulmon 10 Cáncer de Colon 8 Cáncer de Mama 11 Cáncer de Próstata - Notas aclaratorias Masculino 15 5 0 4 Fuente: Dirección de Estadísticas Vitales de la Provincia "X" Si no se observa ningún caso la celda se completa con cero Si el dato no es posible de que sea observado se completa la celda con ““-” Si los datos podrían ser posibles pero no se dispone de ellos se completa con “SD” GRAFICOS 1- GRAFICOS DEL SISTEMA DE COORDENADAS CARTESIANAS DE BARRAS SIMPLES MULTIPLES SUPERPUESTAS PROPORCIONALES HISTOGRAMA /POLIGONO DE FRECUENCIA LINEAL DE CORRELACION SEMILOGARITMICO 2- GRAFICOS CIRCULARES SECTORIAL 3- GRAFICOS DE TECNICA MIXTA PICTOGRAMA CARTOGRAMA TRIDIMENSIONAL DE CAJA GRAFICO DE BARRAS SIMPLES Titulo Alumnos Dibujo Materias Fuente y elaboración : propias . Notas aclaratorias Letreros Cuando las variables son nominales se las ordena según su frecuencia para mejorar la presentación visual GRAFICO DE BARRAS MULTIPLES Fig N°3 Embarazadas del centro de salud N°13 segun estado civil por numero de hijos, Goya, Corrientes, marzo 2006 mujeres 8 6 0-1 hijos 4 2-3 hijos 2 4-7 hijos 0 soltera Casada Estado civil Fuente: dirección de estadísticas sanitarias Referencias Histograma Polígono de Frecuencias Lineal de mortalidad TasaTasa de mortalidad Fig N° 4 Tasa de mortalidad general por 10000 128 Fig N° 4 Tasa de mortalidad general por 10000 haitantes, periodo 2000-2005, Provincia del Chaco. haitantes, periodo 2000-2005, Provincia del Chaco. 10 87 6 46 2 05 2000 2000 2001 2001 2002 2002 2003 2003 2004 2004 2005 2005 Años Años Fuente: Indicadores de salud 2000 a 2005, Ministerio de salud de la nación De Correlación Relación Directa Fuente: Dirección de Epidemiología, Provincia “X” Sectorial Fuente: Servicio de estadisticas del hospital X. Fuente: Servicio de estadisticas del hospital X. El Gráfico de Caja o Box Plot. Outliers o valores extremos Bigote, bisagra o límite inferior Q1 Q2 Q3 Bigote, bisagra o límite superior