Implementación de la estadística tv de Student en el laboratorio de Física Harol Y. Valencia-Martínez1, Gabriel F. Acevedo-Amaya2 1,2 Universidad Santo Tomas, Departamento de Ciencias Básicas, Bogotá, Colombia. Resumen En este artículo se presenta una revisión de la aplicación de la estadística tv de Student para el cálculo de incertidumbres en la medición de una magnitud que se mide de forma directa n veces, aplicada en los laboratorios de física mecánica y física de materiales del Departamento de Ciencias Básicas de la Universidad Santo Tomas. Como ejemplo de estudio se implementará un laboratorio básico en la enseñanza de la física mecánica: caída libre. Se analizará como se modifica la incertidumbre y el resultado de la aceleración del sistema dependiendo de la cantidad de datos medidos. Palabras clave: Física experimental, incertidumbre, distribución normal, distribución tv de Student, caída libre. Introducción En todos los procesos de medición se presentan una serie magnitudes de influencia que no pueden ser controladas en su totalidad y errores aleatorios los cuales no se pueden eliminar convirtiéndose así en fuentes de incertidumbres que aportan de forma colectiva una fluctuación de las medidas alrededor de un valor medio o promedio ( ). Los errores aleatorios se pueden disminuir aumentando el número de mediciones, asumiendo que las magnitudes por medir (mensurando) presenten repetibilidad. Si en un laboratorio se presentan magnitudes repetibles y el número de mediciones es bastante grande (n ) o que simplemente la desviación estándar de la muestra es una buena estimación de la desviación estándar de la población se puede definir un intervalo 1 2 1 [email protected] [email protected] alrededor de la media que determine un nivel de confianza. En estos casos se puede asumir una distribución normal con un factor de cobertura Frecuentemente el tiempo y las características del mensurando no permiten efectuar un gran número de medidas (n ) en estos casos la desviación estándar de la muestra que se obtiene a partir de un pequeño número de datos suele ser bastante incierta, por lo tanto es necesaria una extensión del intervalo de confianza, esto se logra asumiendo que la distribución de los datos obedece una distribución de Student en la cual se define un nuevo parámetro tv. Metodología En esta sección se muestran dos ejemplos de aplicación de la estadística de distribución tv o de Student en un caso típico de los laboratorios de física mecánica y de física de materiales de la Universidad Santo Tomas. Inicialmente se describe brevemente el proceso de adquisición de datos del laboratorio en la práctica; caída libre, se muestra como se realiza el cálculo de la incertidumbre estándar combinada del tiempo, empleando la corrección tv de Student, dependiente del número de datos empleados. Finalmente se encuentra una expresión matemática que relaciona la posición (altura y ) con el tiempo de desplazamiento, empleando el método de mínimos cuadrados. Se obtiene las constantes típicas para el problema teórico, y se comparan los resultados obtenidos con los valores que predice la teoría bajo ciertas aproximaciones. Tiempos promedios para una misma altura Se mide el tiempo de caída de una esfera de acero de masa = (13,9887 ± 0,0001) g y diámetro D = (1,510 ± 0,005) cm, el cual se registra a través de un contador digital PHYWE Digitalizer 4 Dek con un precisión de 0,0001 s. Se midió la altura desde la cual se libera la esfera y se registra el tiempo de caída, dicho procedimiento se repite inicialmente 50 veces, 15 veces y 8 veces. El montaje de laboratorio implementado es mostrado en la figura 1. Los datos obtenidos para la altura de (65,0 ± 0,1) cm, se muestran en la tabla 1. 2 Figura 1.Montaje experimental, dispositivo de caída libre. Inicialmente se hizo el cálculo de la incertidumbre tomando 50 datos de tiempo y se aplicó una distribución normal. Los datos obtenidos son mostrados en la tabla 1. Tabla 1: 50 Tiempos de caída en segundos de una esfera desde una altura de 65 cm 0,3651 0,366 0,3661 0,3663 0,3668 0,3674 0,3676 0,3656 0,366 0,3661 0,3664 0,3672 0,3675 0,3676 0,3657 0,366 0,3661 0,3665 0,3673 0,3675 0,3677 0,3657 0,366 0,3662 0,3666 0,3673 0,3675 0,3678 0,3657 0,366 0,3662 0,3667 0,3674 0,3675 0,3678 0,3658 0,366 0,3663 0,3667 0,3674 0,3676 0,368 0,3658 0,366 0,3663 0,3668 0,3674 0,3676 0,368 Bajo las mismas condiciones experimentales se midió el tiempo de caída de la esfera desde una altura de (65,0 ± 0,1) cm 15 veces, obteniendo los datos registrados en la tabla 2. Tabla 2: 15 Tiempos de caída en segundos de una esfera desde una altura de 65 cm 0,3656 0,3657 0,3657 0,3660 0,3658 0,3658 0,3664 0,3670 0,3675 0,3661 0,3676 0,3665 0,3668 0,3667 0,3675 3 Para el caso en el cual el número de datos es menor a 15, se escogieron 8 datos al azar entre las mediciones hechas registradas en la tabla 1. Los datos seleccionados aparecen en la tabla 3. Tabla 3: Ocho Tiempo de caída en segundos de una esfera desde una altura de 65 cm 0,3658 0,3658 0,3664 0,3667 0,3675 0,3661 0,3676 0,3658 Tiempos promedios para diferentes alturas Se mide 15 veces el tiempo de caída de la esfera para 11 diferentes alturas, una vez obtenido el valor de los tiempos de caída se procede a hacer su respectivo análisis estadístico, se calcula el promedio de los registros de tiempo, sus respectivas incertidumbres combinadas y expandidas con un nivel de confianza del 95%. Los resultados de los tiempos promedio obtenidos para cada altura son mostrados en la tabla 4. Tabla 4: Tiempos promedio de 15 mediciones para diferentes alturas Altura (cm) Tiempo (s) 65 62 57 52 49 44 40 34 30 25 21 0,3664 0,3555 0,3425 0,3292 0,3157 0,2986 0,2833 0,2658 0,2488 0,2266 0,2090 De forma similar que en caso anterior se mide 8 veces el tiempo para cada una de las once alturas, obteniendo los resultados de la tabla 5. Tabla 5: Tiempos promedio de 8 mediciones para diferentes alturas Altura (cm) 65 62 57 52 49 44 40 34 30 25 21 0,3665 0,3559 0,3426 0,3291 0,3163 0,2986 0,2834 0,2657 0,2487 0,2261 0,2091 Tiempo (s) 4 Análisis de resultados Para determinar la incertidumbre de la medida del tiempo de caída libre se aplica la distribución normal para y la corrección de Student para tomando inicialmente una altura constante. Los parámetros estadísticos que se consideran en cada una de las distribuciones se resumen en la tabla 6. Tabla 6: Promedio y desviaciones en cada distribución Valor medio o promedio (1) Desviación estándar poblacional (2) Desviación estándar experimental (3) Incertidumbre estándar combinada (4) Incertidumbre expandida (5) Desviación estándar de la muestra (6) Normal Student (7) Desviación estándar experimental de la media El valor medio o promedio , la incertidumbre estándar combinada y la incertidumbre expandida calcula de igual forma en la distribución norma y en la distribución de Student. se Intervalo de confianza con A partir de los datos suministrados en la tabla 1, el valor promedio de los 50 datos del tiempo de caída para una altura constante de (65,0 ± 0,1) cm a partir de la ecuación 1, es , 5 con una desviación estándar poblacional . y una desviación estándar experimental de la media . La incertidumbre estándar combinada ( ) es la incertidumbre debida al instrumento de medición y al tratamiento estadístico de los datos la cual se puede calcular a través de la ecuación 4, , donde el valor corresponde al valor de la incertidumbre del instrumento ligada a la precisión, en este caso dicha incertidumbre es de 0,0001 s. La incertidumbre combinada es entonces . Para un nivel de confianza del 95% en una distribución normal el factor de cobertura es 1,96 y la incertidumbre expandida 2,91 . Como la incertidumbre sólo puede tener una cifra significativa (ya que el experimento no es de alta precisión), la incertidumbre expandida se redondea a 3 y el resultado de la medición de tiempo se puede expresar como: . Esto implica que al tomar al azar un dato de la población el dato se encuentra en el intervalo Con un nivel de confianza del 95% basado en una distribución normal. 6 Intervalo de confianza con Ahora se analiza como ejemplo de cálculo de la aplicación de la distribución tv o de Student, para el caso cuando se tiene menos de 30 datos, en este caso los 15 datos de la tabla 2, el promedio de las mediciones del tiempo de caída para una altura constante de (65,0 ± 0,1) cm se obtiene a partir de la ecuación 1, El valor de la desviación estándar de la muestra se obtiene empleando la ecuación 6, . La incertidumbre combinada del tiempo experimental de la media instrumento se calcula a partir de la desviación estándar y de la incertidumbre debida a la precisión del con la ecuación 4, obteniendo . Para un nivel de confianza de 95%, el coeficiente tv o factor de corrección se determina a partir del nivel de confianza es obtiene que y el riesgo De esta forma se , y número de grados de libertad v =n - 1=14, con esto valores se determina factor de corrección tv ubicándolo en la tabla de la distribución, para obteniendo . La incertidumbre expandida es 4,4 s , el intervalo de confianza empleando la distribución de Student, para la altura de 65 cm, es . Al tomar al azar uno de los datos 7 éste se encontrará en el intervalo , con un nivel de confianza del 95% basado en la corrección de Student con 14 grados de libertad. Tomando ocho datos al azar (ver tabla 3) de los 15 datos registrados de en la tabla 2, para una misma altura (65,0 ± 0,1) cm, se determina el tiempo promedio para ésta distribución de datos y una desviación estándar experimental de la media . La incertidumbre combinada es , como en el caso anterior para un nivel de confianza de 95%, el riesgo , con siete grados de libertad (v=7) el coeficiente es y por lo tanto la incertidumbre expandida 6,49 redondeando la incertidumbre y el tiempo promedio se obtiene . Al seleccionar al azar uno de los datos del espacio muestral la probabilidad de que el dato se encuentre en el intervalo Es de 95% obedeciendo una distribución de Student con 7 grados de libertad. En el figura 3 se muestra la comparación entre los intervalos de confianza cuando se usan 50, 15 y 8 datos respectivamente, como era de esperarse se encuentra que a mayor cantidad de datos el intervalo de confianza es mas pequeño. Lo cual indica que en dicho intervalo es más probable encontrar el valor “verdadero” de la medición, igual es importante notar que el intervalo de confianza para el caso cuando se usan 8 datos contiene el intervalo de confianza para el caso cuando se emplean los 15 y 50 datos. 8 Figura 3. Barras de incertidumbre para el tiempo de caída de una esfera desde una altura (65,0 ± 0,1) cm, para (a) 50 datos (b) 15 datos y (c) 8 datos. También se encontró que al aplicar la distribución normal la incertidumbre es menor que en el caso en el que se aplica la distribución tv, sin embargo en las prácticas del laboratorio el tiempo no es suficiente para la toma de más de 30 o más mediciones, por lo cual se considera apropiado usar la distribución tv. Tiempos promedios para diferentes alturas A través de un procedimiento similar se determinan los tiempos promedios las incertidumbres combinadas y las incertidumbres expandidas para once diferentes alturas, donde para cada altura se mide 15 y 8 veces el tiempo de caída, el registro de los resultados obtenidos son mostrados en la tabla 8. Tabla 8: Altura, tiempos promedios ( ) de caída de la esfera y la incertidumbre expandida ( ) con un nivel de confianza de 95% para 15 y 8 datos respectivamente. Altura 9 (s) (s) (cm) (15 datos) (8 datos) (15 datos) (8 datos) 65,0 0,3664 0,3665 4 6 62,0 0,3555 0,3559 8 16 57,0 0,3425 0,3426 4 7 52,0 0,3292 0,3291 6 9 49,0 0,3157 0,3163 8 9 44,0 0,2986 0,2986 3 4 40,0 0,2833 0,2834 4 6 34.0 0,2658 0,2657 4 5 30,0 0,2488 0,2487 4 7 25,0 0,2266 0,2261 9 15 21,0 0,2090 0,2091 9 19 Como es de esperarse en el caso de 8 datos la incertidumbre expandida es mayor que la incertidumbre con 15 datos para todos los valores de altura. Finalmente se procede a realizar el análisis y el ajuste de los datos a través de método de mínimos cuadrados. En este caso se asume una función potencial de la forma También se calcularan las incertidumbres ajuste y de cada uno de laos parámetros de y . Para los 15 datos de tiempo la grafica se muestra en la figura 4 y para, 8 datos de tiempo la grafica se muestra en la figura 5. Con la ayuda del programa Origin 8,0 se grafican los datos y la curva de ajuste. Figura 4. Grafica de Altura en función Figura 5. Grafica de Altura en función del tiempo de caída para 15 datos. del tiempo de caída para 8 datos. 10 Al realizar el ajuste por mínimos cuadrados de los datos 15 obtenidos se obtienen las siguientes relaciones , con un coeficiente de correlación de 0,9987 indicando así una correlación fuerte y directa. Para el caso de 8 datos los resultados obtenidos en el ajuste por mínimos cuadrados es con un coeficiente de correlación de 0,9988 indicando nuevamente una correlación fuerte y directa. El resultado muestra que la el tipo de movimiento corresponde a un movimiento uniformemente acelerado, si se comparan dichas ecuaciones con la ecuación de caída libre de un cuerpo que se libera del reposo , se observa que el exponente es aproximadamente 2, luego la aceleración de la gravedad puede ser determinada con la igualdad , obteniendo entonces que las respectivas medidas de la gravedad , , Para calcular la incertidumbre, se hace uso de la propagación de incertidumbres de magnitudes no correlacionadas, en este caso la gravedad sólo del parámetro es decir es una función que depende y la incertidumbre asociada a la gravedad es =2 La incertidumbre de la gravedad como una medida indirecta para los 15 y 8 datos del tiempo son 11 De esta forma los resultados obtenidos como medida indirecta de la aceleración de la gravedad para 15 y 8 tiempos promedio es , , Si se asume la gravedad local en Bogotá como (suministrada por Wolfram- Alpha3) como el valor de referencia, el error relativo de las aceleraciones encontradas estaría en -0,84% para 15 datos, y -1,45% para 8 datos, el signo de los errores relativos indica el valor medido en el laboratorio es menor que el valor de referencia, porcentajes de error tan bajos implican que la medida es muy precisa y confiable. Conclusiones La incertidumbre debida a la aleatoriedad de una magnitud reproducible presenta una menor dispersión al aumentar el número de mediciones bajo las mismas condiciones, en este caso la menor incertidumbre fue obtenida al usar la desviación estándar de 50 datos, asumiendo una distribución normal, sin embargo es poco adecuada para el calculo de la incertidumbre cuando se tienen menos de 30 datos, que es el caso mas común en el interior del laboratorio de física. En dichos casos se aplica la estadística usando la distribución tv de Student, en el ejemplo desarrollado se puede ver que a mayor cantidad de datos se reduce el intervalo de confianza, obteniéndose una menor incertidumbre estándar y una mejor aproximación al valor “verdadero”, se concluye que la distribución tv es apropiada para determinar el valor de la incertidumbre estadística. La distribución de Student es fundamental en el tratamiento de datos experimentales cuando se considera un espacio muestral (con 3 ) y no espacio poblacional (con http://www.wolframalpha.com/widgets/view.jsp?id=d34e8683df527e3555153d979bcda9cf 12 ), ya que es incorrecto hacer un tratamiento estadístico en una distribución normal con pocos datos debido a la diferencia entre los coeficientes y tv. Para el caso del cálculo de la incertidumbre cuando se emplean 15 datos de tiempo se encuentra una incertidumbre promedio de datos de tiempo una incertidumbre promedio de , mientras que para el caso de 8 . Para todos los valores de altura la incertidumbre del tiempo es menor para 15 datos que para 8. Se determinaron los valores de la aceleración de la gravedad con los datos obtenidos aplicando el método de mínimos cuadrados como resultado final , , los cuales tiene un valor -0,84% y -1,45% para 15 y 8 datos respectivamente. El porcentaje de error menor a 5% indica que el resultado de la medición es preciso. Es importante recordar que en todo el tratamiento de datos se asumió que no existe fricción del aire que afecte los datos, esta es una fuente probable de error en la medida. En un tiempo de 0,35 s la velocidad que alcanza una esfera en caída libre es de , la fuerza de viscosidad de la ley de Stokes es pequeña comparada con la acción del peso. En el rango de caída de 60 cm el peso es 20 veces mayor que la fuerza de fricción del aire, con lo cual es posible despreciarla. Bibliografía Ardila, A. M. (2007). Física experimental. (2a ed.) Universidad Nacional de Colombia. Bevington, P. y Robinson, D. K. (2002). Data Reduction and Error Analysis for the Physical Sciences. McGraw-Hill Science/Engineering/Math, 3a edición. ICONTEC (1997). Guía para la expresión de la incertidumbre en las mediciones. (GTC 51). (2008). Estadística. Vocabulario y símbolos parte 2: Estadística aplicada. (NTC 2062-2). (2009). Vocabulario Internacional de Metrología: Conceptos fundamentales, generales y términos asociados (VIM). (GTCISO/IEC 99). 13 JCCM (2008a). Evaluation of measurement data: Guide to the expression of uncertainty in measurement. (JCGM 100) (2010) International vocabulary of metrology: Basic and general concepts and associated terms (VIM). (JCGM 200) Corrigendum. (2012) Evaluation of measurement data: The role of measurement uncertainty in conformity assessment. Rabinovich, S. G. (2007). Towards a new edition of the “Guide to the expression of uncertainty in measurement”. Accreditation and Quality Assurance, 12, pp. 603-608. Valencia, H. Y. (2012). Incertidumbre y tratamiento de datos experimentales. Ediciones USTA. Universidad Santo Tomás. Veronika R. Meyer (2007). Measurement uncertainty. Journal of Chromatography A, 1158, pp. 15–24 14