SIMULACIONES Y SOFTWARE ESTADÍSTICOS, INTERFACE DEL APRENDIZAJE Y LA ENSEÑANZA DE CONCEPTOS Y PROCEDIMIENTOS ESTADÍSTICOS. Una experiencia en la Carrera de Medicina Veterinaria de la Universidad Nacional de Villa María Cabrera, Gabriela Pilar y Asinari Marianela Universidad Nacional de Villa María. CATEGORÍA: Trabajo de Investigación – EJE TEMÁTICO: Educación Estadística Resumen: En el presente texto se resalta el potencial de las simulaciones informáticas como facilitadoras del proceso de aprendizaje de conocimientos de Bioestadística en la Carrera de Medicina Veterinaria. En dirección a esto, entre los años 2012 y 2013 se pone en marcha el diseño, implementación, evaluación y adecuación de una serie de simulaciones informáticas para el abordaje de conocimientos vinculados con Estadística Inferencial. Es importante destacar que las variables aleatorias modeladas en las simulaciones reproducen situaciones reales investigadas y publicadas en papers del ámbito de la Medicina Veterinaria. Estos papers a su vez son aportados por alumnos que cursan Metodología de la Investigación y Evaluación. La implementación de las simulaciones sirvió de anclaje para los postulados teóricos y las implicancias prácticas que conforman la Bioestadística Aplicada a las Ciencias de la Salud. El hecho de integrar esta herramienta en las redes sociales, acrecienta la autonomía y posibilidad de los alumnos de revisar sus propios caminos de aprendizaje y la oportunidad del docente de conocer cada uno de esos caminos. INTRODUCCIÓN El proceso de aprendizaje de conocimientos de Bioestadística para los estudiantes de Medicina Veterinaria resulta un proceso complejo en el que se integran conocimientos de Estadística Matemática y Teoría de Probabilidades en los contextos de las Ciencias Médicas. Hay una nueva corriente de enseñanza de la estadística en la que el análisis de datos y diseño de métodos para su obtención constituyen, junto con los métodos de inferencia basados en probabilidad, los temas principales. Los estadísticos han llegado a un amplio consenso sobre los contenidos de cursos universitarios de introducción a la estadística, como así también, se han preocupado por los modos de abordaje de dichos contenidos. (Moore D., 2004). En términos del investigador Yves Chevallard (2013), no importan tanto los cálculos ni los algoritmos en sí mismos, sino lo que la gente puede llegar a hacer con ellos en su vida cotidiana para estar mejor. En este sentido la teoría antropológica de lo didáctico (TAD) creada por este investigador, plantea pensar en qué matemática y de qué manera se comunica la misma a la población de personas que no son matemáticos creadores o ni siquiera trabajan en un campo profesional fuertemente matematizado. Esta población de personas contiene, tanto gente de poca instrucción como personas cultísimas en otras ramas del saber. El problema fundador es entonces, la educación matemática para esta población. (Chevallard Y., 2013). Con esa línea de pensamiento y en relación a la decisión de qué conocimientos y destrezas serán pertinentes abordar en cursos universitarios de introducción a la estadística, la Sociedad Americana de Estadística (ASA) y la Asociación americana de Matemática (MAA) acuerdan en ayudar a los estudiantes a pensar como estadísticos. En términos de Wild C.J. y Pfannkuch M., (1999) esto implica la toma de conciencia de la necesidad de los datos, la importancia de la obtención de datos, la omnipresencia de la variabilidad y la medición y calibración de la variabilidad. De esta manera, se piensa la enseñanza de la estadística situada en contexto (Garfield J. (2006); Garfield J. y Ben-Zvi D., (2007); Harraway J., (2006); Gal I., (2006); Berenson M. y Utts, J., (2008)). Otro de los acuerdos en los que coinciden la ASA y MAA supone fomentar la enseñanza activa a partir del trabajo colaborativo, la resolución de problemas con soporte informático, la generación de datos a partir de simulaciones, el conflicto socio-cognitivo que promueve el debate y la argumentación; y la intervención por parte de los estudiantes en proyectos de investigación que se lleven a cabo en sus centros de estudio o a través de papers que evoquen trabajos científicos de interés para la profesión en la cual se forman. En consonancia con los dichos de Chevallard Y., (2013), se resalta la importancia de ofrecer más datos y conceptos, y menos teoría y fórmulas. En este sentido se recomienda automatizar los cálculos y las representaciones gráficas a partir del uso de software, siempre que sea posible. En términos de David Moore (2004), los cálculos automáticos aumentan la capacidad de los estudiantes para resolver problemas, reducen la frustración y ayudan a los estudiantes a concentrarse en las ideas y en la identificación del problema más que en la mecánica de su resolución Con base en los lineamientos antes descriptos el equipo de docentes de la cátedra de Bioestadística de la Carrera de Medicina Veterinaria de la Universidad Nacional de Villa María (UNVM) se interesa en el diseño e implementación de propuestas de optimización para abordar el proceso de enseñanza y aprendizaje de los contenidos de estadística y probabilidad referidos. En particular, se hace foco en el diseño e implementación de simulaciones informáticas para la modelización de procesos aleatorios. DESARROLLO La propuesta de incorporar las simulaciones informáticas se sustenta en la idea de que entre el dominio de la realidad en que se encuentra la situación objeto de estudio (en la que interviene el azar), y el dominio teórico (donde, con ayuda de la matemática se construye un modelo teórico de probabilidad que debe, por un lado, simplificar la realidad y abstraer sólo sus aspectos esenciales y, por otro, ser útil para interpretar los caracteres retenidos en la modelización), se sitúa el dominio pseudo-concreto, en el que es posible trabajar con los estudiantes por medio de la simulación (Alvarado H. y Batanero C, (2003)) En este sentido, son muchos los trabajos de investigación que postulan la incorporación de simulaciones informáticas como soportes didácticos para abordar la enseñanza de conocimientos implicados en la Estadística Inferencial, en la cual los procesos aleatorios son parte necesaria (Goga C. y Ruiz-Gazen A., (2010); Saldanha L., (2010)). Entre los años 2012 y 2013 el equipo de investigación pone en marcha el diseño, implementación, evaluación y adecuación de una serie de simulaciones informáticas para el abordaje de conocimientos vinculados con Estadística Inferencial. Es importante destacar que las variables aleatorias modeladas en las simulaciones reproducen situaciones reales investigadas y publicadas en papers del ámbito de la Medicina Veterinaria. Ahora bien, estas variables aleatorias son generadas en base al método de Montecarlo en el software estadístico Infostat Versión 2013p y en el Excel Versión 2010. Los conocimientos que se trabajaron en el marco de la utilizaciones de estas simulaciones son: técnicas de muestro, distribución de la media muestral, teorema central del límite, estimación putual y por intervalos de confianza de la media poblacional, test de Hipótesis para la media de una población y test de Hipótesis para la diferencia de medias para poblaciones independientes. Se presenta a continuación una de las experiencias realizadas en la cátedra de Bioestadística para abordar: diseño de experimentos, muestra aleatoria de una variable aleatoria, la media muestral y varianza muestral como variables aleatorias con una determinada distribución de probabilidades y estimación puntual y por intervalos de confianza de la media poblacional. Se trabajó con la información de los datos relevados para la tesis de grado de un estudiante de Ingeniería Agronómica de la UNVM que trató un tema de interés Veterinario. En base a la distribución de probabilidades de la población subyacente a la muestra aleatoria observada para la variable aleatoria de interés según los tratamientos planteados en el diseño del experimento; se generaron varias muestras aleatorias con el método de Montecarlo y los software Infostat y Excel. En el archivo de Excel se generaron 100 muestras aleatorias de la variable de interés para cada tratamiento y luego se seleccionaron aleatoriamente 12 de estas muestras; una para cada grupo de estudiantes de 5 integrantes cada uno. En la FIGURA 1 se presenta el escenario asociado a referida simulación, esta situación problema contextualiza los conocimientos a abordar en el marco del trabajo de tesis antes mencionada. En el GRÁFICO 1 en tanto, se muestra el comportamiento de los datos observados para la variable aleatoria de interés y obtenidos del diseño del experimento realizado. FIGURA 1 . Escenario asociado a la simulación informática ESCENARIO ASOCIADO: Un grupo de investigadores está interesado en analizar si hay diferencias estadísticamente significativas en el incremento de peso de terneros sometidos a tres tratamientos de destete: hiperprecoz, precoz y testigo. El destete precoz consiste en la separación anticipada del ternero de su madre a una edad de 60 a 70 días de edad. El destete tradicional (considerado testigo) se realiza entre los 4 a 6 meses de edad de los terneros, cuando estos son ya rumiantes y la leche representa una parte minoritaria de la dieta. En tanto, el destete hiperprecoz a los 45 días de vida y requiere mayores cuidados que el destete precoz, dado la alta sensibilidad de la categoría de animales en cuestión no solo a factores nutricionales sino también a aquellos de manejo, sanidad, clima, etc. En esta investigación, se resalta que tanto en el destete precoz como hiperprecoz, el objetivo desde el punto de vista nutricional es tratar de lograr lo más rápido posible el desarrollo ruminal. . GRÁFICO 1. Diagramas de caja donde se muestran los datos observados de la Variable aleatoria: “incremento de peso” categorizada por tratamiento. 153,20 124,60 96,00 67,40 38,80 Incremento de peso-Hiperprecoz Incremento de peso-Precoz Incremento de peso-Testigo Se sigue entonces con la asignación de las muestras aleatorias para cada uno de los grupos de trabajo. Cada grupo con el soporte del software infostat, realiza el análisis de la muestra aleatoria asignada, a partir de gráficos de caja como se muestra en la TABLA 1 y las medidas resumen que correspondan. Luego se ponen en común cada uno de los gráficos, medidas resumen y los análisis logrados por cada grupo. El docente, en este momento promueve la reflexión acerca del comportamiento de los datos para cada uno de los tratamientos, en cada uno de las muestras observadas para la variable de interés y los tratamientos indicados. En este sentido, se discute sobre los valores de la media muestral, la varianza muestral, el coeficiente de asimetría, el coeficiente de variación y la presencia de valores atípicos para cada tratamiento, muestra a muestra. Por ejemplo, se visualiza el hecho de que la distribución de los datos en el tratamiento precoz parece ser la más homogénea y simétrica, en relación a los otros dos tratamientos (hiperprecoz y testigo); se resalta además que esta relación se sigue evidenciando muestra a muestra. TABLA 1. Tabla de diagramas de caja para alguna de las 12 muestras aleatorias proporcionados a los grupos de estudiantes. 142,10 105,25 116,87 Incremento peso Incremento peso 133,15 77,35 49,45 91,65 66,42 21,55 41,20 Incremento peso-Hiperprecoz Incremento peso-Precoz Incremento peso-Hiperprecoz Incremento peso-Testigo Incremento peso-Precoz Incremento peso-Testigo Grupo 2 144,69 141,20 114,47 111,04 Incremento peso Incremento peso Grupo 1 84,25 54,04 23,82 80,88 50,72 20,56 Incremento peso-Hiperprecoz Incremento peso-Hiperprecoz Incremento peso-Precoz Incremento peso-Precoz Incremento peso-Testigo Incremento peso-Testigo Grupo 4 133,15 157,47 105,25 126,85 Incremento peso Incremento peso-Testigo Grupo 3 77,35 49,45 96,23 65,60 21,55 34,98 Incremento peso-Hiperprecoz Incremento peso-Precoz Incremento peso-HIPERPRECOZ Incremento peso-Testigo Incremento peso-PRECOZ Grupo 5 Incremento peso-TESTIGO Grupo 6 En base a las exposiciones de los distintos grupos, el docente a cargo de la experiencia realiza la institucionalización de los conocimientos que se trabajan a partir de la situación problema planteada. Por ejemplo, se reflexiona sobre la variabilidad de la media muestral muestra a muestra; esto permite contruir la idea de que la media muestral es una variable aleatoria y sigue por tanto, una determinada distribución de probabilidades. Para apoyar esta idea, se presentan las 100 muestran aleatorias generadas para cada tratamiento en el archivo de excel, se calculan las medidas resumen y se dibuja con el software Infostat el histograma correspondiente. La mediación docente y el soporte visual posibilitan que los alumnos visualicen las siguientes ideas: la media muestral como estimador puntual, la media muestral como variable aleatoria y reconozcan la distribución de muestreo de la media muestral. Luego, con esta misma modalidad de trabajo relfexivo mediado por la simulación realizada, se sigue con la construcción e internalización de la estimación por intervalo de confianza de la media poblacional y se discute sobre los alcances y limitaciones de ambas estimaciones. Es importante resaltar que el proceso descripto constituye un anclaje significativo para la construcción e internalización de conceptos y procedimients estocásticos de la estadística inferencial. Por ejemplo, el hecho de disponer de las posibles muestras constituye un soporte determinante, para la comprensión del concepto de estimador puntual y de variable aleatoria. Es importante destacar el rol de docente en este proceso de construcción del conocimiento, en cuanto realiza las intervenciones que posibilitan el establecimiento de relaciones entre conocimientos previos y nuevos conocimientos. Ahora bien, en el GRAFICO 2 se evidencia el impacto positivo en el rendimiento académico que implicó la modalidad de trabajo señalada. Se observa claramente un fuerte incremento de los estudiantes que alcanzan la promoción y regularidad. En contrapartida hubo una marcado disminución de los estudiantes en condición libre. GRÁFICO 2. Rendimiento académico de BIOESTADÍSTICA, entre los años 2011 y 2013 CONCLUSIONES En el presente texto se resalta el potencial de las simulaciones informáticas como facilitadoras del proceso de aprendizaje de conocimientos de Bioestadística en la Carrera de Medicina Veterinaria. La implementación de las simulaciones sirvió de anclaje para los postulados teóricos y las implicancias prácticas que conforman la Bioestadística Aplicada a las Ciencias de la Salud; en particular de conocimientos y procedimientos básicos de la Estadística Inferencial. Más aún, la implementación de una modalidad de trabajo en el aula pensada en términos de la funcionalidad de los conocimientos a enseñar y gestionada por los aportes de las simulaciones, la mediación docente y el trabajo colaborativo; impactó positivamente en el número de estudiantes que lograron la promoción de la asignatura. El hecho de integrar esta herramienta en las redes sociales, acrecienta la autonomía y la posibilidad de los alumnos de revisar sus propios caminos de aprendizaje y la oportunidad del docente de conocer cada uno de esos caminos. BIBLIOGRAFÍA Alvarado, H. y Batanero, C. (2008). Significado del teorema central del límite en textos universitarios de probabilidad y estadística. Estudios pedagógicos (Valdivia), 34 (2), 7-28. Berenson, M. y Utts, J. (2008). Assessing student retention of essential statistical. The American Statistician, 62 (1). Chevallard, Y. (2013). Entrevista en diario Clarín, disponible on línea: http://www.clarin.com/sociedad/alumnos-andan-matematica-contenidoselite_0_1043895705.HTML Chevallard, Y. (2013). La enseñanza de la matemática en la encrucijada: por un nuevo pacto civilizacional. Conferencia en I Jornadas de Estudio en Educación Matemática. Facultad de Astronomía, Matemática y Física de la Universidad Nacional de Córdoba. Gal, I. (2006). Statistis education and the wider society. International Conference on Teaching Statistics: "Working Cooperatively in Statistics Education”. Salvador, Bahia, Brazil. Garfield, J. (2006): Collaboration in statistics education research: stories, reflections, and lessons learned. Plenary International Conference on Teaching Statistics: "Working Cooperatively in Statistics Education. University of Minnesota, United States Garfield, J. y Ben-Zvi, D. (2007). ¿Cómo los estudiantes aprenden las estadísticas revisitados:. Una revisión actual de la investigación sobre estadísticas de enseñanza y aprendizaje Revista Internacional de Estadística ,75 (3), 372-396. Goga, C.y Ruiz-Gazen (2010). The use of monte carlo simulations in teaching survey sampling. International Association of Statistical Education. Harraway, J. (2006): Teaching statisticsin context. International Conference on Teaching Statistics: Topic Statistics education at the post-secondary level. Panel Discussion. Brazil. Moore, D. (2004): Estadística aplicada básica. Publicado por Antoni Bosh Editora S. A. Segunda Edición. Saldanha, L. (2010): Conceptual issues in quantifying expectation: insights from students’ experiences in designing sampling simulations in a Computer microworld. International Association of Statistical Education Wild, C. J. y Pfannkuch, M. (1999): Statistical Thinking in Empirical Enquiry, International Statistical Review, 67, pp. 223–265. Traducido al castellano por el Dr. Román Hernández Martínez