Juegos con un propósito : Método para enseñar las pruebas de hipótesis para dos muestras

Normalmente pensamos en los juegos como una distracción placentera, simplemente algo que hacemos por diversión. Sin embargo, una evidencia cada vez mayor sugiere que los juegos pueden hacer más que brindarnos entretenimiento, especialmente cuando se trata de aprendizaje en un salón de clases.

Puesto que la estadística es un tema que no resulta fácil para la mayoría de las personas y suele no ser vista como algo divertido, el uso de juegos adecuadamente diseñados para enseñar estadística puede llegar a ser una herramienta muy útil para despertar interés y ayudar a explicar conceptos difíciles.

¿A qué tipo de juegos “adecuadamente diseñados” nos referimos? No se trata de juegos de mesa tradicionales como Monopolio o Serpientes y escaleras, sino de juegos de computadora interactivos, el tipo de juegos con el que han crecido las nuevas generaciones.

La Dra. Shonda Kuiper, profesora asociada y directora del departamento de matemáticas y estadística de Grinnell College, Kevin Cummiskey, profesor auxiliar en la Academia Militar de los Estados Unidos, y el coronel Rod Sturdivant, profesor asociado e investigador en la Academia Militar de los Estados Unidos, han estado explorando el uso de los juegos de computadora en sus salones de clases durante muchos años.

“Cambiamos el enfoque alejándolo de los cálculos estadísticos que no están ligados al contexto de la investigación científica”, señala Kuiper. “Nuestros materiales ofrecen una alternativa a las clases magistrales y los problemas de los libros de texto e incorporan experiencias similares a la investigación en el salón de clases”.

Para incorporar experiencias similares a la investigación en sus clases, Kuiper, Cummiskey y Sturdivant organizaron para sus estudiantes laboratorios basados en un juego. “Los laboratorios aprovechan la curiosidad natural de los estudiantes y el deseo de explicar el mundo que los rodea, de modo que pueden experimentar tanto el poder como las limitaciones del análisis estadístico”, afirma Kuiper.

Por ejemplo, los tres profesores utilizaron el juego de computadora en línea “Tangramas” para enseñar las pruebas de hipótesis, y pidieron a los estudiantes que utilizaran software de herramientas estadísticas como Minitab para analizar los datos sobre la marcha.

Definición de las pruebas de hipótesis

De los diferentes temas enseñados a los estudiantes en los cursos de estadística de nivel introductorio, las pruebas de hipótesis son uno de los puntos más difíciles de entender a nivel conceptual.

Las pruebas de hipótesis son procedimientos estadísticos que evalúan dos enunciados mutuamente exclusivos sobre una población.

Estos dos enunciados se llaman hipótesis nula e hipótesis alternativa. Siempre son enunciados acerca de los atributos de la población, tales como el valor de un parámetro, la diferencia entre los parámetros correspondientes de varias poblaciones o el tipo de distribución que describe mejor la población. Una prueba de hipótesis utiliza datos de muestra para determinar cuál enunciado es respaldado mejor por los datos.

Una prueba de hipótesis puede responder a preguntas como las siguientes:

  • ¿Es el tiempo promedio para completar un juego de Tangramas menos de 2 minutos?
  • ¿Es el tiempo promedio de culminación de un juego diferente para hombres y mujeres?
  • ¿Completan más rápido los juegos los estudiantes de ciencia e ingeniería que otros estudiantes?

La mayoría de las pruebas de hipótesis en Minitab se encuentran en el menú Estadísticas > Estadísticas básicas aunque algunas, como la prueba chi-cuadrada, están disponibles en Estadísticas > Tablas > Tabulación cruzada y Chi-cuadrada.

Enseñanza de las pruebas de hipótesis con “Tangramas”

En el laboratorio de Tangramas desarrollado por Kuiper, Cummiskey y Sturdivant, los estudiantes reciben una introducción a las pruebas de hipótesis a través de un juego de rompecabezas basado en la web. Los jugadores deben resolver un rompecabezas en el que cubren una imagen volteando, girando y moviendo un conjunto de formas.

Tangrams 1

Figura 1. La interfaz web del juego de rompecabezas Tangramas.

El sitio web de Tangramas recolecta información de cada jugador y registra automáticamente los tiempos de culminación. Los estudiantes pueden descargar el conjunto de datos para toda la clase, el cual está disponible para su uso inmediato a través del sitio web.

Los estudiantes asumen el rol de un investigador seleccionando entre una gran variedad de variables independientes para explicar por qué algunos estudiantes completan el juego más rápido que otros. Por ejemplo, un estudiante puede decidir investigar si los tiempos de culminación del juego difieren dependiendo del tipo de música de fondo, y luego convertir esta pregunta de investigación en una hipótesis comprobable.

Posteriormente, los estudiantes pueden analizar sus datos calculando las estadísticas de resumen y generando histogramas de los tiempos de culminación de Tangramas en programas de herramientas estadísticas como Minitab. Puesto que los tiempos de culminación tienden a variar significativamente entre los estudiantes, los conjuntos de datos tienden a estar “sucios” y no siguen una distribución normal.

Esto hace que el análisis resulte interesante para los estudiantes, porque deben discutir y tomar decisiones sobre cómo limpiar los datos, como por ejemplo si eliminar valores atípicos. Luego deben verificar los supuestos, realizar pruebas adecuadas de significancia estadística y formular sus conclusiones. “En muchos cursos de estadística se abordan los supuestos del modelo y la eliminación de valores atípicos o datos erróneos”, comenta Kuiper, “pero los estudiantes rara vez enfrentan desafíos de análisis de datos en los que deben tomar y defender sus propias decisiones”.

Aplicación en el salón de clases

Para ilustrar cómo implementar el laboratorio de Tangramas en el salón de clases, consideramos una clase que decide investigar la relación entre la especialización académica del estudiante y el tiempo necesario para completar el rompecabezas. Específicamente, la clase quiere responder a la siguiente pregunta de investigación: ¿Completan más rápido el rompecabezas los estudiantes especializados en matemáticas, ciencia e ingeniería que los estudiantes especializados en otras materias?

Antes de comenzar el juego, los jugadores ingresan datos pertinentes sobre sí mismos en la interfaz web de Tangramas. En este ejemplo, los estudiantes ingresaron el tipo de especialización, bien sea “MSE”, correspondiente a matemáticas, ciencia e ingeniería, u “Otro”, para todas las demás especializaciones.

 

Tangrams 2 

Figura 2. Los estudiantes ingresan datos pertinentes sobre sí mismos utilizando la interfaz web del juego Tangramas.

 

Después de que cada estudiante juega, sus datos se emparejan con el tiempo que empleó para completar el rompecabezas. Cuando el último estudiante completa el rompecabezas, los datos de la clase están disponibles inmediatamente para su análisis.

Antes de adentrarse en el análisis de datos, los estudiantes deben convertir la pregunta de investigación en hipótesis comprobables. En este caso, ellos quieren saber si la diferencia entre las medias de dos poblaciones, estudiantes de matemáticas, ciencia e ingeniería (MSE) y otros estudiantes, es estadísticamente significativa.

Las hipótesis nula (H0) y alternativa (Ha) serían:

H0: Los estudiantes de MSE tienen el mismo tiempo promedio de culminación de Tangramas que los estudiantes de otras especializaciones.

Ha: Los estudiantes de MSE y los de otras especializaciones no tienen el mismo tiempo promedio de culminación de Tangramas.

Ahora los estudiantes ingresan sus datos en una hoja de trabajo de Minitab para calcular las estadísticas básicas de resumen.

 

Tangrams 3 

Figura 3. Los estudiantes pueden ingresar los datos de la clase correspondientes al laboratorio de Tangramas en una hoja de trabajo de Minitab.

 

En Minitab, los estudiantes utilizan Estadísticas > Estadísticas básicas > Mostrar estadísticas descriptivas para identificar la media y la desviación estándar de la muestra de los tiempos de culminación de los estudiantes de MSE y otros estudiantes. También pueden elegir ver otras estadísticas de resumen, como la mediana, el modo, la varianza y muchas más.

 

Tangrams 4 

Figura 4. La función Mostrar estadísticas descriptivas de Minitab muestra la media y la desviación estándar de los tiempos de culminación de los 96 estudiantes de MSE y los 32 estudiantes de otras especializaciones que jugaron Tangramas.

 

Para ver la distribución de los datos, los estudiantes utilizan Gráfica > Histograma > Simple para crear un histograma:

 

Tangrams Histogram

Figura 5. Este histograma permite ver fácilmente la distribución de los tiempos de culminación de los estudiantes de otras especializaciones, incluyendo los valores de tiempo altos y bajos, así como el tiempo medio de culminación.

 

Los estudiantes también usan Gráfica > Gráfica de caja > Múltiples Y > Simple para ver la distribución de los datos de ambas poblaciones y para identificar fácilmente los valores atípicos.

Luego, para determinar si existe una diferencia estadística entre las medias de las especializaciones MSE y otras especializaciones, los estudiantes realizan una prueba de hipótesis para dos muestras en Minitab. Puesto que hay dos poblaciones independientes y los estudiantes desean determinar si los tiempos promedio de culminación son iguales, deberían elegir una prueba t para dos muestras (Estadísticas > Estadísticas básicas > t de 2 muestras) para calcular el valor p.

Resultados

En este caso, para el tipo de especialización, el valor p de la prueba t de dos muestras fue 0.26, que no es significativo en el nivel de confianza de 95% (α=0.05).

Por lo tanto, la clase no rechaza la hipótesis nula y concluye que no existe una diferencia significativa entre las medias de las dos poblaciones.

Los resultados de la prueba de hipótesis probablemente sorprenderán a los estudiantes, quienes pueden notar que los tiempos promedio de culminación para los estudiantes de MSE son 22% más rápidos que para los otros estudiantes. Esto parece implicar que los estudiantes de MSE superaron a los otros estudiantes. Sin embargo, los estudiantes estarían ignorando la gran desviación estándar de los tiempos de culminación, lo que disminuye la confianza general en la ubicación de las medias de las poblaciones.

Después de la prueba de hipótesis, los estudiantes pueden validar los supuestos básicos de la prueba t. Un supuesto importante es que la muestra de estudiantes que participan en la investigación es una muestra aleatoria. Esto expone a los estudiantes a los desafíos que los investigadores enfrentan cuando realizan experimentos. En la práctica, es difícil obtener una muestra aleatoria. Hay muchas razones por las que la muestra utilizada para este ejemplo de salón de clases no es aleatoria. En este caso, sólo participaron cuatro secciones de esta clase particular de estadística.

Reacciones de los estudiantes

Entonces, ¿qué opinan los estudiantes sobre este enfoque para aprender estadística?

Muchos de los estudiantes de Cummiskey respondieron de manera muy favorable al laboratorio basado en el juego, comentando que les agradó participar en el proceso de recolección de datos porque eso hizo que los datos fueran “reales” para ellos.

“Como grupo, los estudiantes disfrutaron de los juegos”, afirma Cummiskey. “Parece que los laboratorios lograron captar la atención de los estudiantes y muchos comentaron que vieron cómo se utilizan realmente los procedimientos estadísticos fuera del salón de clases de estadística”.

Con el apoyo de la National Science Foundation, NSF DUE #0510392 y NSF DUE #1043814, Kuiper y otros profesionales desarrollaron materiales que se pueden utilizar como proyectos dentro de un curso introductorio de estadística o para sintetizar los elementos clave aprendidos durante un curso secundario de estadística.

Los materiales pueden utilizarse para formar la base de un proyecto de investigación individual y para ayudar a estudiantes e investigadores de otras disciplinas a entender mejor cómo los profesionales de la estadística abordan el proceso científico.

Materiales y conjuntos de datos de muestra, incluyendo los correspondientes al laboratorio de Tangramas descrito en este artículo, están disponibles de forma gratuita en http://web.grinnell.edu/individuals/kuipers/stat2labs/.

Lea más sobre la investigación de Cummiskey, Kuiper y Sturdivant en el artículo, “Using classroom data to teach students about data cleaning and testing assumptions,” Frontiers in Quantitative Psychology and Measurement, Septiembre de 2012. El documento se puede descargar gratis en: http://www.frontiersin.org/Quantitative_Psychology_and_Measurement/10.3389/fpsyg.2012.00354/abstract

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado. Leer nuestra política