Jouer, oui, mais avec un objectif: Enseigner les tests d'hypothèse à deux échantillons

En général, nous considérons les jeux comme une activité dont l'unique but est de s'amuser. Toutefois, les jeux peuvent faire plus que nous divertir, ils peuvent avoir un objectif pédagogique, en particulier dans une salle de classe ou de formation.

L'apprentissage des statistiques, loin d'être “naturel”, peut paraître fastidieux. Pour éviter que les étudiants et les personnes formées développent un sentiment négatif vis-à-vis des statistiques, l’enseignant ou le formateur peut proposer des jeux pédagogiques pour susciter l’intérêt et expliciter les concepts a priori complexes.

Quels sont ces jeux pédagogiques ? Pas des jeux de société traditionnels comme le Monopoly ou le Jeu de l'échelle, mais des jeux pédagogiques sur ordinateur.

Aux Etats-Unis, Dr Shonda Kuiper, maître de conférences et directrice du département de mathématiques et de statistiques de l'université Grinnell College ; Kevin Cummiskey et Colonel Rod Sturdivant, respectivement , maître assistant et maître de conférences et professeur à l'Académie militaire américaine (United States Military Academy), testent depuis de nombreuses années l'utilisation de jeux pédagogiques sur ordinateurs pour les participants à leurs cours.

“Nous prêtons à présent moins d’attention et de temps aux calculs statistiques qui ne sont pas directement liés à nos travaux de recherche” précise Madame Kuiper. “Nos jeux pédagogiques constituent une alternative aux cours magistraux et aux manuels scolaires. Ces jeux introduisent dans le cours des expériences et exercices pratiques.”

Pour enrichir leurs cours avec des expériences proches de la réalité du travail au sein des centres de recherche, Shonda Kuiper, Kevin Cummiskey et Rod Sturdivant ont proposé aux étudiants des jeux en laboratoire. “Les travaux pratiques en laboratoire font appel à la curiosité naturelle et au désir des étudiants d'expliquer le monde qui les entoure. Les participants au cours peuvent ainsi découvrir à la fois la puissance et les limites de l'analyse statistique”, indique Madame Kuiper

L’un des jeux proposés par le trio de Professeurs est le “tangram”, un jeu en ligne sur ordinateurs pour enseigner les tests d'hypothèse à l’aide du logiciel statistique Minitab pour analyser les données tout au long de l'expérience.

Définition des tests d'hypothèse

Parmi les thèmes enseignés aux étudiants dans les modules d’initiation aux statistiques, le concept de test d'hypothèse est le plus difficile à comprendre.

Le test d'hypothèse évalue deux affirmations qui s'excluent mutuellement à propos d'une population. Ces deux affirmations sont appelées "hypothèse nulle" et "hypothèse alternative". Il s'agit toujours d'énoncés sur les attributs d'une population, tels que la valeur d'un paramètre, la différence entre les paramètres correspondants de plusieurs populations ou le type de distribution qui décrit le mieux la population. Un test d'hypothèse utilise des échantillons pour déterminer l'affirmation la plus adéquate sur les données.

Voici des exemples de questions auxquelles vous pouvez répondre avec un test d'hypothèse :
• La durée moyenne pour résoudre un tangram est-elle inférieure à 2 minutes ?
• La durée moyenne d'un jeu est-elle différente pour les hommes et les femmes ?
• Les étudiants en sciences et en ingénierie terminent-ils les jeux plus rapidement que d'autres étudiants ?

La plupart des tests d'hypothèse dans Minitab se trouvent dans le menu Stat > Statistiques élémentaires. D'autres, comme le test du Khi deux, se trouvent dans le menu Stat > Tableaux > Tableau à entrées multiples et Khi deux.

Enseigner les tests d'hypothèse avec le “tangram”

Dans les travaux pratiques sur le tangram mis au point par Madame Kuiper et Messieurs Cummiskey et Sturdivant, les étudiants découvrent les tests d'hypothèse à l'aide d'un puzzle en ligne. Les joueurs doivent résoudre un puzzle et reproduire une image en retournant un ensemble de formes, en les faisant pivoter et en les déplaçant.

 

Tangrams 1

Figure 1. L'interface Web du puzzle tangram.

Le site Internet du tangram recueille les données de chaque joueur et chronomètre automatiquement. Les participants peuvent télécharger les données de tous les joueurs. Ils sont disponibles immédiatement en ligne.

Jouant le rôle de chercheurs scientifiques, les participants sélectionnent des variables indépendantes pour expliciter les différences de durée du tangram d’un joueur à l’autre. Par exemple, un participant peut décider d'étudier si les temps de réalisation diffèrent en fonction du type de fond sonore diffusé et traduit cette question en une hypothèse testable.

Ensuite, les participants peuvent analyser leurs données à l’aide des statistiques descriptives et en représentant graphiquement à l’aide d’histogrammes les temps de réalisation du tangram dans un logiciel de statistiques tel que Minitab. Les temps de réalisation pouvant varier considérablement d'un joueur à l'autre, les données semblent quelque peu “désordonnées” et ne suivent pas une loi normale.

Toutes ces démarches très pratiques facilitent l’apprentissage des concepts d’analyse statistique, les participants comprennent l’intérêt d’examiner et de prendre les bonnes décisions sur le nettoyage des données, notamment la suppression ou non des valeurs aberrantes. Ils doivent vérifier les hypothèses, effectuer les tests appropriés et énoncer leurs conclusions. “De nombreux cours de statistiques abordent les tests d’hypothèse et la suppression des valeurs aberrantes ou des données erronées”, indique Shonda Kuiper, “mais rares sont ceux qui proposent des problèmes concrets d'analyse de données sur lesquels les étudiants doivent statuer.”

Application

Pour illustrer la mise en œuvre des travaux pratiques sur le tangram, nous nous penchons sur l’étude par certains joueurs de la relation entre la spécialisation (domaine d’étude ou de recherche) et le temps consacré au puzzle. Comment répondre à la question suivante : Les étudiants en mathématiques, en sciences et en ingénierie terminent-ils le puzzle plus rapidement que ceux d'autres disciplines ?

Avant de débuter le jeu, les joueurs saisissent des données pertinentes les concernant dans l'interface en ligne du tangram. Dans cet exemple, les étudiants ont saisi le type de spécialisation, soit “MSE” (mathématiques, sciences, ingénierie) ou “Autre” pour toutes les autres disciplines.

 

Tangrams 2

Figure 2. Les étudiants saisissent des données pertinentes les concernant à l'aide de l'interface en ligne du jeu du tangram.

Lorsque chaque étudiant a fini de jouer, ses données sont associées au temps de réalisation du puzzle. Lorsque le dernier termine le puzzle, les données sont immédiatement disponibles pour analyse.

Avant de creuser l'analyse de données, les étudiants doivent traduire la question en hypothèses testables. Dans ce cas, ils souhaitent déterminer si la différence entre les moyennes des deux populations (MSE et autres spécialisations) est statistiquement significative.

Voici l'hypothèse nulle (H0) et l'hypothèse alternative (Ha):

H0: les étudiants en MSE présentent la même durée moyenne de réalisation du tangram que les étudiants des autres spécialités.

Ha: les étudiants en MSE et ceux d'autres spécialités ne présentent pas la même durée moyenne de réalisation du tangram.

Les étudiants saisissent ensuite leurs données dans une feuille de travail Minitab pour calculer les statistiques descriptives.

 

Tangrams 3

Figure 3. Les étudiants peuvent saisir les données issues des travaux pratiques sur le tangram dans une feuille de travail –ou fenêtre de Session - Minitab.

Dans Minitab, les étudiants utilisent le menu Stat > Statistiques élémentaires > Afficher les statistiques descriptives pour identifier la moyenne de l'échantillon et l'écart type des temps de réalisation des étudiants en MSE et de ceux d'autres spécialités. Ils peuvent également choisir d'afficher d'autres statistiques telles que la médiane, le mode et la variance, entre autres.

 

Tangrams 4

Figure 4. La fonction Afficher les statistiques descriptives de Minitab affiche la moyenne d'échantillon et l'écart type des temps de réalisation des 96 étudiants en MSE et de 32 autres ayant joué au tangram.

Pour afficher la distribution des données, les étudiants utilisent le menu Graphique > Histogramme > Simple pour créer un histogramme :

 

Tangrams Histogram

Figure 5. Cet histogramme facilite la visualisation de la distribution des temps de réalisation pour les étudiants d’autres spéciailités, notamment des temps élevés et faibles, ainsi que du temps de réalisation moyen.

Les étudiants utilisent également le menu Graphique > Boîte à moustaches > y multiples > Simple pour afficher la distribution des données des deux populations et pour identifier facilement les valeurs aberrantes.

Ensuite, pour déterminer s'il existe une différence statistique entre les moyennes des étudiants en MSE et ceux d'autres spécialités, les étudiants effectuent un test d'hypothèse à deux échantillons dans Minitab. Etant donné qu'il y a deux populations indépendantes et que les étudiants souhaitent déterminer si les temps de réalisation moyens sont identiques, ils doivent choisir un test t à deux échantillons (Stat > Statistiques élémentaires > Test t à 2 échantillons) pour calculer la valeur de p.

Résultats

Pour chaque spécialité, la valeur de p du test t à deux échantillons était de 0,26 soit une valeur non significative pour un niveau de confiance de 95 % (α=0.05).

Par conséquent, les analystes ne peuvent pas rejeter l'hypothèse nulle et concluent qu'il n'existe pas de différence significative entre les moyennes des deux populations.

Les résultats du test d'hypothèse surprendront car temps de réalisation moyens pour les étudiants en MSE sont 22 % plus courts que ceux des étudiants inscrits dans d’autres spécialités. Cela semble indiquer que les étudiants en MSE ont été plus performants que les autres. Toutefois, l’écart type est grand dans les temps de réalisation, ce qui diminue la confiance globale dans les moyennes des populations.

A la suite du test, les étudiants peuvent valider les conditions d’applicabilité du test t. Une condition très importante est : « l'échantillon des participants à cette étude est aléatoire ». Vérifier ces conditions familiarise les étudiants aux problèmes que les chercheurs rencontrent lorsqu'ils mènent leurs expériences. Dans la pratique, obtenir un échantillon aléatoire est difficile. Pour de nombreuses raisons, l'échantillon de cet exemple pourrait ne pas être aléatoire, notamment parce que quatre groupes d’étudiants en statistiques ont participé à l'expérience.

Réactions des joueurs

Qu'est-ce que les étudiants pensent de cette approche de l'apprentissage des statistiques ?

De nombreux étudiants de Kevin Cummiskey ont répondu très favorablement à cette expérience en laboratoire basée sur des jeux. Ils étaient ravis d'avoir participé au processus de collecte de données et de voir concrètement comment procéder.

“Globalement, les étudiants ont aimé faire des jeux”, indique Kevin Cummiskey. “Les travaux pratiques en laboratoire les ont vraiment intéressés. Nombre d'entre eux ont indiqué que ces jeux leur avaient permis de comprendre comment les personnes utilisent les procédures statistiques.”

Grâce à des subventions prises en charge par la Fondation nationale pour la science, NSF DUE #0510392 et NSF DUE #1043814, des jeux ont été créés par Madame Kuiper et d’autres pour être utilisés comme cas concrets dans le cadre d'un cours d'introduction aux statistiques ou pour synthétiser les éléments clés appris.

Les ressources créées peuvent aussi être utilisées comme base d'un projet de recherche individuel ou pour aider étudiants et chercheurs dans d'autres disciplines à comprendre comment les statisticiens abordent le processus scientifique.

Des exemples, notamment ceux des travaux pratiques sur le tangram évoqués dans cet article, sont disponibles gratuitement sur http://web.grinnell.edu/individuals/kuipers/stat2labs/.

Pour en savoir plus sur les recherches de Kevin Cummiskey, Shonda Kuiper et Rod Sturdivant, lisez l'article “Using classroom data to teach students about data cleaning and testing assumptions”, Frontiers in Quantitative Psychology and Measurement, septembre 2012. Vous pouvez le télécharger gratuitement depuis la page Internet :http://www.frontiersin.org/Quantitative_Psychology_and_Measurement/10.3389/fpsyg.2012.00354/abstract

  • Minitab News

    Recevez gratuitement notre lettre d'information électronique mensuelle pour connaître l'actualité de Minitab, consulter les didacticiels, lire des études de cas, obtenir des conseils statistiques, et recevoir d'autres informations utiles.

    Pour s'abonner
  • Suivez Minitab

    Join Minitab on LinkedIn Follow Minitab on Twitter Like Minitab on Facebook
  • Plus d'articles

En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu. Lisez notre politique

OK