Section ANOVA
Le modèle d'analyse de variance (ANOVA) suppose-t-il que les réponses suivent une loi normale avec une variance de sigma carré ?
Dans un modèle ANOVA, ce n'est pas la totalité de la colonne de réponses qui doit suivre une loi normale, c'est le terme d'erreur.
- En fait, s'il y a vraiment un effet de traitement significatif et si la colonne de réponse devait provenir d'une combinaison de plusieurs lois normales, la loi résultante de la totalité e la colonne de réponse pourrait s'avérer non-normale.
Veuillez noter que dans le cas d'une ANOVA à un facteur contrôlé ou d'un test t à 2 échantillons, la réalisation d'un test de normalité à l'aide du Récapitulatif Graphique avec la colonne de réponse est valable tant que la variable Par est utilisée, étant donné qu'ici, nous étudions la normalité séparément pour chaque combinaison de traitement.
Les droites de Henry pour chaque combinaison de traitement peuvent également être employées à bon escient.
Dans le cas d'une ANOVA, les hypothèses de base peuvent être confirmées ou infirmées à l'aide des valeurs résiduelles d'un modèle ANOVA.
Lien utile :
Pour de plus amples informations, vous pouvez consulter une page d'étaillée sur l'Analyse de Variance (ANOVA) sur ce site (page en anglais).
- S'il y a un effet de traitement significatif, la variation de la colonne de réponse sera largement supérieure au sigma carré en raison de l’importance de la variation entre les groupes.
C'est la raison pour laquelle ce n'est pas l'écart type de la réponse mais la racine carrée du carré moyen de l'erreur (CME) que vous utiliserez pour calculer la puissance d'un modèle ANOVA. La racine carrée du carré moyen de l'erreur est la meilleure estimation de la variance du terme d'erreur.
Comment Minitab calcule-t-il les statistiques F pour l'Etude de R&R de l'Instrumentation (Croisée) lorsqu'une analyse de la variance (ANOVA) est choisie comme méthode d'analyse ?
Lorsque vous saisissez des opérateurs et des pièces dans le logiciel, Minitab suit les règles d'une analyse de variance (ANOVA) à deux facteurs contrôlés pour laquelle les deux facteurs sont supposés aléatoires.
Minitab ajuste un modèle ANOVA avec l'interaction Pièce*Opérateur d'une part et d'autre part Pièce et Opérateur comme effets principaux.
Si le p de l'interaction Pièce*Opérateur est supérieur à 0,25, Minitab ajuste un modèle réduit avec les effets principaux Pièce et Opérateur uniquement.
Lien utile :
Pour savoir pourquoi Minitab utilise un alpha de 0,25 pour déterminer si le terme de l'interaction Opérateur*Pièce doit être ou non conservé dans le modèle, vous pouvez consulter l'astuce n° 1336 (page en anglais)
Dans le cas où le p de l'interaction Pièce*Opérateur est inférieur à 0,25, le modèle réduit n'est pas utilisé et Minitab calcule les statistiques F comme suit :
Statistique F pour la Pièce = CM(Pièce) / CM(Pièce*Opérateur)
Statistique F pour l'Opérateur = CM(Opérateur) / CM(Pièce*Opérateur)
Lorsque le p de l'interaction Pièce*Opérateur est supérieur à 0,25, le modèle réduit est utilisé et Minitab calcule les statistiques F comme suit :
Statistique F pour la Pièce = CM(Pièce) / CM(Répétabilité)
Statistique F pour l'Opérateur = CM(Opérateur) / CM(Répétabilité)
Remarque :
Dans le manuel AIAG MSA, 3ème Edition, p.120, le p du terme de l'interaction est supérieur à 0,25 mais le terme de l'interaction n'a pas été supprimé du modèle. Il s'agit d'une erreur dans le manuel.
Référence bibliographique :
Automotive Industry Action Group (AIAG) (2002). Measurement Systems Analysis Reference Manual. Chrysler, Ford, General Motors Supplier Quality Requirements Task Force.
Pourquoi la sortie du test de l’ANOVA inclut-elle un « x » à côté d’une valeur de p dans le tableau de l’ANOVA et l'indication « inexact F-test » (test F inexact) ?
Dans un test F exact pour un terme, la valeur espérée du numérateur des carrés moyens diffère de la valeur espérée du dénominateur des carrés moyens à cause de la variance ou du facteur fixe. Sur ce point, vous pouvez consulter la question-réponse n°1194 sur ce site (en anglais uniquement).
Cependant, quelquefois, ce carré moyen ne peut pas être calculé. Dans ce cas, le logiciel Minitab utilise un carré moyen qui donne un test F approximatif et affiche un « x » à côté de la valeur de p pour indiquer que le test F est inexact.
Supposons par exemple que vous effectuez une ANOVA avec un facteur fixe appelé "Supplément" et le facteur aléatoire "Lac" et que le résultat suivant a été obtenu pour l'espérance mathématique des carrés moyens :
Espérance mathématique des carrés moyens selon la somme des carrés ajustés. Veuillez trouver ci-dessous la sortie proposée par le logiciel Minitab.
Calcul de l'espérance mathématique des carrés moyens pour chaque terme
- Supplément (4) + 1,7500(3) + Q[1]
- Lac (4) + 1,7143(3) + 5,1429(2)
- Supplément * Lac (4) + 1,7500(3)
- Erreur (4)
La statistique F de Supplément est le carré moyen de Supplément divisé par le carré moyen de l’interaction Supplément * Lac. Si l’effet Supplément est très petit, la valeur du numérateur sera égale à la valeur du dénominateur. Ceci est un exemple de test F exact.
Notez toutefois que pour un effet Lac très petit, la valeur espérée du numérateur ne peut être égale la valeur espérée du dénominateur. Par conséquent, Minitab utilise un test F approximatif. Dans notre exemple, le carré moyen de Lac est divisé par le carré moyen de l’interaction Supplément * Lac. Nous obtenons - grâce à ce F-test approximatif - une valeur espérée du numérateur égale à la valeur espérée du dénominateur si l’effet Lac est très petit. Ceci est un exemple de F-test inexact.
Référence bibliographique :
D. C. Montgomery (1997). Design and Analysis of Experiments, 4ème édition, John Wiley & Sons
Chaque statistique F est un ratio des carrés moyens.
Le numérateur est le carré moyen pour le terme.
Le dénominateur est choisi de façon à ce que la différence entre la valeur espérée du carré moyen du numérateur et la valeur espérée du carré moyen du dénominateur soit égale à l'effet concerné.
L'effet pour un terme aléatoire est représenté par la composante de la variance du terme.
L'effet pour un terme fixe est représenté par la somme des carrés des composantes du modèle associées à ce terme divisée par ses degrés de liberté.
En conséquence, une statistique F élevée dénote un effet important.
Lorsque tous les termes du modèle sont fixes, le dénominateur pour chaque statistique F est l'erreur quadratique moyenne (MSE).
Toutefois, pour les modèles comprenant des termes aléatoires, la MSE n'est pas toujours le bon carré moyen.
L'espérance mathématique des carrés moyens (EMS) peut être utilisée pour déterminer la valeur qui convient au dénominateur.
Remarques :
- Pour afficher l'EMS pour les termes du modèle
- Cliquez sur "Résultats" dans la boîte de dialogue "ANOVA Equilibrée" ou "Modèle Linéaire Généralisé" dans la version 13 du logiciel ou sur "Results" in the "Balanced ANOVA" or "General Linear Model" dialog box dans la version 14.
- Cochez "Afficher l'espérance mathématique des carrés moyens et les composantes de la variance" dans la version 13 de Minitab ou "Display expected mean squares and variance components" dans Minitab 14.
- Un test F approximatif doit être utilisé lorsqu'il n'y a pas de carré moyen de manière à ce que la différence entre la valeur espérée du carré moyen du numérateur et la valeur espérée du carré moyen du dénominateur soit égale à l'effet concerné.
Supposons, par exemple, que vous ayez exécuté une Analyse de la variance (ANOVA) avec le facteur fixe "Ecran" et le facteur aléatoire "Tech".
Les résultats suivants ont été donnés pour l'espérance mathématique des carrés moyens (EMS) :
Source Carré Moyen Espéré pour Chaque Terme
- Ecran (4) + 2.0000(3) + Q[1]
- Tech (4) + 2.0000(3) + 4.0000(2)
- Ecran*Tech (4) + 2.0000(3) 4 Erreur (4)
Un nombre entre parenthèses dénote un effet aléatoire associé au terme figurant à côté du numéro de source.
Ainsi :
(2) représente l'effet aléatoire de Tech.
(3) représente l'effet aléatoire de l'interaction Ecran*Tech
(4) représente l'effet aléatoire d'Erreur.
L'EMS pour Erreur est l'effet du terme erreur.
De même, l'EMS pour Ecran*Tech est l'effet du terme erreur plus deux fois l'effet de l'interaction Ecran*Tech.
Pour calculer la statistique F pour Ecran*Tech, le carré moyen pour Ecran*Tech est divisé par le carré moyen pour Erreur de façon à ce que la valeur espérée du numérateur (EMS pour Ecran*Tech = (4) + 2.0000(3)) diffère de la valeur espérée du dénominateur (EMS pour Erreur = (4)) seulement par l'effet de l'interaction (2.0000(3)).
En conséquence, une statistique F élevée dénote une interaction Ecran*Tech importante.
Un nombre avec l'indice Q[ ] dénote l'effet fixe associé au terme figurant à côté du numéro de source.
Par exemple, Q[1] est l'effet fixe d'Ecran.
L'EMS pour Ecran est l'effet du terme erreur plus deux fois l'effet de l'interaction Ecran*Tech plus une constante fois l'effet d'Ecran.
D'après Montgomery, Q[1] égale (b*n * somme((coefficients pour des niveaux d'Ecran)**2)) divisé par (a - 1), où a et b sont, respectivement, le nombre de niveaux d'Ecran et Tech et n est le nombre de répétitions.
Pour calculer la statistique F pour Ecran, le carré moyen pour Ecran est divisé par le carré moyen pour Ecran*Tech afin que la différence entre la valeur espérée du numérateur (EMS pour Ecran = (4) + 2.0000(3) + Q[1] ) et la valeur espérée du dénominateur (EMS pour Ecran*Tech = (4) + 2.0000(3)) soit égale à l'effet dû à l'Ecran (Q[1]).
En conséquence, une statistique F élevée dénote un effet Ecran important.
Référence bilbiographique :
D. C. Montgomery (1997) : "Design and Analysis of Experiments" (Plan et Analyse d'Expériences), Quatrième Edition. John Wiley & Sons.
Lien utile :
Vous pouvez consulter l'astuce numéro 837 en anglais.
Le Modèle Linéaire Général (General Linear Model - GLM) n’affiche pas tous les coefficients pour le modèle. Comment calculer les valeurs ajustées ?
Supposons que le plan a 2 facteurs (Factor1 et Factor2).
Factor1 a deux niveaux (a et b) et Factor2 a trois niveaux (x, y, et z).
Les données pour Factor1 sont dans C1, les données pour Factor2 sont dans C2 et les résultats sont dans C3.
Vous exécutez le Modèle linéaire général avec Factor1, Factor2 et l’interaction à deux facteurs Factor1*Factor2 dans le modèle.
Option 1: Utilisation de la fonctionnalité Stockage
Cette option vous permet de calculer les valeurs ajustées à l'aide des valeurs sur la feuille de travail.
- Choisissez Statistiques > ANOVA > Modèle Linéaire Général [Stat > ANOVA > General Linear Model dans Minitab en anglais].
- Dans Réponses [Responses], tapez C3. Dans Modèle [Model], entrez Factor1 Factor2 Factor1*Factor2.
- Cliquez sur Stockage [Storage]. Cochez Valeurs ajustées [Fits].
- Cliquez sur OK dans chaque boîte de dialogue.
Les valeurs ajustées sont stockées dans la colonne vide suivante sur la feuille de travail, intitulée AJUSTEES1 [FITS1].
Option 2: Utilisation de valeurs codées dans l'équation.
Supposons que vous obtenez les coefficients suivants dans le résultat :
Terme Coef Coef ET T P
Constante 8.0000 0.5528 14.47 0.000
Factor1
a -0.6667 0.5528 -1.21 0.273
Factor2
x 5.0000 0.7817 6.40 0.001
y -2.0000 0.7817 -2.56 0.043
Factor1*Factor2
a x -2.8333 0.7817 -3.62 0.011
a y 1.6667 0.7817 2.13 0.077
L’équation est :
8.0000 + -0.6667*a + 5.0000*x - 2.0000*y - 2.8333*a*x + 1.6667*a*y
Si Factor1 est fixé à a, utiliser a=1.
Si Factor1 est fixé à b, utiliser a=-1.
Si Factor2 est x, utiliser x=1 et y=0.
Si Factor2 est y, utiliser x=0 et y=1.
Si Factor2 est z, utiliser x=-1 et y=-1.
Supposons que la 9ème ligne dans l’ensemble des données a Factor1=b et Factor2=z.
La valeur ajustée est :
= 8.0000 + - 0.6667*-1 + 5.0000*-1 - 2.0000*-1 - 2.8333*-1*-1 + 1.6667*-1*-1
= 8.0000 + 0.6667 - 5.0000 + 2.0000 - 2.8333 + 1.6667
= 4.5
Si vous choisissez l'option 1, c'est à dire de stocker les valeurs ajustées, vous verrez 4,5 à la ligne 9 (avec Factor1=b et Factor2=z) de la colonne AJUSTEES 1 [FITS1].
Remarque :
Vous pouvez faire en sorte que Minitab affiche les coefficients qui ne sont pas affichés en effectuant une nouvelle analyse du plan après modification du niveau de référence.
Pour des informations sur la modification du niveau de référence, vous pouvez consulter l’astuce numéro 1301 sur notre site internet en anglais.
Supposons que vous modifiez le niveau de référence pour Factor1 pour le mettre dans l’ordre b a et le niveau de référence pour Factor2 pour le mettre dans l'ordre z x y.
Puis, supposons que vous exécutiez le Modèle linéaire général avec Factor1, Factor2 et l’interaction à deux facteurs Factor1*Factor2 dans le modèle.
Vous obtiendrez le résultat suivant :
Terme Coef Coef ET T P
Constante 8.0000 0.5528 14.47 0.000
Factor1
b 0.6667 0.5528 1.21 0.273
Factor2
z -3.0000 0.7817 -3.84 0.009
x 5.0000 0.7817 6.40 0.001
Factor1*Factor2
b z -1.1667 0.7817 -1.49 0.186
a x 2,8333 0.7817 3,62 0.011
Pour cette analyse, l’équation est :
= 8.0000 + 0.6667*b + -3.0000*z - 5.0000*x - 1.1667*b*z + 2.8333*b*x
Si Factor1 est fixé à b, utiliser b=1.
Si Factor1 est fixé à a, utiliser b=-1.
Si Factor2 est z, utiliser z=1 et x=0.
Si Factor2 est x, utiliser z=0 et x=1.
Si Factor2 est y, utiliser z=-1 et x=-1.
Supposons que la 9ème ligne dans l’ensemble des données a Factor1=b et Factor2=z.
La valeur ajustée est :
= 8.0000 + 0.66674*1 + -3.0000*1 - 5.0000*0 - 1.1667*1*1 + 2.8333*1*0
= 8.0000 + 0.6667 + -3.0000 - 1.1667
= 4.5
Liens utiles :
Vous pouvez consulter les astuces numéros 1301 et 170 en anglais.
Revenir au sommaire des questions-réponses.