La carte T dans Minitab Statistical Software

Outre des rappels théoriques, cet article illustre la mise en oeuvre de la carte T dans Minitab Statistical Software à l'aide de cas réels et de recommandations pour savoir les utiliser.

Informations sur la carte T

La carte T est une carte de contrôle permettant de surveiller le temps écoulé entre des événements indésirables, sur la base d'une échelle continue. Elle constitue une extension de la carte G, généralement utilisée pour représenter le nombre de jours ou d'opportunités entre des événements, sur la base d'une échelle discontinue. A l'instar de la carte G, la carte T permet de détecter les variations du taux de survenue des événements indésirables.
Lorsque vous lisez la carte T, gardez à l'esprit que les points situés au-dessus de la limite de contrôle supérieure indiquent que le temps écoulé entre les événements a augmenté et, par conséquent, que leur taux a diminué. Les points situés en dessous de la limite de contrôle inférieure indiquent à l'inverse que le taux d'événements indésirables a augmenté.

Approche par transformation

La méthode dite "carte T par transformation" transforme toutes les données relatives au temps écoulé entre les événements et les convertit en données normalement distribuées. Les données ainsi transformées sont utilisées pour déterminer les limites de contrôle ensuite reconverties selon l'échelle des données d'origine, puis représentées à l'aide de ces dernières.

Cette approche cause des difficultés : en effet, les queues de distribution des données transformées ne sont pas très adaptées à une distribution normale. Avec cette approche par transformation, la probabilité qu'un point soit situé hors des limites de contrôle est de seulement 0,0007546. A l'inverse, avec une carte de contrôle standard reposant sur une distribution normale (comme une carte I ou une carte X barre), la probabilité qu'un point soit situé hors des limites de contrôle est bien plus élevée, atteignant 0,00269. L'application de la méthode de transformation à une carte T résulte en une probabilité anormalement faible de points hors des limites de contrôle et, par conséquent, en une période opérationnelle moyenne (POM) excessive.

Les simulations (voir tableau 3 ci-dessous) montrent que le taux de fausses alertes augmente de façon exponentielle pour les données fortement asymétriques et diminue pour atteindre une valeur proche de 0 pour les données qui le sont moins. De manière générale, une carte T avec l'approche par transformation présente de très faibles capacités de détection, en particulier concernant la limite de contrôle inférieure. Du fait de cette faiblesse, il est pratiquement impossible de détecter les augmentations du taux d'événements indésirables avec cette approche.

Approche par distribution exponentielle

Une autre approche possible pour la carte T consiste à modéliser le temps écoulé entre les événements à l'aide d'une distribution exponentielle. Ainsi, si des événements indésirables surviennent selon la loi de Poisson, le temps écoulé entre les événements suit une distribution exponentielle. Cette approche utilise les percentiles de la distribution exponentielle correspondant aux zones sigma ± 1, 2, et 3 dans une carte standard reposant sur une distribution normale. Ces percentiles sont également appelés "limites de probabilité". L'utilisation des limites de probabilité implique les deux conditions suivantes :

  • La période opérationnelle moyenne et le taux de fausses alertes d'un procédé contrôlé sont identiques à ceux attendus dans une carte X barre présentant des données normalement distribuées.
  • La période opérationnelle moyenne et le taux de fausses alertes attendus ne s'appliquent que si les données sont issues d'une distribution exponentielle.

Le problème induit par cette approche est le suivant : bien qu'il s'agisse en théorie de la distribution appropriée pour le temps écoulé entre des événements obéissant à la loi de Poisson, en pratique les données suivent généralement un modèle légèrement différent. Les données peuvent sembler distribuées de façon exponentielle, mais dévient en réalité suffisamment pour que l'incidence sur la période opérationnelle moyenne et le taux de fausses alertes soit significative. Si les données proviennent d'une distribution plus fortement asymétrique qu'une distribution exponentielle, le taux de fausses alertes peut être extrêmement élevé au niveau de la limite inférieure, il peut être alors conlue, à tort, que le taux d'événements indésirables a augmenté. D'un autre côté, si les données proviennent d'une distribution moins asymétrique qu'une distribution exponentielle, la capacité de détection de l'augmentation du taux d'événements indésirables se rapproche de 0.

La distribution exponentielle présente une valeur d'asymétrie de 2 et un coefficient d'aplatissement de 6. Les simulations (voir tableaux 1 à 3 ci-dessous) montrent que plus l'asymétrie et l'aplatissement des données augmentent par rapport à ces valeurs, plus le taux de fausses alertes associé à la limite de contrôle inférieure augmente de façon exponentielle. Le taux de fausses alertes associé à la limite de contrôle supérieure augmente quant à lui plus lentement. Plus l'asymétrie et l'aplatissement de la distribution diminuent par rapport aux valeurs exponentielles de 2 et 6, plus le taux de fausses alertes associé à la limite de contrôle supérieure augmente, tandis que le taux de fausses alertes associé à la limite de contrôle inférieure se rapproche de 0.

Approche de Minitab : la distribution de Weibull

Afin d'améliorer le potentiel de la carte, Minitab utilise la distribution de Weibull, et non la distribution exponentielle, pour modéliser le temps écoulé entre des événements. La distribution de Weibull présente deux paramètres : la forme et l'échelle. Si le paramètre de forme est égal à 1, la distribution de Weibull est identique à une distribution exponentielle présentant le même paramètre d'échelle.

En faisant varier le paramètre de forme autour de 1, la distribution de Weibull peut prendre différentes formes : une extrêmement pointue et étalée vers la droite (pour un paramètre de forme inférieur à 1), une symétrique (pour un paramètre de forme autour de 3) et une étalée vers la gauche (en général pour un paramètre de forme supérieur à 5). Il est attendu que le paramètre de forme soit compris entre 0,5 et 2, car la distribution serait alors proche de la distribution exponentielle prévue. Même si l'utilisation de limites de probabilité issues d'une distribution de Weibull implique toujours que la période opérationnelle moyenne et le taux de fausses alertes attendus ne s'appliqueront que si les données proviennent d'une distribution de Weibull, cette famille élargie de distributions augmente les chances d'obtenir des résultats appropriés.

Simulations de carte T

Dans les tableaux suivants, 100 échantillons aléatoires, de10 000 points de données chacun, ont été simulés à partir de la distribution spécifiée. La proportion de points situés hors des limites de contrôle est indiquée dans les tableaux. Pour une carte standard reposant sur une distribution normale, comme une carte X barre, la proportion attendue de points situés hors des limites est de 0,00269.

Les simulations utilisent les distributions de Weibull et de Khi deux. Une distribution de Khi deux avec 2 degrés de liberté est identique à une distribution exponentielle avec une moyenne de 2. En faisant varier le degré de liberté autour de 2, la distribution de Khi deux devient plus ou moins asymétrique qu'une distribution exponentielle. (Voir figure 1.) Une distribution de Weibull avec un paramètre de forme de 1 est identique à une distribution exponentielle avec une moyenne égale au paramètre d'échelle de la distribution de Weibull. En faisant varier le paramètre de forme autour de 1, la distribution de Weibull devient plus ou moins asymétrique qu'une distribution exponentielle. (Voir figure 2).

 

 

Tableau 1a : carte T reposant sur une distribution exponentielle avec des données issues d'une distribution de Khi deux
Echantillonnage à partir d'une distribution de Khi deux

Degré de liberté  Asymétrie   Aplatissement   En dessous de la limite LCI   Au-dessus de la limite LCS  Total de points hors limites    % de points hors limites attendus
0,5   4,03   24,21   0,149413   0,027207   0,17662   6565,80 %
  0,75   3,34   17,31   0,065271   0,016747   0,08218  3055,02 %
  1  2,81    11,73   0,029265   0,010133   0,039398  1464,61 %
 1,25    2,55   9,9   0,013345   0,006102   0,019453  723,16 %
  1,5  2,3    7,83   0,006159   0,003682   0,009841  365,84 %
 1,75    2,12   6,63   0,002868   0,002223   0,005091  189,26 %
  2   1,96   5,85   0,001351   0,001339   0,00269  100 %
  2,5   1,8   4,9   0,000227   0,001839  0,002689   99,96 %
  3   1,64   4,03   0,000037   0,004179   0,004216  156,73 %
  3,5   1,52  3,39    0,000006   0,006696   0,006702  249,14 %

 

Tableau 1b : carte T reposant sur une distribution exponentielle avec des données issues d'une distribution de Weibull
Echantillonnage à partir d'une distribution de Weibull

 

Forme 

Asymétrie   Aplatissement   En dessous de la limite LCI   Au-dessus de la limite LCS  Total de points hors limites    % de points hors limites attendus
 2  0,63  0,25   0,000002   0  0,000002  0,07 %
1,75  0,83  0,69   0,00001  0   0,00001  0,37 %
1,5  1,07  1,4  0,000049  0,000049  1,82 %
 1,25  1,43  2,77  0,000258  0,000025  0,000283  10,52 %
2,02  6,13   0,001335  0,001355   0,00269  100 %
 0,75  3,08  15,04  0,007002  0,016195  0,023197   862,34 %
0,5  6,32  68,71  0,036022  0,076449  0,112461  4180,71 %

 

Tableau 2a : carte T reposant sur une distribution de Weibull avec des données issues d'une distribution de Khi deux
Echantillonnage à partir d'une distribution de Khi deux

 Degré de liberté    Asymétrie  Aplatissement    En dessous de la limite LCI  Au-dessus de la limite LCS   Total de points hors limites   % de points hors limites attendus
 0,5   4,03   24,21   0,006500  0,000000    0,006288 

233,75 %

 0,75   3,34   17,31   0,004558  0,000013   0,004571  169,93 %
 1  2,81    11,73   0,003635   0,000115   0,003750  139,41 %
 1,25   2,55   9,9   0,002788   0,000506   0,003294  122,45 % 
1,5    2,3   7,83   0,001945   0,000621   0,002566  95,39 %
 1,75   2,12   6,63   0,001656   0,000898   0,002554  94,94 % 
 2   1,96   5,85   0,001596   0,001529   0,003125  116,17 %
 2,5   1,8   4,9   0,000877   0,001849   0,002726  101,34 %
 3   1,64   4,03   0,000585   0,002055  0,002640   98,14 %
 3,5   1,52   3,39   0,000453   0,003190  0,003643   135,43 % 

 

Tableau 2b : carte T reposant sur une distribution de Weibull avec des données issues d'une distribution de Weibull
Echantillonnage à partir d'une distribution de Weibull

Forme   Asymétrie   Aplatissement   En dessous de la limite LCI   Au-dessus de la limite LCS   Total de points hors limites  % de points hors limites attendus
 2    0,63   0,25  0,001386   0,001538   0,002924  108,70 %
1,75   0,83  0,69  0,001365    0,001521  0,002886  107,29 % 
1,5    1,07   1,4   0,001335    0,001312  0,002647  98,40 % 
 1,25   1,43   2,77   0,001299   0,001351   0,002650  98,51 % 
 1    2,02  6,13   0,001475    0,001498  0,002973  110,52 % 
 0,75    3,08  15,04   0,001368   0,001347   0,002715  100,93 %
 0,5    6,32  68,71   0,001220    0,001375  0,002595   96,47 %

 

Tableau 3 : carte T reposant sur une transformation avec des données issues d'une distribution de Khi deux
Echantillonnage à partir d'une distribution de Khi deux

 Degré de liberté 

Asymétrie   Aplatissement   Total de points hors limites   

% de points hors limites attendus

 0,5    4,03   24,21   0,14365  5340,15 %
 0,75    3,34   17,31  0,073075   2716,54 %
 1   2,81   11,73   0,0367875   1367,57 %
 1,25   2,55   9,9   0,017825   662,64 %
 1,5   2,3   7,83   0,0095125   353,62 %
 1,75   2,12   6,63   0,00523333   194,55 %
 2    1,96  5,85   0,00256   95,17 %
 2,5   1,8    4,9  0,00069333   25,77 %
  3   1,64  4,03   0,00034   12,64 %
 3,5   1,52  3,39  0,00017333  6,44 %


Figure 1 : comparaison de la distribution de Khi deux et de la distribution exponentielle
  
Figure 1  

Figure 2 : comparaison de la distribution de Weibull et de la distribution exponentielle

Figure 2  
  

Cas d'emploi de la carte T

La différence entre une carte G et une carte T repose sur l'échelle utilisée pour mesurer la distance entre les événements. La carte G a recours à une échelle discontinue (nombres de jours ou d'opportunités entre les événements, soit des nombres entiers). La carte T emploie une échelle continue (généralement les dates et heures auxquelles les événements surviennent). La plupart des emplois de la carte T abordés dans les études concernent la surveillance des taux d'infections en milieu médical. Cette carte peut également servir à la surveillance des erreurs de médicaments, des chutes de patients, des complications chirurgicales et d'autres événements indésirables.

Il n'est pas nécessaire d'avoir à la fois les dates et les heures. En réalité, seules les données relatives aux dates sont attendues. Si le nombre d'opportunités par jour n'est pas relativement constant, une carte T peut s'avérer plus appropriée qu'une carte G.

Propriétés de la carte T

Comme les autres cartes de contrôle, la carte T possède une ligne centrale et des limites de contrôle supérieure et inférieure. Elle comporte également des zones correspondant aux zones sigma ± 1, 2, 3 d'une carte X barre ou d'une carte I. Ces zones ne sont pas affichées sur la carte, mais elles sont utilisées dans les tests à des fins spécifiques. Les zones et limites de contrôle sont toutes basées sur les percentiles de la distribution de Weibull. Elles ne sont pas des multiples de l'écart type au-dessus et au-dessous de la ligne centrale, comme dans les autres cartes. Par conséquent, les zones et limites de contrôle ne sont pas disposées de façon symétrique autour de la ligne centrale, excepté dans les rares cas où la distribution de Weibull est elle-même symétrique.

Les données représentées sur la carte correspondent au nombre de jours et d'heures écoulés entre les événements. Cela rend l'interprétation de la carte quelque peu inhabituelle. Ainsi, par exemple, si le taux d'infections augmente, le temps écoulé ou le nombre d'intervalles entre les infections diminue et peut même être nul. A l'inverse, si le taux diminue, le temps écoulé ou le nombre d'intervalles entre les infections augmente. Par conséquent, un point situé au-dessus de la limite de contrôle supérieure indique une période anormalement longue entre les infections ou, en d'autres termes, que le taux est anormalement faible.

Un bémol cependant : si les limites de contrôle sont fixes et seul le test 1 est utilisé, la période opérationnelle moyenne (POM) augmentera si le taux augmente lui aussi. Si le taux augmente de 25 % et les limites de contrôle sont fixes, la période opérationnelle moyenne augmentera d'environ 40 %. Par conséquent, la capacité de la carte T à détecter les augmentations du taux d'événements est faible. Pour compenser cette faiblesse, Minitab applique par défaut à la fois le test 1 et le test 2. Ce dernier n'augmente que très peu la période opérationnelle moyenne en cas de diminutions du temps moyen d'environ 10 % et diminue la période opérationnelle moyenne en cas de variations importantes du temps moyen.

Calculs utilisés

Notation

Une carte T peut être utilisée pour 3 types de données différents :

  • Données numériques non négatives
    Ce type de données correspond au nombre d'intervalles entre les événements. Il peut s'agir d'une valeur continue (par exemple, 13,0957) ou d'un nombre entier (bien que les entiers soient plus généralement associés à l'utilisation d'une carte G). Si ce type de données est indiqué, il s'agit des valeurs Xi utilisées dans la carte.

    Remarque : 0 est une valeur acceptable. Elle signifie que deux événements sont survenus au même moment. Si la valeur 0 est utilisée dans les données, une méthode alternative est employée pour l'estimation des paramètres.
  • Données de date/d'heure (par exemple, 01/23/2011 8:32:14)
    Ce type de données enregistre la date et l'heure de chaque événement. Chaque valeur de données doit être >= à la valeur précédente. Il est possible d'enregistrer uniquement les dates, sans se soucier des heures (bien que les données de date uniquement soient généralement associées à l'utilisation d'une carte G). Si des valeurs de date/d'heure sont indiquées, les valeurs Xi de la carte sont calculées comme suit :

    Si D1, D2, …, DN représentent les valeurs de date/d'heure indiquées, alors X2 = D2 – D1, X3 = D3 – D2, … , XN = DN – DN-1.

    Le résultat (entier ou non) correspond au nombre de jours entre les événements.

    Remarque : si seules des dates sont indiquées, le résultat est un entier. Ce type de données est généralement associé à l'utilisation d'une carte G.
  • Données de durée entre les événements (par exemple, 8:32:14)
    Ce type de données est également appelé données de temps écoulé. Les données représentent le temps écoulé entre l'événement i et l'événement i-1. Si ce type de données est indiqué, il s'agit des valeurs Xi utilisées dans la carte.
  • Xi = points de la droite, comme expliqué ci-dessus.

    Si aucune valeur 0 ne figure dans les données Xi, les estimations de l'EMaxV concernant les paramètres de forme (KAPPA) et d'échelle (LAMBDA) sont calculées à partir des données et utilisées pour obtenir les percentiles de la distribution de Weibull.


    Si la valeur 0 est utilisée dans les données Xi, la méthode alternative suivante est employée pour l'obtention des paramètres :

  • Classer les données par ordre croissant. 
  • p = (rang – 0,3) / (n + 0,4)
  • X = ln( -ln(1 – p) )
  • Supprimer les lignes (X et données) où les données = 0
  • Y = Ln(Data)
  • Régression de Y sur X, obtention de l'équation Y = B0 + B1*X
  • LAMBDA = exp(B0), KAPPA = 1/B1 
  • Limites estimées à partir des données

    Si p1, p2, p3, p4, p5, p6, p7 correspondent aux valeurs CDF de Normal(0,1) pour -3, -2, -1, 0, +1, +2, +3,

    Si w1, w2, w3, w4, w5, w6, w7 correspondent aux valeurs invcdf pour p1, p2, p3, p4, p5, p6, p7 en utilisant une distribution de Weibull (KAPPA, LAMBDA),

    Alors, les limites LCI et LCS sont calculées comme suit :

    LC = w4
    LCS = w7
    LCI = w1

    Utilisation de paramètres historiques

    Si des paramètres historiques sont indiqués, la carte repose sur les paramètres de forme et d'échelle de la distribution de Weibull, tout comme les autres cartes utilisent les paramètres de moyenne et d'écart type. L'utilisateur doit cependant saisir les valeurs historiques des deux paramètres (alors qu'il est possible de n'indiquer qu'un paramètre dans la carte I et la carte X barre).

    Le paramètre de forme doit être > 0, et il doit être compris entre 0,5 et 2 dans la plupart des cas, bien que ces limites soient avant tout utilisées pour des raisons pratiques. Les paramètres de forme < 0,5 impliquent une distribution extrêmement asymétrique et peuvent présenter un coefficient d'aplatissement supérieur à 2 000. (Une distribution exponentielle présente un coefficient d'aplatissement de 6 seulement.) Les paramètres de forme supérieurs à 2 impliquent une distribution s'approchant d'une distribution symétrique, voire étalée vers la gauche. Ces deux cas sont peu réalistes car les données relatives au temps écoulé entre les événements sont généralement fortement étalées vers la droite.

    Le paramètre d'échelle doit être > 0 et légèrement supérieur à la moyenne des données. Si le paramètre d'échelle est inférieur à la moyenne des données ou beaucoup trop élevé par rapport à cette dernière, les limites de la carte ne reflètent pas le procédé avec précision et peuvent conduire à un grand nombre de fausses alertes.
    Remarque : les valeurs historiques indiquées remplacent les valeurs KAPPA et LAMBDA utilisées dans les équations ci-dessus pour l'obtention des limites de contrôle, de la ligne centrale, etc.

    Tests de carte de contrôle standard utilisés dans la carte T

    Test 1 – 1 point hors des percentiles correspondant aux écarts types K par rapport à la ligne centrale dans une carte reposant sur une distribution normale (point de la droite < w1 ou > w7, si K = 3, voir ci-dessous si K <> 3)

    Test 2 – K points alignés d'un côté ou de l'autre de la ligne centrale

    Test 3 – K points alignés, tous en augmentation ou en diminution

    Test 4 – K points alignés, en alternance vers le haut et vers le bas

    Test 5 – K en dehors de K + 1 points > w6, ou K en dehors de K + 1 points < w2

    Test 6 – K en dehors de K + 1 points > w5, ou K en dehors de K + 1 points < w3

    Test 7 – K points alignés >= w3 et <= w5

    Test 8 – K points alignés < w3 ou > w5

    Dans le test 1, si l'argument K est égal à 3, les valeurs w1 et w7 employées pour les limites de contrôle sont utilisées pour définir les échecs du test 1 (à savoir, les points < w1 ou > w7). Si l'argument K n'est pas égal à 3, vous devez définir p1' et p2' comme valeurs CDF de Normal(0,1) pour –K et +K. Vous devez ensuite définir w1' et w7' comme valeurs invcdf de la distribution de Weibull (KAPPA, LAMBDA) correspondant à p1' et p2'. La définition d'un échec du test 1 est donc un point < w1' ou > w7'.

    Dans les tests ci-dessus, w1, w2, w3, w4, w5, w6, w7 correspondent aux valeurs définies précédemment (à savoir, valeurs invcdf de la distribution de Weibull correspondant à p1, p2, p3, p4, p5, p6, p7 et valeurs CDF de Normal(0,1) pour -3, -2, -1, +1, +2, +3). Toutefois, si l'argument du test 1 est <> 3, seules les valeurs w1 et w7 sont remplacées par w1' et w7'. 

    Références

    [1] L. Y. Chan, D. K. J. Lin, M Xie et T. N. Goh. Cumulative Probability Control Charts for Geometric and Exponential Process Characteristics. International Journal of Production Research, 40:133-150, 2002.

    [2] L. Y. Chan, M Xie et T. N. Goh. Cumulative Quantity Control Charts for Monitoring Production Processes. International Journal of Production Research, 38:397-408, 2000.

    [3] F. F. Gan. Design of Optimal Exponential CUSUM Charts. Journal of Quality Technology, 26(2):109-124, 1994.

    [4] F. F. Gan. Designs of One-Sided and Two-Sided Exponential EWMA Charts. Journal of Quality Technology, 30:55-69, 1998.

    [5] F. C. Kaminsky, J. C. Benneyan, R. D. Davis et R. J. Burke. Statistical Control Charts Based on a Geometric Distribution. Journal of Quality Technology, 24:63-69, 1992.

    [6] J. Y. Liu, M. Xie, T. N. Goh et P. R. Sharma. A Comparative Study of Exponential Time Between Events Charts. Quality Technology of Quantitative Management, 3:347-359, 2006.

    [7] D. C. Montgomery. Introduction to Statistical Quality Control, Wiley, 6e édition, 2009.

    [8] M. Xie, T. N. Goh et P. Ranjan. Some Effective Control Chart Procedures for Reliability Monitoring. Reliability Engineering and System Safety, 77:143-150, 2002.

    [9] C. W. Zhang, M. Xie et T. N. Goh. Design of Exponential Control Charts Using a Sequential Sampling Scheme. IIE Transactions, 38:1105-1116, 2006.

    [10] C. W. Zhang, M. Xie et T. N. Goh. Economic Design of Exponential Charts for Time Between Events Monitoring. International Journal of Production Research, 43:5019-5032, 2005.

     

    Préparé par le Dr Terry Ziemer, SIXSIGMA Intelligence


    Télécharger cet article au format PDF (uniquement en anglais)

    • Minitab News

      Recevez gratuitement notre lettre d'information électronique mensuelle pour connaître l'actualité de Minitab, consulter les didacticiels, lire des études de cas, obtenir des conseils statistiques, et recevoir d'autres informations utiles.

      Pour s'abonner
    • Suivez Minitab

      Join Minitab on LinkedIn Follow Minitab on Twitter Like Minitab on Facebook
    • Plus d'articles

    En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu. Lisez notre politique

    OK