La carte G dans Minitab Statistical Software

Cet article présente des rappels théoriques, des applicatifs et des informations techniques concernant la mise en oeuvre, dans Minitab Statistical Software, de la carte G développée par James Benneyan.

Informations sur la carte G

Développée par James Benneyan en 1991, la carte g (appelée "carte G" dans le logiciel de statistiques Minitab) est une carte de contrôle basée sur la distribution géométrique. Depuis, James Benneyan a publié plusieurs articles sur la carte G et sur une carte qui lui est associée : la carte h (cf. Health Care Management Science, Vol. 4, pages 305-318, 2001, article à la base de la carte G de Minitab.) La plupart des applications citées dans ces articles sont liées à des taux d'infections, telles que les infections nosocomiales, dans les centres de soin. Les infections nosocomiales sont des infections contractées par un patient lors d'un traitement, d'une opération ou tout autre soin reçu dans un établissement hospitalier ou une clinique.

Habituellment, les analystes exploitent les cartes P et U pour suivre les événements indésirables. Cependant, ces deux cartes requièrent une grande quantité de données, satisfaisant certaines spécifications précises. Par exemple, si vous utilisez une carte U pour surveiller les infections nosocomiales, chaque jour-patient est considéré comme une période pendant laquelle une ou plusieurs infections peuvent survenir. Ainsi, les données correspondent au nombre d'infections par jour-patient. Si vous utilisez une carte P, les données correspondent au nombre de jours-patients durant lesquels au moins une infection est survenue. Concernant les données minimales requises, si vous suivez la procédure habituelle exigeant au moins 25 à 35 sous-groupes pour établir des limites de contrôle, et que le taux d'infections est faible (par exemple 1 %), la quantité de données requises est d'au moins 12 500 patients (500 patients par sous-groupe, multiplié par 25 sous-groupes). Cela peut donc prendre des semaines, des mois, voire des années pour accumuler suffisamment de données afin de détecter des changements dans le taux d'infections et d'agir en conséquence.

La distribution géométrique propose une autre méthode statistique. Dans la distribution géométrique, vous comptez le nombre d'opportunités avant ou jusqu'à ce qu'un défaut survienne. Par conséquent, pour reprendre l'exemple du taux d'infections nosocomiales, l'idéal serait de comptabiliser le nombre de patients ou d'actes précédant l'infection. Mais cette situation idéale est rarement atteinte en raison des complications dues au calcul du nombre réel de patients ou du nombre d'actes médicaux. La méthode la plus couramment adoptée consiste donc à compter le nombre de jours entre les infections constatées avec, pour hypothèse clé, la relative constance du nombre de patients ou d'actes journaliers.

Applications de la carte G

Comme mentionné précédemment, la plupart des applications citées dans l'article de James Benneyan proviennent des dispositifs médicaux. Cependant, la carte G est adaptée aux processus dans lesquels le taux de défaut est très faible et aux processus présentant un schéma de dégradation géométrique naturelle. Benneyan [1] cite plusieurs exemples de ce schéma : le nombre de soudures retravaillées par pièce fabriquée, le nombre de bogues logiciels détectés, le nombre de pièces dans les camions de livraison et le nombre de factures reçues par jour.

Propriétés de la carte G

Comme les autres cartes de contrôle, la carte G possède une ligne centrale et des limites de contrôle supérieure et inférieure, sachant que la limite de contrôle inférieure est presque toujours négative mais établie à zéro pour les les besoins de l'étude.

Les données réelles tracées sur la carte correspondent au nombre d'opportunités entre les défauts. En ce qui concerne les établissements de soins, les opportunités sont généralement définies en jours. Cela rend l'interprétation de la carte G anormale, car si le taux d'infections augmente, le nombre de jours entre les infections diminue, et ce jusqu'à 0 si des infections surviennent le même jour. De même, si le taux diminue, le nombre de jours entre les infections augmente. Ainsi, un point qui se trouve au-dessus de la limite de contrôle supérieure indique une période anormalement longue entre les événements indésirables. En d'autres termes, le taux est anormalement faible. Par conséquent, la limite de contrôle supérieure est souvent utilisée comme indicateur d'une amélioration significative.

Inclure le test de Benneyan pour détecter des taux d'événements indésirables anormalement élevés

L'un des problèmes de la carte G est que vous ne pouvez pas obtenir les points qui se trouvent en dessous de la limite de contrôle inférieure, car cette limite est établie à 0 et que la valeur de données minimale est également égale à 0. Vous pouvez donc observer un signal au-dessus de la limite de contrôle supérieure, ce qui indique que le taux d'événements indésirables est anormalement faible, mais vous ne pouvez pas déterminer quand le taux d'événements indésirables est anormalement élevé. Dans la pratique, vous souhaitez étudier un taux anormalement faible pour déterminer ce que vous faisiez pendant cette période. Par ailleurs, vous voulez également agir le plus tôt possible face au taux anormalement élevé afin d'identifier la cause de son augmentation. Si vous n'utilisez que le test 1 (1 point en dehors de la limite de contrôle), la carte G ne détecte pas le changement de taux d'événements indésirables le plus préoccupant.

Benneyan [2] propose plusieurs solutions à ce problème. L'une d'elles consiste à effectuer des tests supplémentaires : test 2, test 3 et test 4. Le choix le plus logique est le test 2. Lorsque neuf points sont alignés en dessous de la ligne centrale, cela indique très probablement une augmentation du taux d'infections. Minitab recommande toujours d'utiliser le test 1, activé par défaut, mais aussi le test 2; facultatif. Le test 3 et le test 4 sont également facultatifs.

La deuxième solution correspond au "test de Benneyan", décrit par Benneyan [2]. Les points qui échouent au test de Benneyan sont marqués d'un "B" majuscule sur la carte. Ce test de Benneyan calcule le nombre de points alignés consécutifs égaux à 0. Le nombre de points requis pour déclencher un signal est fonction du taux de fausses alertes souhaité et du processus p. Minitab base le taux de fausses alertes sur la probabilité de l'argument du test 1. Par exemple, si l'argument du test 1 est 3 (par défaut), la probabilité d'être au-dessus de la limite de contrôle supérieure est de <= 0,0013499. Minitab utilise cette valeur comme valeur alpha dans le test de Benneyan, qui définit la probabilité d'un signal sur 0 <= 0,0013499. Le test de Benneyan est également activé par défaut.

Benneyan [2] décrit la puissance et la période opérationnelle moyenne (POM) de la carte G pour la détection des changements de taux d'événements indésirables grâce aux combinaisons de tests suivantes : le test 1 ; le test 1 et le test 2 ; le test 1 et le test de Benneyan. Utilisé seul, le test 1 est assez puissant pour détecter une baisse du taux d'événements indésirables. Toutefois, il n'est pas en mesure de détecter une augmentation du taux d'événements indésirables. Utiliser le test 1 et le test de Benneyan permet d'indiquer l'amélioration la plus significative de la puissance de détection des augmentations du taux d'événements indésirables.

Utiliser les limites de probabilité pour réduire les taux de fausses alertes au niveau de la limite de contrôle supérieure

Un autre problème de mise en oeuvre courante de la carte G est qu'elle utilise la méthode standard de création des cartes de contrôle, dans laquelle la ligne centrale est la moyenne des données et les limites de contrôle sont définies sur les écarts types ± 3 de la ligne centrale. Si la distribution géométrique est fortement oblique (voir la figure 1), la méthode d'écart type ± 3 standard donne donc une limite de contrôle inférieure trop basse (ce qui est peu probable, car la limite de contrôle inférieure est généralement définie sur 0) ; quant à la limite de contrôle supérieure, elle n'est pas assez élevée. Si elle est trop faible, elle entraîne un taux de fausses alertes élevé à la limite de contrôle supérieure (voir la figure 2). Le taux de fausses alertes pour la limite de contrôle supérieure (voir la figure 2) est de 0,01825. Cette valeur est plus de 13 fois supérieure au taux d'une carte basée sur une distribution normale, qui est de 0,0013499.

L'utilisation des limites de probabilité est une autre solution proposée par Benneyan [2], dont un avantage est la baisse considérable du taux de fausses alertes pour la limite de contrôle supérieure, limite qui indique une baisse du taux d'événements indésirables. Minitab utilise la méthode de limite de probabilité pour déterminer les limites de contrôle. La probabilité qu'un point se trouve en dehors d'une des limites de contrôle est configurée pour correspondre à la probabilité qu'un point soit en dehors de l'une des limites de contrôle pour une carte standard basée sur une distribution normale, comme une carte I ou une carte X barre. En utilisant les 3 limites d'écart type standard dans une carte I ou une carte X barre, la probabilité qu'un point se trouve en dehors de la limite de contrôle supérieure ou inférieure est de 0,0013499. Minitab utilise cette probabilité pour définir les limites de probabilité supérieure et inférieure de la carte G par défaut. La limite de contrôle inférieure est définie au percentile 0,0013499 de la distribution géométrique. La limite de contrôle supérieure est définie au percentile 0,99865. La ligne centrale est définie au percentile 0,5, également appelé la médiane.

G Chart - Geometric Distributions 
Figure 1. PDF des distributions géométriques avec variable p

G Chart - Distribution Plot 
Figure 2. Probabilité de X > écarts types + 3 moyen

Calculs utilisés

Notation

Les données saisies appartiennent à l'un des deux types suivants :

  • Nombre d'intervalles : Le "nombre" peut faire référence à tout type d'intervalle, comme les opportunités, les cas, etc. Ici, si des événements surviennent à des opportunités successives, le nombre d'intervalles est 0. Si les événements surviennent aux opportunités 5 et 10, le nombre d'intervalles est 4 (car il y a 4 opportunités sans événement : 6, 7, 8 et 9). Si l'utilisateur saisit ce type de données, il s'agit des valeurs Xi utilisées dans la carte. Toutes les données doivent être des entiers non négatifs (0 est une valeur acceptable).
  • Dates des événements : Si l'utilisateur saisit des dates, Minitab calcule Xi comme suit :

    Soit les dates saisies D1, D2, …, DN. Alors X2 = D2 – D1, X3 = D3 – D2, … , XN = DN – DN-1.
  • Remarques :
    • Il existe deux définitions courantes de la distribution géométrique. L'une utilise le "nombre d'intervalles", comme expliqué ci-dessus. L'autre utilise le "nombre jusqu'à", qui inclut l'opportunité où l'événement est survenu. Si les événements surviennent aux opportunités 5 et 10, le "nombre jusqu'à" est 5 (6, 7, 8, 9, et 10). Si l'utilisateur saisit des données "nombre jusqu'à", Minitab soustrait 1 des données pour le convertir en "nombre d'intervalles".
    • Les deux types de données ont une valeur minimale de 0 et une limite de contrôle inférieure de 0 sauf dans les cas les plus rares (p < 0,00135).

    Xi = points de la droite, comme expliqué ci-dessus

    X barre = moyenne de Xi

    N = nombre de valeurs de données dans les calculs (si les données sont des dates, il faut soustraire 1 car nous utilisons des différences et il n'y en a aucune pour le premier événement)

    phat = estimation du taux d'événements indésirables (c'est-à-dire, la probabilité qu'un événement survienne à un intervalle spécifique, tel qu'une journée). Si une estimation historique est fournie, cette valeur est utilisée. Sinon, la valeur "phat" est calculée à partir des données comme suit :

    phat = ((N-1)/N)/(X barre + 1)

    Limites estimées à partir des données (méthode de limites de probabilité)

    p1 = 0,00135

    p2 = 0,5

    p3 = 0,99865 = 1 – p1
      

    LCL = invcdf(p1) en utilisant la distribution géométrique avec le paramètre "phat"

    CL  = invcdf(p2) en utilisant la distribution géométrique avec le paramètre "phat"

    UCL = invcdf(p3) en utilisant la distribution géométrique avec le paramètre "phat"

    Tests de carte de contrôle standard utilisés dans la carte G

    Test 1 : 1 point en dehors des percentiles définis ci-dessus 

    Test 2 : K points alignés d'un côté ou de l'autre de la ligne centrale

    Test 3 : K points alignés, tous en augmentation ou en diminution

    Test 4 : K points alignés, en alternance vers le haut et vers le bas

    Dans le test 1, si l'argument K est 3, les valeurs p1 et p2 définies ci-dessus sont utilisées pour obtenir les limites de contrôle supérieure et inférieure. Si l'argument K du test 1 n'est pas égal à 3, vous devez définir p1' et p2' comme valeurs CDF de Normal (0,1) pour –K et +K et obtenir les limites de contrôle supérieure et inférieure en utilisant p1' et p2'.

    Test de Benneyan

    Si la limite de contrôle inférieure est 0, la carte G ne peut pas détecter d'augmentation du taux d'événements indésirables car aucun point ne peut figurer sous la limite de contrôle inférieure. Par conséquent, Minitab applique un test supplémentaire pour détecter une augmentation du taux d'événements indésirables. Ce test est présenté dans Benneyan [2] et Benneyan [3].

    Le test de Benneyan utilise la méthode suivante pour déterminer le cp, c'est-à-dire le nombre de points consécutifs égaux à 0 requis pour générer un signal :

    cp = ln(CDF Normal (0,1) (-K))/(ln(phat))

    Remarques :
    • Calculez le rapport ci-dessus et arrondissez à l'entier suivant.
    • Le CDF Normal (0,1) (-K) correspond au CDF d'une distribution normale dont la moyenne est de 0, l'écart type de 1, évalué à –K, où K est l'argument du test 1. Chaque point consécutif dans une ligne de points égal à 0, dont la longueur linéaire est >= K, est marqué du symbole "B" sur la carte. Par exemple, si le cp est égal à 4 et que 5 points alignés sont égaux à 0, les points 4 et 5 de la ligne sont marqués du symbole "B" sur la carte.

    Références

  • Benneyan, JC (2001) : "Number-Between g-Type Statistical Quality Control Charts for Monitoring Adverse Events" , Health Care Management Science, Vol 4, p. 305-318, Kluwer Academic Publishers.
  • Benneyan, JC (2001) : "Performance of Number-Between g-Type Statistical Control Charts for Monitoring Adverse Events", Health Care Management Science, Vol 4, p. 319-336, Kluwer Academic Publishers.
  • Benneyan, JC : "Design and Use of g-Type Control Charts for Industry and Healthcare: SPC Charts for Hospital Infections and Adverse Events", http://www1.coe.neu.edu/~benneyan/papers/g_chart_overview
  • Benneyan, JC (1991) : "Statistical Control Charts Based on Geometric and Negative Binomial Populations", Master thesis, University of Massachusetts, Amherst.
  • Kaminsky FC, Benneyan JC, Davis RB, et Burke RJ (1992) : "Statistical Control Charts Based on a Geometric Distribution", Journal of Quality Technology, Vol 24(2), p. 63-69.

  • Rédigé par le Dr Terry Ziemer, SIXSIGMA Intelligence  

     

    Télécharger cet article au format PDF (uniquement en anglais)

    • Minitab News

      Recevez gratuitement notre lettre d'information électronique mensuelle pour connaître l'actualité de Minitab, consulter les didacticiels, lire des études de cas, obtenir des conseils statistiques, et recevoir d'autres informations utiles.

      Pour s'abonner
    • Suivez Minitab

      Join Minitab on LinkedIn Follow Minitab on Twitter Like Minitab on Facebook
    • Plus d'articles

    En utilisant ce site, vous acceptez l'utilisation de cookies à des fins d'analyse et de personnalisation du contenu. Lisez notre politique

    OK