La gráfica G en Minitab Statistical Software

Este artículo proporciona antecedentes, casos de uso e información técnica sobre la implementación de la gráfica G desarrollada por James Benneyan en Minitab Statistical Software.

Antecedentes de la gráfica G

La gráfica g (o “gráfica G” en Minitab), desarrollada por James Benneyan en 1991, es una gráfica de control que se basa en la distribución geométrica. Desde entonces, Benneyan ha publicado varios trabajos acerca de la gráfica G y una gráfica complementaria, la gráfica h. (Health Care Management Science, Vol 4, páginas 305-318, 2001, es el artículo que se utilizó como base para la gráfica G de Minitab). La mayoría de los usos citados en estos trabajos están relacionados con el monitoreo de tasas de infecciones en centros de atención médica, tales como las infecciones nosocomiales. Las infecciones nosocomiales son infecciones que se producen como resultado directo del tratamiento de un paciente en un centro médico.

Las gráficas P y las gráficas U suelen utilizarse para monitorear eventos adversos como las infecciones nosocomiales. Pero las gráficas P y las gráficas U requieren cantidades de datos muy grandes y definiciones específicas de los datos. Por ejemplo, si usted utiliza una gráfica U para monitorear las infecciones nosocomiales, cada día-paciente se considera un área de oportunidad en la que pueden ocurrir una o más infecciones. Por lo tanto, los datos son el número de infecciones por día-paciente. Si utiliza una gráfica P, los datos son el número de días-paciente en los que ocurre una o más infecciones. En lo que respecta a los requisitos de datos, si usted sigue la práctica estándar de requerir un mínimo de 25 a 35 subgrupos para establecer límites de control, y la tasa de infecciones es baja (por ejemplo, < 1%), la cantidad de datos requerida es de por lo menos 12,500 pacientes (500 pacientes por cada subgrupo multiplicado por 25 subgrupos). Esto significa que podrían tener que pasar semanas, meses o incluso años para acumular suficientes datos para detectar y responder a los cambios en la tasa de infecciones.

La distribución geométrica proporciona un modelo de probabilidad alternativo. En la distribución geométrica, usted cuenta el número de oportunidades antes de que ocurra el defecto o hasta el momento en que ocurre el defecto. Por lo tanto, en un escenario de atención médica donde se monitorea la tasa de infecciones, lo ideal sería contar el número de pacientes o procedimientos hasta el momento en que se observa una infección. Si bien esto sería lo ideal, también es sumamente raro que ocurra, debido a complicaciones con el conteo del número real de pacientes en todo el sistema, o el número de procedimientos. Lo que se hace con más frecuencia es contar el número de días entre las infecciones observadas. La suposición clave que se utiliza al contar el número de días es que el número de pacientes o procedimientos por día es bastante constante.

Casos de uso para la gráfica G

Como se indicó anteriormente, la mayoría de los usos citados en el trabajo de Benneyan corresponden a escenarios de atención médica.  Pero la gráfica G es apropiada para procesos en los que la tasa de defectos es muy baja y para procesos que muestran un patrón de decadencia geométrica natural. Benneyan [1] cita varios ejemplos de este patrón de decadencia natural: el número de soldaduras reparadas por cada artículo manufacturado, el número de errores de software detectados, el número de artículos en los camiones de entrega y el número de facturas recibidas al día.

Propiedades de la gráfica G

Al igual que otras gráficas de control, la gráfica G tiene una línea central y límites de control superior e inferior. Los cálculos de los límites de control casi siempre producen un límite de control inferior negativo. Cuando el límite de control inferior calculado es negativo, el límite inferior se establece en 0.

Los datos reales que se representan en la gráfica son el número de oportunidades entre los defectos. En los escenarios de atención médica, las oportunidades normalmente se definen como días. Esto hace que la interpretación de la gráfica G sea poco común, ya que, si aumenta la tasa de infecciones, el número de días entre las infecciones se reduce hasta un mínimo de 0, si las infecciones se producen en el mismo día. Al mismo tiempo, si la tasa disminuye, el número de días entre las infecciones aumenta. Por lo tanto, un punto que está por encima del límite de control superior indica un período de tiempo inusualmente largo entre los eventos adversos. En otras palabras, la tasa es inusualmente baja. Por lo tanto, el límite de control superior suele utilizarse como un indicador de que se ha realizado una mejora significativa.

Incluir la prueba de Benneyan para detectar tasas altas de eventos adversos

Un problema con la gráfica G es que generalmente usted no puede obtener los puntos que están por debajo del límite de control inferior, debido a que el límite de control inferior se establece en 0 y el valor mínimo de datos también es 0. En consecuencia, aunque es posible observar una señal que esté por encima del límite de control superior, lo que indica que la tasa de eventos adversos es inusualmente baja, usted no puede detectar cuando la tasa de eventos adversos es inusualmente alta. En un sentido práctico, usted estudia una tasa inusualmente baja para determinar lo que estuvo haciendo bien durante ese período de tiempo. Pero usted también desea responder tan pronto como sea posible a una tasa inusualmente alta para determinar la causa del aumento de la tasa. Por lo tanto, la gráfica G, utilizando únicamente la Prueba 1 (1 punto fuera del límite de control), no proporciona una detección adecuada del cambio en la tasa de eventos adversos que es de sumo interés.

Benneyan [2] plantea varias soluciones para este problema. Una solución es utilizar las pruebas adicionales: Prueba 2, Prueba 3 y Prueba 4. La opción más lógica es la Prueba 2. Nueve puntos consecutivos por debajo de la línea central probablemente son una indicación de que la tasa de infecciones ha aumentado. Minitab recomienda utilizar siempre la Prueba 1, la cual está activada por opción predeterminada, y la Prueba 2, que es opcional. La Prueba 3 y la Prueba 4 también son opcionales.

Una segunda solución es la “prueba de Benneyan” y se describe en Benneyan [2]. Los puntos que no pasan la prueba de Benneyan se marcan  en la gráfica con una “B” mayúscula. Esta prueba de Benneyan cuenta el número de puntos graficados consecutivos que son iguales a 0. El número de puntos que se requiere para activar una señal depende de la tasa deseada de falsas alarmas y la p del proceso. Minitab basa la tasa de falsas alarmas sobre la probabilidad del argumento de la Prueba 1. Por ejemplo, si el argumento de la Prueba 1 es 3 (el valor predeterminado), entonces la probabilidad de estar por encima del límite de control superior es <= 0.0013499. Minitab utiliza este valor como el valor alfa en la prueba de Benneyan, lo que hace que la probabilidad de una señal en 0 sea <= 0.0013499. La prueba de Benneyan también está activada por opción predeterminada.

Benneyan [2] describe la potencia y la Longitud promedio de la corrida (ARL) de la gráfica G para detectar cambios en la tasa de eventos adversos utilizando: Prueba 1; Prueba 1 y Prueba 2; y Prueba 1 y prueba de Benneyan. La Prueba 1, por sí sola, tiene la potencia adecuada para detectar una disminución en la tasa de eventos adversos. Pero la Prueba 1, por sí sola, tiene 0 potencia para detectar un aumento en la tasa de eventos adversos. Al utilizar la Prueba 1 y la prueba de Benneyan, se obtiene la mejora más significativa en la potencia para detectar aumentos en la tasa de eventos adversos.

Usar los límites de probabilidad para reducir las tasas de falsas alarmas en el límite de control superior

Otro problema con la implementación común de la gráfica G es que ésta utiliza el método estándar de elaboración de gráficas de control, donde la línea central es la media de los datos y los límites de control se establecen en  ± 3 desviaciones estándar con respecto a la línea central. La distribución geométrica es muy asimétrica (ver Figura 1), por lo que el resultado del método de ± 3 desviaciones estándar es que el límite de control inferior es demasiado bajo (esto es poco probable, ya que el límite de control inferior se suele establecer en 0) y el límite de control superior no es lo suficientemente alto.  Un límite de control superior que no es lo suficientemente alto causa una alta tasa de falsas alarmas en el límite de control superior (ver Figura 2). La tasa de falsas alarmas para el límite de control superior (ver Figura 2) es de 0.01825. Este valor es más de 13 veces mayor que la tasa para una gráfica que se basa en una distribución normal, que es de 0.0013499.

Otra solución propuesta por Benneyan [2] consiste en utilizar límites de probabilidad. La ventaja de usar límites de probabilidad, como se describe en Benneyan [2], es una considerable reducción en la tasa de falsas alarmas para el límite de control superior, que es el límite que señala una reducción en la tasa de eventos adversos. Minitab utiliza el método de límites de probabilidad para determinar los límites de control. La probabilidad de tener un punto que esté fuera de cualquier límite de control se establece para que corresponda a la probabilidad de tener un punto que esté fuera de uno de los límites de control para una gráfica de control estándar basada en la distribución normal, como una gráfica I o una gráfica Xbarra. Al utilizar los límites de control habituales de 3 desviaciones estándar en una gráfica I o una gráfica Xbarra, la probabilidad de tener un punto que esté fuera del límite de control superior o el límite de control inferior es de 0.0013499. Minitab utiliza esta probabilidad para definir los límites de probabilidad superior e inferior para la gráfica G, por opción predeterminada. El límite de control inferior se establece en el percentil 0.0013499 de la distribución geométrica. El límite de control superior se establece en el percentil 0.99865. La línea central se establece en el percentil 0.5, también conocido como la mediana.

Gráfica G - Distribuciones geométricas 
Figura 1. PDF para distribuciones geométricas con p variable

Gráfica G - Gráfica de distribución 
Figura 2. Probabilidad de X > media + 3 desviaciones estándar

Cálculos utilizados

Notación

Los datos ingresados son uno de dos tipos:

  • Número entre: El “número” puede referirse a cualquier tipo de intervalo, como oportunidades, casos, etc. En este caso, si los eventos ocurren en oportunidades sucesivas, el número entre es 0. Si los eventos se producen en las oportunidades 5 y 10, el número entre es 4 (porque hubo cuatro oportunidades, las oportunidades 6, 7, 8 y 9, sin un evento). Si el usuario ingresa este tipo de datos, éstos son los valores Xi utilizados en la gráfica. Todos los datos deben ser enteros no negativos (0 es un valor aceptable).

    Nota: Hay dos definiciones comunes de distribución geométrica. Una utiliza el “número entre”, explicado anteriormente. La otra utiliza el “número hasta”, que cuenta la oportunidad en la que ocurrió el evento como parte del número. Si el evento ocurre en las oportunidades 5 y 10, el número hasta es 5 (6, 7, 8, 9 y 10). Si el usuario ingresa datos de “número hasta”, Minitab resta 1 a los datos para convertirlos en “número entre”.
  • Fechas de los eventos: Si el usuario ingresa fechas, Minitab calcula el Xi de la siguiente manera:

    Supongamos que D1, D2, …, DN son las fechas ingresadas. Entonces X2 = D2 – D1, X3 = D3 – D2, … , XN = DN – DN-1.
  • Nota: Ambos tipos de datos tienen como resultado un valor mínimo de 0, y ambos producen un límite de control inferior de 0 en casi todos los casos excepto los más inusuales (p < 0.00135).

    Xi = puntos de la gráfica, como se explicó anteriormente

    Xbarra = promedio de Xi

    N = número de valores de datos utilizados en los cálculos (si los datos son fechas, se resta 1 debido a que utilizamos diferencias y no hay diferencia para el primer evento)

    phat = tasa estimada de eventos adversos (es decir, la probabilidad de que un evento se produzca en un intervalo especificado, como por ejemplo un día). Si se suministra un estimado histórico, entonces se utiliza ese valor. De lo contrario, phat se calcula a partir de los datos de la manera siguiente:

    phat = ((N-1)/N)/(Xbarra + 1)

    Límites estimados a partir de los datos (método de límites de probabilidad)

    p1 = 0.00135

    p2 = 0.5

    p3 = 0.99865 = 1 – p1
      

    LCI = invcdf(p1) utilizando distribución geométrica con parámetro phat

    LC  = invcdf(p2) utilizando distribución geométrica con parámetro phat

    LCS = invcdf(p3) utilizando distribución geométrica con parámetro phat

    Pruebas de gráfica de control estándar utilizadas en la gráfica G

    Prueba 1: 1 punto fuera de los percentiles definidos anteriormente 

    Prueba 2: K puntos consecutivos en un lado de la línea central

    Prueba 3: K puntos consecutivos, todos ascendentes o descendentes

    Prueba 4: K puntos consecutivos, alternando hacia arriba y hacia abajo

    En la Prueba 1, si el argumento, K, es 3, entonces los valores p1 y p2 definidos anteriormente se utilizan para obtener el límite de control inferior y el límite de control superior. Si el argumento de la Prueba 1, K, no es igual a 3, entonces defina p1’ y p2’ como los valores CDF de Normal(0,1) para –K y +K y obtenga el límite de control inferior y el límite de control superior utilizando p1’ y p2’.

    Prueba de Benneyan

    Si el límite de control inferior es 0, la gráfica G no puede detectar un aumento en la tasa de eventos adversos, porque no puede haber puntos por debajo del límite de control inferior. Por lo tanto, Minitab aplica una prueba adicional para detectar un aumento en la tasa de eventos adversos. Esta prueba se describe en Benneyan [2] y Benneyan [3].

    La prueba de Benneyan utiliza el siguiente método para determinar cp, el número de puntos consecutivos iguales a 0 que se requieren para generar una señal:

    cp = ln(CDF Normal (0,1) (-K))/(ln(phat))

    Nota: Calcule la relación anterior y redondee al siguiente entero.

    Nota: CDF Normal (0,1) (-K) es la CDF para una distribución normal con media de 0, desv.est. 1, evaluados en –K, donde K es el argumento de la Prueba 1.
    Cada punto consecutivo en una corrida de puntos que son iguales a 0, donde la longitud de la corrida es >= K, se marca en la gráfica con el símbolo “B”. Por ejemplo, si cp es igual a 4 y hay 5 puntos consecutivos que son iguales a 0, entonces los puntos 4 y 5 de la corrida se marcan con el símbolo “B” en la gráfica.

    Referencias

  • Benneyan, JC (2001): “Number-Between g-Type Statistical Quality Control Charts for Monitoring Adverse Events”; Health Care Management Science, Vol 4, pp 305-318; Kluwer Academic Publishers.
  • Benneyan, JC (2001): “Performance of Number-Between g-Type Statistical Control Charts for Monitoring Adverse Events”; Health Care Management Science, Vol 4, pp 319-336; Kluwer Academic Publishers.
  • Benneyan, JC: ”Design and Use of g-Type Control Charts for Industry and Healthcare: SPC Charts for Hospital Infections and Adverse Events”; http://www1.coe.neu.edu/~benneyan/papers/g_chart_overview
  • Benneyan, JC (1991): “Statistical Control Charts Based on Geometric and Negative Binomial Populations”, Tesis de Maestría, University of Massachusetts, Amherst.
  • Kaminsky FC, Benneyan JC, Davis RB y Burke RJ (1992): “Statistical Control Charts Based on a Geometric Distribution”, Journal of Quality Technology, Vol 24(2), pp 63-69.

  • Preparado por el Dr. Terry Ziemer, SIXSIGMA Intelligence  

     

    Descargar este artículo como PDF (sólo en inglés)

    Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado. Leer nuestra política