La gráfica T en Minitab Statistical Software

Este artículo proporciona antecedentes, casos de uso e información técnica sobre la implementación de la gráfica T en Minitab Statistical Software.

Antecedentes de la gráfica T

La gráfica T es una gráfica de control utilizada para monitorear la cantidad de tiempo entre eventos adversos, donde el tiempo se mide en una escala constante. La gráfica T es una extensión de la gráfica G, que por lo general grafica el número de días entre eventos o el número de oportunidades entre eventos, donde cualquiera de los valores se mide en una escala discreta. Al igual que la gráfica G, la gráfica T se utiliza para detectar cambios en la tasa a la cual ocurre el evento adverso.
A la hora de leer la gráfica T, tenga en cuenta que los puntos por encima del límite de control superior indican que aumentó la cantidad de tiempo entre los eventos y, por lo tanto, disminuyó la tasa de los eventos. Los puntos por debajo del límite de control inferior indican que aumentó la tasa de eventos adversos.

El enfoque de transformación

La gráfica T se incluye en otros paquetes de software, los cuales transforman los datos correspondientes al tiempo entre eventos para distribuirlos más normalmente. Los datos transformados se utilizan para determinar los límites de control, los cuales se vuelven a convertir a la escala de datos originales y se grafican con los datos originales.

El problema con este enfoque es que las colas de los datos transformados no se ajustan a una distribución normal de manera apropiada. Con el enfoque de transformación, la probabilidad de que un punto se ubique fuera de los límites de control es sólo 0.0007546. Por el contrario, con una gráfica de control estándar basada en una distribución normal (tal como una gráfica I o una gráfica Xbarra), la probabilidad de que un punto se encuentre fuera de los límites de control es mucho mayor, 0.00269. El método de transformación de una gráfica T produce una probabilidad inusualmente baja de puntos fuera de control y, por lo tanto, una Longitud promedio de la corrida (ARL) exagerada.

Las simulaciones (ver Tabla 3 abajo) muestran que la tasa de falsas alarmas aumenta exponencialmente con datos extremadamente asimétricos y disminuye a casi 0 con datos menos asimétricos. En general, una gráfica T implementada con el enfoque de transformación posee una capacidad de detección mucho menor, especialmente en el límite de control inferior. La baja potencia en el límite de control inferior significa que la gráfica casi no posee la capacidad de detectar incrementos en la tasa de eventos adversos.

El enfoque de Distribución exponencial

Otro enfoque de la gráfica T es modelar el tiempo entre eventos utilizando una distribución exponencial. Este modelo se basa en que si ocurren eventos adversos según un modelo de Poisson, entonces el tiempo entre eventos debería seguir una distribución exponencial. Este enfoque utiliza percentiles de la distribución exponencial correspondiente a las zonas de ± 1, 2 y 3 sigma en una gráfica estándar basada en la distribución normal. Estos percentiles también se conocen como “límites de probabilidad”. El uso de límites de probabilidad tiene dos significados:

  • La ARL y la tasa de falsas alarmas de un proceso bajo control son las mismas que se esperarían en una gráfica Xbarra con datos distribuidos normalmente.
  • La ARL y las tasas de falsas alarmas esperadas sólo se aplican si los datos provienen de una distribución exponencial.

El problema de la distribución exponencial es que, a pesar de ser la distribución teóricamente correcta para el tiempo entre eventos de Poisson, los datos en la práctica con frecuencia obedecen a un modelo ligeramente diferente. Es posible que los datos parezcan estar distribuidos exponencialmente; sin embargo, pudieran en realidad desviarse, lo cual afectaría gravemente la ARL y la tasa de falsas alarmas. Si los datos provienen de una distribución que sea más asimétrica que una distribución exponencial, es posible que la tasa de falsas alarmas sea extremadamente alta en el límite inferior, lo que significa que habría una mayor incidencia de concluir falsamente que la tasa de eventos adversos había aumentado. Por otra parte, si los datos provienen de una distribución que sea menos asimétrica que una distribución exponencial, la capacidad de detectar incrementos en la tasa de eventos adversos se ubica en 0.

La distribución exponencial tiene un valor de asimetría de 2 y un valor de curtosis de 6. Las simulaciones (ver Tablas de la 1 a la 3, abajo) muestran que, a medida que la asimetría y la curtosis de los datos aumentan a partir de estos valores, la tasa de falsas alarmas asociada con el límite de control inferior aumenta exponencialmente. La tasa de falsas alarmas asociada con el límite de control superior aumenta más lentamente. A medida que la asimetría y la curtosis de la distribución disminuyen a partir de los valores exponenciales de 2 y 6, la tasa de falsas alarmas asociada con el límite de control superior disminuye, mientras que la tasa de falsas alarmas asociada al límite de control inferior se ubica en 0.

El enfoque de Minitab: la distribución de Weibull

Para aumentar la robustez de la gráfica, Minitab utiliza una distribución de Weibull en lugar de una distribución exponencial para modelar el tiempo entre eventos. La distribución de Weibull tiene 2 parámetros, forma y escala. Si el parámetro de forma es igual a 1, la distribución de Weibull es igual que en una distribución exponencial con el mismo parámetro de escala que la distribución de Weibull.

Variar el parámetro de forma alrededor de 1 permite que la distribución de Weibull adopte diferentes formas, desde extremadamente puntiagudas y extremadamente asimétricas hacia la derecha (para un parámetro de forma menor que 1), a asimétricas (para un parámetro de forma de aproximadamente 5) y asimétricas hacia la izquierda (generalmente para un parámetro de forma mayor que 5). Se espera que el parámetro de forma se encuentre generalmente entre 0.5 y 2, debido a que la distribución entonces estaría más cerca de la distribución exponencial esperada. Si bien el uso de límites de probabilidad de una distribución de Weibull aún quiere decir que la ARL y la tasa de falsas alarmas esperadas sólo se aplicarían si los datos provienen realmente de una distribución de Weibull, esta familia más amplia de distribuciones aumentará las probabilidades de obtener un buen ajuste.

Simulaciones con una gráfica T

Para las siguientes tablas, se simularon 100 muestras aleatorias de 10,000 puntos de datos a partir de la distribución especificada. La proporción de puntos fuera de los límites de control se muestra en la tabla. Para una gráfica estándar basada en la distribución normal, como una gráfica Xbarra, la proporción esperada de puntos fuera de los límites es 0.00269.

Las simulaciones utilizan las distribuciones de Weibull y chi-cuadrada. Una distribución chi-cuadrada con 2 grados de libertad es igual a una distribución exponencial con una media de 2. Variar los grados de libertad alrededor de 2 produce una chi-cuadrada más o menos asimétrica que una exponencial. Ver Figura 1. Una distribución de Weibull con un parámetro de forma de 1 es igual que una distribución exponencial con una media igual al parámetro de escala de la distribución de Weibull. Variar el parámetro de forma alrededor de 1 hace que Weibull sea más o menos asimétrico que una exponencial. Ver Figura 2.

 

 

Tabla 1a: Gráfica T basada en exponencial con datos chi-cuadrados
Obtención de muestras de una distribución chi-cuadrada

 Grados de libertad  Asimetría   Curtosis    Por debajo del LCI   Por encima del LCS  Total fuera de los límites  % que se espera fuera
0.5   4.03   24.21   0.149413   0.027207   0.17662   6565.80%
  0.75   3.34   17.31   0.065271   0.016747   0.08218  3055.02%
  1.0  2.81    11.73   0.029265   0.010133   0.039398  1464.61%
 1.25    2.55   9.9   0.013345   0.006102   0.019453  723.16%
  1.5  2.3    7.83   0.006159   0.003682   0.009841  365.84%
 1.75    2.12   6.63   0.002868   0.002223   0.005091  189.26%
  2.0   1.96   5.85   0.001351   0.001339   0.00269  100.00%
  2.5   1.8   4.9   0.000227   0.001839  0.002689   99.96%
  3.0   1.64   4.03   0.000037   0.004179   0.004216  156.73%
  3.5   1.52  3.39    0.000006   0.006696   0.006702  249.14%

 

Tabla 1b: Gráfica T basada en exponencial con datos de Weibull
Obtención de muestras de una distribución de Weibull

 

Forma 

Asimetría   Curtosis    Por debajo del LCI   Por encima del LCS  Total fuera de los límites  % que se espera fuera
 2.0  0.63  0.25   0.000002   0  0.000002  0.07%
1.75  0.83  0.69   0.00001  0   0.00001  0.37%
1.5  1.07  1.4  0.000049  0.000049  1.82%
 1.25  1.43  2.77  0.000258  0.000025  0.000283  10.52%
1.0  2.02  6.13   0.001335  0.001355   0.00269  100.00%
 0.75  3.08  15.04  0.007002  0.016195  0.023197   862.34%
0.5  6.32  68.71  0.036022  0.076449  0.112461  4180.71%

 

Tabla 2a: Gráfica T basada en Weibull con datos chi-cuadrados
Obtención de muestras de una distribución chi-cuadrada

 Grados de libertad  Asimetría   Curtosis    Por debajo del LCI   Por encima del LCS  Total fuera de los límites  % que se espera fuera
 0.5   4.03   24.21   0.006500  0.000000    0.006288 

233.75%

 0.75   3.34   17.31   0.004558  0.000013   0.004571  169.93%
 1.0  2.81    11.73   0.003635   0.000115   0.003750  139.41%
 1.25   2.55   9.9   0.002788   0.000506   0.003294  122.45% 
1.5    2.3   7.83   0.001945   0.000621   0.002566  95.39%
 1.75   2.12   6.63   0.001656   0.000898   0.002554  94.94% 
 2.0   1.96   5.85   0.001596   0.001529   0.003125  116.17%
 2.5   1.8   4.9   0.000877   0.001849   0.002726  101.34%
 3.0   1.64   4.03   0.000585   0.002055  0.002640   98.14%
 3.5   1.52   3.39   0.000453   0.003190  0.003643   135.43% 

 

Tabla 2b: Gráfica T basada en Weibull con datos de Weibull
Obtención de muestras de una distribución de Weibull

Forma  Asimetría   Curtosis    Por debajo del LCI   Por encima del LCS  Total fuera de los límites  % que se espera fuera
 2.0    0.63   0.25  0.001386   0.001538   0.002924  108.70%
1.75   0.83  0.69  0.001365    0.001521  0.002886  107.29% 
1.5    1.07   1.4   0.001335    0.001312  0.002647  98.40% 
 1.25   1.43   2.77   0.001299   0.001351   0.002650  98.51% 
 1.0    2.02  6.13   0.001475    0.001498  0.002973  110.52% 
 0.75    3.08  15.04   0.001368   0.001347   0.002715  100.93%
 0.5    6.32  68.71   0.001220    0.001375  0.002595   96.47%

 

Tabla 3: Gráfica T basada en transformación con datos chi-cuadrados.
Obtención de muestras de una distribución chi-cuadrada

 Grados de libertad 

Asimetría   Curtosis   Total fuera de los límites   

% que se espera fuera

 0.5    4.03   24.21   0.14365  5340.15%
 0.75    3.34   17.31  0.073075   2716.54%
 1.0   2.81   11.73   0.0367875   1367.57%
 1.25   2.55   9.9   0.017825   662.64%
 1.5   2.3   7.83   0.0095125   353.62%
 1.75   2.12   6.63   0.00523333   194.55%
 2.0    1.96  5.85   0.00256   95.17%
 2.5   1.8    4.9  0.00069333   25.77%
  3.0   1.64  4.03   0.00034   12.64%
 3.5   1.52  3.39  0.00017333  6.44%


Figura 1: Comparación de distribuciones chi-cuadrada y exponencial
  
Figura 1  

Figura 2: Comparación de distribuciones de Weibull y exponencial

Figura2  
  

Casos de uso de la gráfica T

La diferencia entre una gráfica G y una gráfica T es la escala utilizada para medir la distancia entre eventos. La gráfica G utiliza una escala discreta (conteos de días entre eventos u oportunidades como enteros). La gráfica T utiliza una escala continua (usualmente las fechas y horas en que ocurrieron los eventos). La mayoría de los usos de la gráfica T discutidos en investigaciones se refiere a monitorear tasas de infecciones en establecimientos de cuidado de la salud. Otros ejemplos incluyen monitorear errores de medicación, caídas y resbalones de pacientes, complicaciones quirúrgicas y otros eventos adversos.

Tenga en cuenta que no es necesario contar con las fechas y las horas. De hecho, se espera que los únicos datos que tendrá un caso de uso prominente sean fechas. Si el número de oportunidades por día no es relativamente constante, entonces una gráfica T podría ser una mejor elección que una gráfica G.

Propiedades de la gráfica T

Al igual que otras gráficas de control, la gráfica T tiene una línea central y límites de control superior e inferior. También existen las zonas correspondientes a las zonas de ± 1, 2, 3 sigma en una gráfica Xbarra o en una gráfica I. Estas zonas no aparecen en la gráfica, pero se utilizan en las pruebas de causas especiales. Los límites de control y las zonas se basan en percentiles de la distribución de Weibull. No son múltiplos de la desviación estándar por encima y debajo de la línea central, como en otras gráficas. Como resultado, los límites de control y las zonas no son simétricas alrededor de la línea central, excepto en el extraño caso donde la distribución de Weibull sea simétrica.

Los datos que se muestran en la gráfica corresponden al número de días y horas entre eventos. Esto hace que la interpretación de la gráfica sea inusual. Por ejemplo, si la tasa de infecciones aumenta, la hora o el número de intervalos entre infecciones disminuirían y podrían incluso ser 0. Si la tasa disminuye, la hora o el número de intervalos entre infecciones aumentarían. Por lo tanto, un punto más allá del límite de control superior indicaría un período de tiempo entre infecciones inusualmente extendido; en otras palabras, que la tasa era inusualmente baja.

Una propiedad negativa de la gráfica es que, si se fijan los límites de control y sólo se utiliza la Prueba 1, aumentará la Longitud promedio de la corrida (ARL) si aumenta la tasa. Si la tasa aumenta en 25%, y se fijan los límites de control, la ARL aumentará en aproximadamente 40%. Por lo tanto, la gráfica T tardará en detectar incrementos en la tasa de eventos. Para compensar, Minitab utiliza por opción predeterminada tanto la Prueba 1 como la Prueba 2. La adición de la Prueba 2 aumenta la ARL en tan sólo una cantidad muy pequeña de aproximadamente 10% para las disminuciones en el tiempo promedio y disminuye la ARL para cambios más grande en el tiempo promedio.

Cálculos utilizados

Notación

Existen 3 tipos de datos para los que se puede utilizar una gráfica T:

  • Datos numéricos no negativos
    Este tipo de datos es el número de intervalos entre eventos. Pueden ser continuos (por ejemplo, 13.0957) o enteros (aunque los datos enteros comúnmente se asocian a la gráfica G). Si se ingresa este tipo de datos, estos son los valores de Xi utilizados en la gráfica.

    Nota: 0 es un valor aceptable. Implica que 2 eventos se produjeron exactamente al mismo tiempo. Si hay ceros en los datos, utilizamos un método alternativo para estimar los parámetros.
  • Datos de fecha/hora (por ejemplo, 23/01/2011 8:32:14)
    Este tipo de datos registra la fecha y hora de cada evento. Cada valor de datos debe ser >= el valor precedente. Es posible utilizar fechas solamente, sin la parte de horas (aunque los datos que consisten sólo en fechas generalmente se asocian a una gráfica G). Si se ingresan fechas/horas, los valores de Xi de la gráfica se calculan de la siguiente manera:

    Supongamos que D1, D2, …, DN son los valores de fecha/hora ingresados. Entonces X2 = D2 – D1, X3 = D3 – D2, … , XN = DN – DN-1.

    Los datos resultantes son el número (entero o no entero) de días entre los eventos.

    Nota: Si sólo se ingresan fechas, los datos resultantes de días entre eventos son números enteros. Este tipo de datos suele asociarse con la gráfica G.
  • Datos de tiempo entre eventos (por ejemplo, 8:32:14)
    También se conocen como datos de tiempo transcurrido. Los datos representan el tiempo transcurrido entre el evento i y evento i-1. Si se ingresa este tipo de datos, estos son los valores de Xi en la gráfica.
  • Xi = puntos en la gráfica, como se explicó arriba.

    Si no hay ningún 0 en los datos de Xi, los estimados de máxima verosimilitud (MLE) de los parámetros de forma (KAPPA) y escala (LAMBDA) se calculan a partir de los datos y se utilizan para obtener los percentiles de la distribución de Weibull.


    Si hay ceros en los datos de Xi, se utiliza el siguiente método alternativo para obtener los parámetros:

  • Clasifique los datos de menor a mayor. 
  • p = (clasificación – 0.3) / (n + 0.4)
  • X = ln( -ln(1 – p) )
  • Elimine las filas (tanto de X como de Datos) donde los Datos = 0
  • Y = Ln(Datos)
  • Haga la regresión de Y sobre X, para obtener la ecuación Y = B0 + B1*X
  • LAMBDA = exp(B0), KAPPA = 1/B1 
  • Límites calculados a partir de los datos

    Supongamos que p1, p2, p3, p4, p5, p6, p7 son los valores de CDF de una Normal(0,1) para –3, -2, -1, 0, +1, +2, +3.

    Supongamos que w1, w2, w3, w4, w5, w6, w7 son los valores de invcdf para p1, p2, p3, p4, p5, p6, p7 utilizando una distribución de Weibull (KAPPA, LAMBDA).

    Entonces, obtenga el LCI y el LCS de la siguiente manera:

    LC = w4
    LCS = w7
    LCI = w1

    Uso de parámetros históricos

    Si se especifican parámetros históricos, la gráfica se basa en los parámetros de forma y escala de la distribución de Weibull, tal como otras gráficas utilizan la media y la desviación estándar. Una diferencia es que el usuario debe ingresar valores históricos para ambos parámetros (en gráficas como la Gráfica I o la Gráfica Xbarra, puede ingresar uno o ambos parámetros).

    El parámetro de forma debe ser > 0 y en la mayoría de los casos debe estar entre 0.5 y 2, aunque estos límites se utilizan principalmente por razones prácticas. Los parámetros de forma < 0.5 implican una distribución es muy sesgada y puede tener un valor de kurtosis que supera los 2000. (Una distribución exponencial tiene un valor de kurtosis de tan sólo 6). Los parámetros de forma que son superiores a 2 implican una distribución que es aproximadamente simétrica, o incluso sesgada a la izquierda. Ambas opciones son muy poco realistas porque los datos de tiempo entre eventos generalmente son muy sesgados a la derecha.

    El parámetro de escala debe ser > 0 y debería ser mayor que la media de los datos. Si el parámetro de escala es menor que la media de los datos o demasiado superior a la media, los límites de la gráfica no reflejarán con exactitud el proceso y podrían conducir a muchas falsas alarmas.
    Nota: Los valores históricos ingresados reemplazan a los parámetros de KAPPA y LAMBDA utilizados en las ecuaciones anteriores para obtener los límites de control, la línea central, etc.

    Pruebas de gráfica de control estándar utilizadas en la gráfica T

    Prueba 1 – 1 punto fuera de los percentiles correspondientes a K desviaciones estándar desde la línea central en una gráfica basada en la distribución normal (punto de la gráfica < w1 o > w7, si K = 3, ver abajo si K <> 3)

    Prueba 2 – K puntos consecutivos en un lado de la línea central

    Prueba 3 – K puntos consecutivos, todos ascendentes o descendentes

    Prueba 4 – K puntos consecutivos, alternando hacia arriba y hacia abajo

    Prueba 5 – K de K + 1 puntos > w6, o K de K + 1 puntos < w2

    Prueba 6 – K de K + 1 puntos > w5, o K de K + 1 puntos < w3

    Prueba 7 – K puntos consecutivos >= w3 y <= w5

    Prueba 8 – K puntos consecutivos < w3 o > w5

    Para la Prueba 1, si el argumento K es 3, entonces los valores w1 y w7 utilizados para los límites de control se utilizan para definir los puntos que no pasan la Prueba 1 (es decir, los puntos que son < w1 o > w7). Si el argumento K no es igual a 3, entonces defina p1' y p2' como los valores de cdf de Normal(0,1) para –K y +K. Luego defina w1' y w7' como los valores de invcdf de Weibull (KAPPA, LAMBDA) correspondientes a p1’ y p2’. Entonces, la definición de un punto que no pasa la Prueba 1 es un punto < w1' o > w7'.

    En las pruebas anteriores, w1, w2, w3, w4, w5, w6, w7 son como se definió anteriormente (es decir, los valores de invcdf de la distribución de Weibull correspondientes a p1, p2, p3, p4, p5, p6, p7) los valores de cdf de Normal(0,1) para -3, -2, -1, +1, +2, +3. Sin embargo, si el argumento de la Prueba 1 es <> 3, reemplazamos solamente a w1 y w7 por w1' y w7'. 

    Referencias

    [1] L. Y. Chan, D. K. J. Lin, M Xie, and T. N. Goh. Cumulative Probability Control Charts for Geometric and Exponential Process Characteristics. International Journal of Production Research, 40:133-150, 2002.

    [2] L. Y. Chan, M Xie, and T. N. Goh. Cumulative Quantity Control Charts for Monitoring Production Processes. International Journal of Production Research, 38:397-408, 2000.

    [3] F. F. Gan. Design of Optimal Exponential CUSUM Charts. Journal of Quality Technology, 26(2):109-124, 1994.

    [4] F. F. Gan. Designs of One-Sided and Two-Sided Exponential EWMA Charts. Journal of Quality Technology, 30:55-69, 1998.

    [5] F. C. Kaminsky, J. C. Benneyan, R. D. Davis, and R. J. Burke. Statistical Control Charts Based on a Geometric Distribution. Journal of Quality Technology, 24:63-69, 1992.

    [6] J. Y. Liu, M. Xie, T. N. Goh, and P. R. Sharma. A Comparative Study of Exponential Time Between Events Charts. Quality Technology of Quantitative Management, 3:347-359, 2006.

    [7] D. C. Montgomery. Introduction to Statistical Quality Control, Wiley, 6th Edition, 2009.

    [8] M. Xie, T. N. Goh, and P. Ranjan. Some Effective Control Chart Procedures for Reliability Monitoring. Reliability Engineering and System Safety, 77:143-150, 2002.

    [9] C. W. Zhang, M. Xie, and T. N. Goh. Design of Exponential Control Charts Using a Sequential Sampling Scheme. IIE Transactions, 38:1105-1116, 2006.

    [10] C. W. Zhang, M. Xie, and T. N. Goh. Economic Design of Exponential Charts for Time Between Events Monitoring. International Journal of Production Research, 43:5019-5032, 2005.

     

    Preparado por el Dr. Terry Ziemer, SIXSIGMA Intelligence

     

    Descargar este artículo como PDF (Sólo en inglés) 

    Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado. Leer nuestra política