A carta T no Minitab Statistical Software

Este artigo fornece informações gerais, casos de uso e informações técnicas sobre a implementação de cartas T no Minitab Statistical Software.

Informações Gerais sobre a Carta T

A carta T é uma carta de controle usada para monitorar a quantidade de tempo entre eventos adversos, onde o tempo é medido em uma escala contínua. A carta T é uma extensão da carta G, que normalmente representa graficamente o número de dias entre eventos ou de oportunidades entre eventos, onde cada valor é medido em uma escala discreta. Assim como a carta G, a carta T é usada para detectar alterações na taxa em que os eventos adversos ocorrem.
Ao ler a carta T, esteja ciente de que os pontos acima do limite de controle superior indicam que a quantidade de tempo entre os eventos aumentou e, desta forma, a taxa de eventos diminuiu. Pontos abaixo do limite de controle inferior indicam que a taxa de eventos adversos aumentou.

A abordagem da transformação

A carta T é incluída em outros pacotes de software, todos os quais transformam os dados do tempo entre eventos para torná-los mais normalmente distribuídos. Os dados transformados são usados para determinar os limites de controle, que são depois convertidos de volta à escala de dados original e representados graficamente com os dados originais.

O problema com esta abordagem é que as caudas dos dados transformados não se ajustam muito bem a uma distribuição normal. Com a abordagem de transformação, a probabilidade de um ponto estar fora dos limites de controle é de apenas 0,0007546. Em contraste, com uma carta de controle padrão baseada em distribuição normal (como uma carta I ou carta Xbar), a probabilidade de um ponto estar fora dos limites de controle é muito maior, 0.00269. O método de transformação para uma carta T resulta em uma probabilidade incomumente baixa de pontos fora de controle e, assim, em um comprimento médio da seqüência (ARL) inflado.

Simulações (consulte a tabela 3 abaixo) mostram que a taxa de alarmes falsos aumenta exponencialmente para dados extremamente assimétricos e diminui para quase zero em dados que são menos assimétricos. Em geral, uma carta T implementada com a abordagem de transformação tem uma capacidade de detecção muito baixa, especialmente no limite de controle inferior. O baixo poder no limite de controle inferior significa que a carta praticamente não tem nenhuma capacidade para detectar aumentos na taxa de evento adversos.

A abordagem da distribuição espacial

Outra abordagem à carta T é modelar o tempo entre eventos usando uma distribuição exponencial. A base deste modelo é que, se os eventos adversos ocorrem de acordo com o modelo de Poisson, então o tempo entre eventos deveria seguir uma distribuição exponencial. Esta abordagem usa percentis da distribuição exponencial correspondendo às zonas ± 1, 2 e 3 sigma em uma carta padrão baseada na distribuição normal. Estes percentis são algumas vezes chamados de "limites de probabilidade". O uso de limites de probabilidade tem dois significados:

  • O ARL e taxa de falsos alarmes para um processo em controle são os mesmos esperados em uma carta Xbar com dados com distribuição normal.
  • O ARL e taxas de falsos alarmes esperados aplicam-se somente se os dados provêm de uma distribuição exponencial.

O problema com a distribuição exponencial é que, embora ela seja a distribuição teoricamente correta para o tempo entre eventos de Poisson, os dados na prática seguem frequentemente um modelo ligeiramente diferente. Os dados podem parecer distribuídos exponencialmente, mas na realidade podem se desviar suficientemente para afetar gravemente o ARL e taxa de falsos alarmes. Se os dados provêm de uma distribuição que seja mais assimétrica que uma distribuição exponencial, a taxa de falsos alarmes podem ser extremamente alta em um limite mais baixo, significando que haverá uma grande incidência de conclusões falsas de que a taxa de eventos adversos aumentou. Por outro lado, se os dados provêm de uma distribuição menos assimétrica que uma distribuição exponencial, o poder de detecção de aumentos na taxa de eventos adversos vai a zero.

A distribuição exponencial tem um valor de assimetria igual a 2 e um valor de curtose igual a 6. Simulações (consulte as Tabelas 1 a 3 abaixo) mostram que, à medida em que a assimetria e curtose dos dados aumentam a partir destes valores, a taxa de falsos alarmes com o limite de controle inferior aumenta exponencialmente. A taxa de falsos alarmes associada com o limite de controle superior aumenta mais vagarosamente. À medida que a assimetria e curtose da distribuição diminuem a partir dos valores exponenciais de 2 e 6, a taxa de falsos alarmes associada com o limite de controle superior aumenta, ao passo que a taxa de falsos alarmes associada com o limite de controle inferior vai a zero.

Abordagem do Minitab—a distribuição de Weibull

Para aumentar a robustez da carta, o Minitab usa uma distribuição de Weibull, ao invés de uma distribuição exponencial, para modelar o tempo entre os eventos. A distribuição de Weibull tem dois parâmetros: forma e escala. Se o parâmetro de forma for igual a 1, a distribuição de Weibull será a mesma de uma distribuição exponencial com o mesmo parâmetro de escala da distribuição de Weibull.

Variar o parâmetro de forma em torno de 1 permite que a distribuição de Weibull assuma diferentes formas, desde extremamente pontiagudos e assimétricos à direita (para parâmetros de forma menores que 1), a simétricos (para um parâmetro de forma aproximadamente igual a 3), até assimétricos à esquerda (normalmente para parâmetros de forma maiores que 5). Espera-se que o parâmetro de forma esteja normalmente entre 0,5 e 2, pois, desta forma, a distribuição estaá próxima da distribuição exponencial esperada. Embora usar os limites de probabilidade de uma distribuição de Weibull ainda signifique que o ARL e taxa de falsos alarmes esperados serão aplicados apenas se os dados provierem de fato de uma distribuição de Weibull, esta ampla família de distribuições aumenta as chances de obter um bom ajuste.

Simulações da carta T

Nas tabelas a seguir, 100 amostras aleatórias de 10.000 pontos de dados cada foram simuladas a partir da distribuição especificada. A proporção de pontos fora dos limites de controle é exibida na tabela. Em uma carta padrão baseada em distribuição normal, como uma carta Xbar, a proporção esperada de pontos fora dos limites é 0,00269.

As simulações usam as distribuições de Weibull e qui-quadrado. Uma distribuição de qui-quadrado com 2 graus de liberdade é o mesmo que uma distribuição exponencial com média igual a 2. Variar graus de liberdade próximo de 2 torna o qui-quadrado mais ou menos assimétrico que uma exponencial. Consulte a Figura 1. Uma distribuição de Weibull com um parâmetro de forma igual a 1 é o mesmo que uma distribuição exponencial com uma média igual ao parâmetro de escala de uma distribuição de Weibull. Variar o parâmetro de forma próximo de 1 torna o Weibull mais ou menos assimétrico que uma exponencial. Consulte a Figura 2.

 

 

Tabela 1a: Carta T baseada em exponencial com dados de qui-quadrado
Amostragem a partir de uma distribuição qui-quadrado

Graus de liberdade  Assimetria   Curtose   Abaixo de LCL   Acima de UCL  Total fora dos limites    % de esperados fora do limite
0,5   4.03   24,21   0,149413   0,027207   0,17662   6565,80%
  0.75   3,34   17.31   0,065271   0,016747   0,08218  3055,02%
  1,0  2,81    11,73   0,029265   0,010133   0,039398  1464,61%
 1,25    2,55   9,9   0,013345   0,006102   0,019453  723,16%
  1,5  2,3    7,83   0,006159   0,003682   0,009841  365,84%
 1,75    2,12   6,63   0,002868   0,002223   0,005091  189,26%
  2,0   1,96   5,85   0,001351   0,001339   0,00269  100,00%
  2,5   1,8   4,9   0,000227   0,001839  0,002689   99,96%
  3,0   1,64   4,03   0,000037   0,004179   0,004216  156,73%
  3,5   1,52  3,39    0,000006   0,006696   0,006702  249,14%

 

Tabela 1b: Carta T baseada em exponencial com dados de Weibull
Amostragem a partir de uma distribuição de Weibull

 

Forma 

Assimetria   Curtose   Abaixo de LCL   Acima de UCL  Total fora dos limites    % de esperados fora do limite
 2,0  0,63  0,25   0,000002   0  0,000002  0,07%
1,75  0,83  0,69   0,00001  0   0,00001  0,37%
1,5  1,07  1,4  0,000049  0,000049  1,82%
 1,25  1,43  2,77  0,000258  0,000025  0,000283  10,52%
1,0  2,02  6,13   0,001335  0,001355   0,00269  100,00%
 0,75  3,08  15,04  0,007002  0,016195  0,023197   862,34%
0,5  6,32  68,71  0,036022  0,076449  0,112461  4180,71%

 

Tabela 2a: Carta T baseada em Weibull com dados de qui-quadrado
Amostragem a partir de uma distribuição qui-quadrado

 Graus de liberdade    Assimetria  Curtose    Abaixo de LCL  Acima de UCL   Total fora dos limites   % de esperados fora do limite
 0,5   4,03   24,21   0,006500  0,000000    0,006288 

233,75%

 0,75   3,34   17,31   0,004558  0,000013   0,004571  169,93%
 1,0  2,81    11,73   0,003635   0,000115   0,003750  139,41%
 1,25   2,55   9,9   0,002788   0,000506   0,003294  122,45% 
1,5    2,3   7,83   0,001945   0,000621   0,002566  95,39%
 1,75   2,12   6,63   0,001656   0,000898   0,002554  94,94% 
 2,0   1,96   5,85   0,001596   0,001529   0,003125  116,17%
 2,5   1,8   4,9   0,000877   0,001849   0,002726  101,34%
 3,0   1,64   4,03   0,000585   0,002055  0,002640   98,14%
 3,5   1,52   3,39   0,000453   0,003190  0,003643   135,43% 

 

Tabela 2b: Carta T baseada em Weibull com dados de Weibull
Amostragem a partir de uma distribuição de Weibull

Forma   Assimetria   Curtose   Abaixo de LCL   Acima de UCL   Total fora dos limites  % de esperados fora do limite
 2,0    0,63   0,25  0,001386   0,001538   0,002924  108,70%
1,75   0,83  0,69  0,001365    0,001521  0,002886  107,29% 
1,5    1,07   1,4   0,001335    0,001312  0,002647  98,40% 
 1,25   1,43   2,77   0,001299   0,001351   0,002650  98,51% 
 1,0    2,02  6,13   0,001475    0,001498  0,002973  110,52% 
 0,75    3,08  15,04   0,001368   0,001347   0,002715  100,93%
 0,5    6,32  68,71   0,001220    0,001375  0,002595   96,47%

 

Tabela 3: Carta T baseada em transformação com dados de qui-quadrado
Amostragem a partir de uma distribuição qui-quadrado

 Graus de liberdade 

Assimetria   Curtose   Total fora dos limites   

% de esperados fora do limite

 0,5    4,03   24,21   0,14365  5340,15%
 0,75    3,34   17,31  0,073075   2716,54%
 1,0   2,81   11,73   0,0367875   1367,57%
 1,25   2,55   9,9   0,017825   662,64%
 1,5   2,3   7,83   0,0095125   353,62%
 1,75   2,12   6,63   0,00523333   194,55%
 2,0    1,96  5,85   0,00256   95,17%
 2,5   1,8    4,9  0,00069333   25,77%
  3,0   1,64  4,03   0,00034   12,64%
 3,5   1,52  3,39  0,00017333  6,44%


Figura 1: Comparação de distribuições de qui-quadrado e exponencial
  
Figura1  

Figura 2: Comparação de distribuições de Weibull e exponencial

Figura2  
  

Casos de uso para a carta T

A diferença entre uma carta G e uma carta T é a escala usada para medir a distância entre eventos. A carta G usa uma escala discreta (contagens de dias entre eventos ou oportunidades entre eventos registradas como números inteiros). A carta T usa uma escala contínua (geralmente as datas e horas em que os eventos ocorreram). A maioria dos usos da carta T discutidos em pesquisa tratam do monitoramento da taxas de infecção em configurações de tratamento médico. Outros exemplos incluem monitoração de erros de medicação, quedas de pacientes, complicações cirúrgicas e outros eventos adversos.

Observe que não é necessário ter as datas e horas juntamente. De fato, espera-se que um caso de uso proeminente tenha apenas dados de data. Se o número de oportunidades por dia não for relativamente constante, então uma carta T poderá ser uma escolha melhor que uma carta G.

Propriedades da Carta T

Como outras cartas de controle, a carta T tem uma linha central e limites de controle inferior e superior. Há também zonas que correspondem às zonas ± 1, 2, 3 sigma em uma carta Xbar ou carta I. Estas zonas não são exibidas na carta, mas são usadas em testes para causas especiais. Os limites de controle e zonas são baseados em percentis da distribuição de Weibull. Eles não são múltiplos do desvio padrão acima e abaixo da linha central, como em outras cartas. Como resultado, os limites de controle e zonas não são simétricos em torno da linha central, exceto no raro caso em que a própria distribuição de Weibull seja simétrica.

Os dados representados no gráfico são o número de dias ou horas entre os eventos. Isto faz com que a interpretação do gráfico seja incomum. Por exemplo, se a taxa de infecção aumentar, o tempo ou número de intervalos entre as infecções poderá diminuir ou mesmo chegar ao valor de 0. Se a taxa diminuir, o tempo ou número de intervalos entre infecções aumentará. Assim, um ponto além do limite superior de controle poderia indicar um período incomumente longo de tempo entre infecções—em outras palavras, a taxa era incomumente baixa.

Uma propriedade negativa da carta é que, se os limites de controle forem fixos e somente o teste 1 for usado, o comprimento médio da seqüência (ARL) aumentará se a taxa aumentar. Se a taxa aumentar em 25% e os limites de controle forem fixos, o ARL aumentará em aproximadamente 40%. Desta forma, a carta T será lenta na detectção de aumentos na taxa de eventos. Para compensar isto, o Minitab usa como padrão os testes 1 e 2. Adicionar o teste 2 aumenta o ARL em uma quantidade muito pequena para diminuições no tempo médio de cerca de 10% e diminui o ARL para mudanças maiores no tempo médio.

Cálculos utilizados

Notação

Existem 3 tipos de dados para os quais uma carta T pode ser usada:

  • Dados numéricos e não negativos
    Este tipo de dados é o número de intervalos entre eventos. Ele pode ser contínuo (por exemplo, 13,0957) ou um inteiro (embora dados inteiros sejam geralmente associados com a carta G). Se este tipo de dado for inserido, eles serão os valores Xi usados na carta.

    Observação: 0 não é um valor aceitável. Ele implica que 2 eventos ocorreram exatamente ao mesmo tempo. Se houver zeros nos dados, nós usamos um método alternativo para estimar os parâmetros.
  • Dados de data/hora (por exemplo, 01/23/2011 8:32:14)
    Este tipo de dado registra a data e hora de cada evento. Cada valor de dados deve ser >= o valor precedente. É aceitável ter somente datas, sem a parte da hora (embora dados apenas com datas sejam geralmente associados com uma carta G). Se datas/horas forem inseridas, os valores Xi para a carta serão calculados da seguinte forma:

    Sendo D1, D2, …, DN os valores de data/hora inseridos. Logo X2 = D2 – D1, X3 = D3 – D2, … , XN = DN – DN-1.

    Os dados resultantes são o número de dias (inteiro ou não inteiro) entre os eventos.

    Observação: Se apenas datas forem inseridas, os dados de dias entre eventos resultantes serão inteiros. Este tipo de dado está frequentemente associado com a carta G.
  • Dados de tempo entre eventos (por exemplo, 8:32:14)
    Também conhecidos como dados do tempo decorrido entre eventos. Os dados representam o tempo decorrido entre o evento i e o evento i-1. Se este tipo de dado for inserido, eles serão os valores Xi na carta.
  • Xi = pontos representados, como explicado acima.

    Se não houver zeros nos dados Xi, as estimativas do MLE dos parâmetros de forma (KAPPA) e escala (LAMBDA) serão calculados a partir dos dados e usados para obter os percentis da distribuição de Weibull.


    Se houver zeros nos dados Xi, o seguinte método alternativo para obtenção de parâmetros será usado:

  • Classifique os dados do menor ao maior. 
  • p = (classificação – 0,3) / (n + 0,4)
  • X = ln( -ln(1 – p) )
  • Remova as linhas (de X e dados) onde dados = 0
  • Y = Ln(dados)
  • Faça a regressão de Y para X, obtendo a equação Y = B0 + B1*X
  • LAMBDA = exp(B0), KAPPA = 1/B1 
  • Limites estimados a partir dos dados

    Sendo p1, p2, p3, p4, p5, p6, p7 os valores CDF de uma Normal(0,1) para –3, -2, -1, 0, +1, +2, +3.

    Sendo w1, w2, w3, w4, w5, w6, w7 os valores invcdf para p1, p2, p3, p4, p5, p6, p7 usando uma distribuição de Weibull (KAPPA, LAMBDA).

    Logo, obtenha LCL e UCL da seguinte maneira:

    CL = w4
    UCL = w7
    LCL = w1

    Uso de parâmetros históricos

    Se os parâmetros históricos forem especificados, a carta será baseada nos parâmetros de forma e escala da distribuição de Weibull, de forma muito semelhante que outras cartas usam a média e desvio padrão. Uma diferença é que o usuário precisa inserir valores históricos para ambos os parâmetros (em cartas como a carta I ou Xbar, pode-se inserir um ou ambos os parâmetros).

    O parâmetro de forma deve ser > 0 e na maioria dos casos ele deve estar entre 0,5 e 2, embora estes limites sejam usados primariamente por motivos práticos. Parâmetros de forma < 0.5 implicam em uma distribuição que é extremamente assimétrica e pode ter um valor de curtose que ultrapassa 2000 (uma distribuição exponencial tem um valor de curtose de apenas 6). Os parâmetros de forma que são maiores que 2 implicam em uma distribuição que está se aproximando da simetria ou mesmo assimétricos à esquerda. Ambas são bastante irrealistas, pois os dados para tempo entre eventos são geralmente altamente assimétricos à direita.

    O parâmetro da escala deve ser > 0 e um pouco maior que a média dos dados. Se o parâmetro de escala for menor que a média dos dados ou muito maior que média, os limites da carta não refletirão o processo com exatidão e poderão levar a muitos alarmes falsos.
    Observação: Os valores históricos inseridos substituem o KAPPA e LAMBDA usados nas equações acima para obter os limites de controle, linha central, etc.

    Testes de carta de controle padrão usados na carta T

    Teste 1 – 1 ponto fora dos percentis correspondendo a K desvios padrão longe da linha central em uma carta baseada na distribuição normal (ponto representado < w1 ou > w7, se K = 3, ver abaixo se K <> 3)

    Teste 2 – K pontos em uma linha em um lado da linha central

    Teste 3 – K pontos em uma linha, todos aumentando ou diminuindo

    Teste 4 – K pontos em uma linha, alternando acima e abaixo

    Teste 5 – K de K + 1 pontos > w6 ou K de K + 1 pontos < w2

    Teste 6 – K de K + 1 pontos > w5 ou K de K + 1 pontos < w3

    Teste 7 – K pontos em uma linha >= w3 e <= w5

    Teste 8 – K pontos em uma linha < w3 ou > w5

    No Teste1, se o argumento K for 3, então os valores w1 e w7 usados para os limites de controle serão usados para definir as falhas do Teste 1 (i.e., pontos que são < w1 ou > w7). Se o argumento K não for igual a 3, então defina p1' e p2' como os valores cdf da Normal(0,1) para –K e+K. Depois, defina w1' e w7' como os valores invcdf de Weibull (KAPPA, LAMBDA) correspondendo a p1’ e p2’. A definição de uma falha de teste 1 é então um ponto < w1' ou > w7'.

    Nos testes acima, w1, w2, w3, w4, w5, w6, w7 são como definidos previamente (i.e., valores invcdf da distribuição de Weibull correspondendo a p1, p2, p3, p4, p5, p6, p7 os valores cdf da Normal(0,1) para -3, -2, -1, +1, +2, +3. Entretanto, se o argumento do Teste 1 for <> 3, nós substituímos apenas w1 e w7 por w1' and w7'. 

    Referências

    [1] L. Y. Chan, D. K. J. Lin, M Xie e T. N. Goh. Cumulative Probability Control Charts for Geometric and Exponential Process Characteristics. International Journal of Production Research, 40:133-150, 2002.

    [2] L. Y. Chan, M Xie e T. N. Goh. Cumulative Quantity Control Charts for Monitoring Production Processes. International Journal of Production Research, 38:397-408, 2000.

    [3] F. F. Gan. Design of Optimal Exponential CUSUM Charts. Journal of Quality Technology, 26(2):109-124, 1994.

    [4] F. F. Gan. Designs of One-Sided and Two-Sided Exponential EWMA Charts. Journal of Quality Technology, 30:55-69, 1998.

    [5] F. C. Kaminsky, J. C. Benneyan, R. D. Davis e R. J. Burke. Statistical Control Charts Based on a Geometric Distribution. Journal of Quality Technology, 24:63-69, 1992.

    [6] J. Y. Liu, M. Xie, T. N. Goh e P. R. Sharma. A Comparative Study of Exponential Time Between Events Charts. Quality Technology of Quantitative Management, 3:347-359, 2006.

    [7] D. C. Montgomery. Introduction to Statistical Quality Control, Wiley, 6ª edição, 2009.

    [8] M. Xie, T. N. Goh e P. Ranjan. Some Effective Control Chart Procedures for Reliability Monitoring. Reliability Engineering and System Safety, 77:143-150, 2002.

    [9] C. W. Zhang, M. Xie e T. N. Goh. Design of Exponential Control Charts Using a Sequential Sampling Scheme. IIE Transactions, 38:1105-1116, 2006.

    [10] C. W. Zhang, M. Xie e T. N. Goh. Economic Design of Exponential Charts for Time Between Events Monitoring. International Journal of Production Research, 43:5019-5032, 2005.

     

    Preparado por Dr. Terry Ziemer, SIXSIGMA Intelligence


    Baixe este artigo no formato PDF (Apenas em inglês)

    Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado. Leia nossa política

    OK