Compartilhando maneiras de iluminar conceitos estatísticos desafiadores

Os melhores professores de estatística introdutória sabem que a simples memorização da execução de procedimentos não é suficiente, os alunos devem compreender o significado real de seus resultados. 

Com mais de 15 anos de ensino, a Dra. Julie Belock, uma professora da Salem State University, desenvolveu vários projetos para seus alunos que exploram o significado por trás das técnicas estatísticas.  Em um artigo apresentado na 25ª Annual International Conference on Technology in Collegiate Mathematics, Belock discute três dos conceitos que os alunos acham mais desafiadores, lecionando com o Minitab Statistical Software.

"Uso o software Minitab nesses projetos devido à sua facilidade de utilização e produção de gráficos excelentes, que ajudam os alunos na interpretação e apresentação de seus trabalhos", escreve Belock.

Intervalos de confiança

Em estatística, estimamos as características das populações através da análise de um subconjunto de indivíduos, chamado de amostra. Mas, ao usar dados de amostra para estimar um parâmetro da população, como a média, é muito improvável que você consiga corresponder exatamente o parâmetro verdadeiro. Um intervalo de confiança é um intervalo que provavelmente contém esse valor verdadeiro portanto, embora não seja possível fornecer o valor preciso, é possível dizer com confiança que a média verdadeira está dentro desse intervalo.

Intervalos de confiança são medidos por seus níveis de confiança e é aqui que os alunos geralmente ficam confusos. Com frequência, eles supõem que um intervalo de confiança de 90% tem 90% de chance de conter a média verdadeira. Mas o nível de confiança indica na verdade sua chance de selecionar aleatoriamente uma amostra cujo intervalo de confiança contém o parâmetro verdadeiro. "Assim que um intervalo é calculado a partir de uma amostra específica, ele conterá a média verdadeira, ou não", explica Belock. "Não há mais nada de aleatório nisso!".

Os alunos de Belock veem isso em primeira mão usando o Minitab para simular um grande número de amostras aleatórias e gerando intervalos de confiança para cada uma delas. Ao calcular a porcentagem de intervalos de confiança que contém o parâmetro verdadeiro, os alunos descobrem que essa porcentagem se aproxima do nível de confiança.

gráfico de efeitos principais

No exemplo acima, os alunos podem ver que cada um desses intervalos de confiança de 90% contém a média verdadeira ou não, e que 17 de 20 (aproximadamente 90%) realmente contêm a média verdadeira de 100.

Valores-p

Belock usa uma abordagem similar para ilustrar o conceito do valor-p, a probabilidade de obter um resultado pelo menos tão extremo quanto a um em seus dados amostrais simplesmente ao acaso. Ela dá um exemplo no qual 39% dos alunos amostrados dizem que irão fazer pós-graduação logo após terminar a faculdade, quando dados anteriores mostraram que cerca de 35% de todos os alunos foram fazer cursos de pós-graduação. Essa amostra indica que a proporção de alunos que foram fazer o curso logo após a faculdade aumentou? 

Um teste-z para 1 proporção calcula o valor-p do resultado de 39% da amostra. Mas primeiro, os alunos de Belock aproximam o valor-p de outra maneira. Eles geram 100 amostras aleatórias simuladas extraídas de uma população em que 35% dos alunos foram direto para a pós. Eles então descobrem qual porcentagem dessas amostras resulta em valores de pelo menos 39%. Quando os alunos comparam essa frequência com um valor-p gerado a partir do teste para 1 proporção, eles descobrem que têm um resultado quase igual e compreendem claramente o que o valor-p representa.

Diagnósticos de regressão

Uma equação de regressão modela o relacionamento entre duas ou mais variáveis. Um gráfico de dispersão representa graficamente as variáveis da regressão em relação uma a outra, para que seja possível visualizar a correlação. Um gráfico de resíduos é uma ferramenta de diagnóstico para uma análise de regressão que permite visualizar quanto da variação dos seus dados não é explicado pela regressão, uma ideia que normalmente é complicada para os alunos. 

Um gráfico de dispersão mostra um padrão se os dados forem correlacionados. Mas um gráfico de resíduos não mostrará um padrão se o modelo de regressão for bem ajustado. Para ver como isso funciona, os alunos de Belock usam dados reais sobre ursos (de um conjunto incluso na pasta de dados amostrais do Minitab) para criar vários gráficos de dispersão. Alguns dos gráficos mostram uma correlação linear forte, enquanto outros não. Quando os alunos executam regressão linear nos dados que não estão correlacionados, um gráfico de resíduos "ruim" é generado indicando que a regressão tem um ajuste ruim. 

gráfico de contorno da dissolução

A regressão mostrada no gráfico de linha ajustada (Fitted Line Plot) acima não fornece um bom ajuste e produz um gráfico de resíduos com um padrão claramente curvado.

Depois, os alunos executam regressão em variáveis que estão correlacionadas e ajustam suas análises para refinar ainda mais o ajuste da regressão. À medida que fazem isso, qualquer padrão nos resíduos desaparece e eles ficam com um gráfico de resíduos dispersos aleatoriamente que indica um bom ajuste.

gráfico de contorno da dissolução

Uma regressão que se ajusta bem aos dados resulta em um gráfico de resíduos sem padrão como esse acima (ao lado direito).

Conclusão

Esses exercícios provaram ser úteis para alunos de todos os níveis, observa Belock. A abordagem prática mantém os alunos envolvidos ativamente no processo de aprendizado, enquanto o uso do Minitab para cálculos e gráficos libera os alunos para focarem nos conceitos.

"O Minitab funciona melhor que outros programas nessas atividades específicas devido a vários fatores," escreve Belock, "que incluem facilidade de uso, gráficos claros e opções apropriadas, como a capacidade de gerar e exibir vários intervalos de confiança simultaneamente".

As lições de Belock, com instruções passo a passo, são detalhadas em "Addressing Challenging Statistical Topics with Minitab" (Abordando tópicos desafiadores em estatística com o Minitab), um artigo apresentado na 25ª Annual International Conference on Technology in Collegiate Mathematics.

Ao usar esse site, você concorda com a utilização de cookies para análises e conteúdo personalizado. Leia nossa política

OK