Profundice más en datos de encuestas con Minitab: Pruebas t de 2 muestras, Pruebas de proporción, ANOVA y Regresión

En un artículo anterior, exploramos diferentes herramientas básicas para el análisis de encuestas en Minitab. Ahora utilizaremos técnicas más sofisticadas, como las pruebas t de 2 muestras, las pruebas de proporciones, ANOVA y regresión, para profundizar en nuestros datos.

Pruebas de hipótesis

En  Analizar datos de encuestas con Minitab, comenzamos a examinar las pruebas de hipótesis utilizando una prueba chi cuadrada para confirmar una asociación entre sexo y preferencia de mascota. Comúnmente, se utilizan otras pruebas de hipótesis para analizar datos de encuestas, incluidas las pruebas t para evaluar medias y las pruebas de proporciones para evaluar porcentajes. Estos tipos de pruebas se pueden utilizar para comparar promedios o proporciones con un valor objetivo, o para comparar promedios y proporciones entre sí.
La mayoría de las pruebas de hipótesis de Minitab se encuentran en el menú Estadísticas > Estadísticas básicas.

Prueba t de 2 muestras

La prueba t de 2 muestras se puede utilizar para comparar los promedios entre dos grupos y determinar si existe una diferencia significativa entre ellos o si la diferencia observada se debe en cambio a una probabilidad aleatoria.
Supongamos que nuestra agencia de adopción y rescate de mascotas locales encuesta a una muestra aleatoria de 100 personas que han adoptado mascotas para investigar las potenciales implicaciones económicas en la adopción de mascotas. Deseamos determinar si la cantidad de dinero que las personas gastan anualmente para sus mascotas en comida, suministros, gastos médicos, entre otros, varía según el tipo de mascota que adoptan las personas. Podemos utilizar una prueba t de 2 muestras para determinar si las personas que adoptaron gatos gastaron más, menos o la misma cantidad de dinero que las personas que adoptaron perros. La hipótesis nula sería que la cantidad de dinero promedio gastada por propietarios de gatos y perros es igual y la hipótesis alternativa es que los gastos promedio no son iguales.

Seleccionamos Estadísticas > Estadísticas básicas > t de 2 muestras para aplicar esta prueba a nuestros datos, y Minitab le proporciona el siguiente resultado:

DelveDeeper-2-sample-T-ES.gif

Seleccionamos un valor denominado nivel de significancia antes de realizar una prueba de hipótesis y comparamos el valor p de la prueba t con el nivel de significancia. El valor p indica la probabilidad de obtener nuestros resultados si la hipótesis nula es verdadera. Si el valor p es menor que o igual al nivel de significancia, rechazamos la hipótesis nula y concluimos que existe una diferencia en los gastos anuales promedio correspondientes a gatos y perros.

Para nuestra prueba, utilizamos un nivel de significancia de 0.05, que es bastante común. Debido a que nuestros datos generaron un valor p de 0.000, que es menor que nuestro nivel de significancia de 0.05, podemos rechazar la hipótesis nula. Nuestros datos respaldan la conclusión de que los propietarios de gatos no gastan la misma cantidad de dinero en sus mascotas, en promedio, que los propietarios de perros. De hecho, podemos concluir que los propietarios de gatos gastan significativamente menos que los propietarios de perros.

La prueba t de 2 muestras también crea un intervalo de confianza que nos proporciona más detalles sobre la diferencia entre los grupos. Nuestros datos se analizaron con un nivel de significancia de 0.05, de modo que Minitab nos proporciona un intervalo de confianza de 95%; es decir, 0.95. Este intervalo nos indica que, con base en los datos de la muestra, podemos estar 95% seguros de que la diferencia media entre los gastos de las dos poblaciones se encuentra entre 42.74 y 73.17 dólares. Tenga en cuenta que este intervalo de confianza no contiene 0, lo cual indica que la diferencia entre las medias de los grupos es significativa o diferente de 0.

Pruebas de proporciones

¿Qué ocurre si deseamos realizar inferencias sobre una proporción de una población? Podemos utilizar la prueba de una proporción de Minitab para hacerlo.

Supongamos que contamos con los datos de una encuesta de 1,000 propietarios de mascotas locales seleccionados aleatoriamente. Deseamos determinar si la proporción de la población de propietarios de hurones es diferente del promedio nacional de 6.5%.

Cuando utilizamos procedimientos de una proporción, lo que en realidad tratamos de decidir es cuál de las dos hipótesis opuestas es verdadera, basándonos en nuestros datos:

  • No existe diferencia entre las tasas de propietarios de hurones locales y el promedio nacional. Llamamos a ésta la “hipótesis nula”.
  • Existe una diferencia significativa entre las tasas de hurones locales y el promedio nacional. Llamamos a ésta la “hipótesis alternativa”. También podemos crear la hipótesis alternativa direccional para determinar si nuestra tasa es mayor o menor que el promedio.

Para realizar una prueba de proporciones, utilizamos Estadísticas > Estadísticas básicas > 1 proporción. Minitab proporciona el siguiente resultado:

DelveDeeper-CI-1-Proportion-ES.gif

El análisis proporciona un valor p de 0.008, lo cual indica que existe una probabilidad de 0.8% de obtener esta proporción de muestra (o una proporción de muestra más extrema) si la proporción de la población fuera igual a nuestro valor de referencia de 0.065, el promedio nacional.

La prueba de proporción también ofrece un intervalo de confianza, el cual nos indica que podemos estar 95% seguros de que la proporción de la población de propietarios de hurones locales es mayor que o igual a 0.070268; es decir, 7.02%, y menor que o igual a 0.106208; es decir 10.6%. Debido a que el intervalo de confianza no contiene nuestro valor de referencia de 0.065 y el valor p se encuentra por debajo de 0.05, podemos rechazar la hipótesis nula y concluir que la proporción de la población no es 0.065. La proporción es significativamente mayor que 6.5%.

Minitab también nos permite realizar pruebas de dos proporciones para realizar inferencias sobre la diferencia entre las dos proporciones de la población. Supongamos que deseamos saber si la proporción de visitantes de un refugio de animales que adopta una mascota pudiera aumentar al ofrecer un incentivo como alimento para mascotas gratis. Podemos ofrecer el incentivo a la mitad de nuestros visitantes, luego encuestar a los visitantes que recibieron la oferta y los que no la recibieron y utilizar la prueba de dos proporciones para determinar si los resultados sugieren que ofrecer un incentivo animaría a que más de la población de visitantes general adopte.

ANOVA

¿Qué ocurre si deseamos utilizar los datos de nuestra encuesta sobre gastos anuales en mascotas para entender la información de tres o más grupos? En este caso, podemos utilizar las herramientas de ANOVA (análisis de varianza) de Minitab. Un ANOVA es similar a una prueba t en que ambos análisis comparan medias de grupos para una Y continua; es decir, gastos en mascotas, pero además de utilizar ANOVA para probar si tres o más medias difieren con respecto a una misma variable de agrupación, también se puede utilizar para comparar medias de grupos con respecto a múltiples variables.

Existen diferentes tipos de ANOVA. Para probar si los promedios de grupos con respecto a un mismo factor categórico son iguales, puede utilizar un ANOVA de un solo factor. Por ejemplo, nuestra agencia de mascotas pudiera utilizar un ANOVA de un solo factor para determinar si los gastos en mascotas difieren en tres diferentes niveles de educación.

También se podría utilizar un procedimiento de ANOVA para determinar si la cantidad de dinero promedio gastada en mascotas difiere entre múltiples factores categóricos, tales como tres niveles de educación y entre el tipo de mascota. También se puede utilizar ANOVA para determinar si existen interacciones entre dos o más variables. Si está presente una interacción entre dos factores, entonces el efecto de un factor sobre la respuesta depende del nivel del otro factor.

Podemos utilizar Estadísticas > ANOVA > Modelo lineal general para este tipo de análisis. Para nuestra encuesta a propietarios de mascotas, podríamos utilizar esta herramienta a fin de determinar (1) si los gastos en mascotas difirieron en los niveles de educación, (2) si los gastos en mascotas difirieron entre gatos y perros y (3) si hubo una interacción entre nivel de educación y tipo de mascota.

DelveDeeper-GLM-ES.gif

En los resultados anteriores, la variable Mascota tiene un valor p de 0.000, mientras que Educación y la interacción Mascota*Educación tienen valores p mayores que 0.05. Según este análisis, nuestros datos no respaldan la conclusión de que los gastos en mascotas difieren significativamente según el nivel de educación ni que existe una interacción entre nivel de educación y el tipo de mascota que se posee.

También existe un tipo de ANOVA llamado ANCOVA. Si tiene una combinación de factores categóricos y continuos, también puede utilizar la herramienta Modelo lineal general de Minitab para realizar un ANCOVA.

Regresión

Minitab incluye una amplia variedad de análisis de regresión, los cuales se pueden utilizar para examinar o pronosticar la manera como variables continuas específicas afectan un resultado particular; por ejemplo, cómo el ingreso familiar de una persona se relaciona con los gastos en mascotas. Se puede utilizar para:

  • Determinar si existe una relación entre las variables dependiente (Y) y las independientes (X).
  • Determinar la fortaleza y estructura de la relación, si existe una.
  • Pronosticar valores de la variable dependiente basándose en los valores de las variables independientes.

La regresión lineal simple nos indica la relación entre una variable Y y una variable X. Utilizamos la regresión múltiple para conocer las relaciones entre una variable Y y diferentes variables X. En la regresión múltiple, seguimos demostrando cómo Y depende de X, pero ahora Y pudiera depender de diferentes X o incluso de la interacción entre las X.

Supongamos que deseamos utilizar una regresión lineal simple para evaluar la posibilidad de usar el ingreso familiar a fin de pronosticar los gastos en mascotas. Podemos ir a Estadísticas > Regresión para realizar nuestro análisis en Minitab.

DelveDeeper-Regression-ES.gif

El valor p de Ingreso de 0.000 es menor que a=0.05, lo cual indica que existe una relación lineal significativa, o correlación, entre el ingreso de un propietario de mascota y cuánto gasta en ésta.

Es de mucha importancia recordar que dicha correlación nos indica la naturaleza y el grado de asociación entre las variables, pero no da cuenta de que existe una relación de causa y efecto. Una asociación entre una variable independiente y una dependiente no significa que X cause Y, sino que según aumente o disminuya X, también lo hará Y. Esto es lo que los profesores de estadística quieren decir a sus estudiantes con “correlación no implica causalidad”. Resulta particularmente importante tener esto claro cuando se comunican los resultados de su análisis a personas con conocimientos de estadística no muy profundos.

La buena noticia es que usted puede seguir utilizando los análisis de regresión para realizar pronósticos, ya que el pronóstico no requiere causalidad. El análisis de regresión describe la relación observada entre una o más variables y una respuesta, y podemos utilizar dicha relación para realizar pronósticos sin preocuparse por la causalidad, siempre que los patrones encontrados no cambien.

Poderosas herramientas para el análisis de encuestas

Este artículo proporciona una breve revisión general de los tipos de información que puede recoger al analizar sus datos con Minitab Statistical Software. Minitab tiene las herramientas que necesita para analizar datos de encuestas y llegar a conclusiones acertadas sobre mercados, clientes o lo que sea que intente evaluar. Para obtener más información y ejemplos adicionales sobre cómo usar estas herramientas útiles, Minitab ofrece amplio sistema de Ayuda y soporte técnico gratis.

Eston Martz
Especialista senior en servicios creativos, Minitab Inc.

Michelle Paret
Gerente de mercadotecnia de productos, Minitab Inc.

Para obtener más información sobre estadísticas, visite www.minitab.com.


Descargar este artículo como un archivo PDF (Sólo en inglés)

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado. Leer nuestra política