Pronósticos meteorológicos: ¿Simplemente cuán confiables son?

¿Suele visitar su sitio web favorito de información sobre el clima, o consultar el pronóstico todas las mañanas en su teléfono celular? Algunos de nosotros realmente nos obsesionamos con el clima. En los Estados Unidos, tenemos un canal de televisión dedicado exclusivamente al tema, y tengo amigos que le prestan más atención a este canal que a las noticias, su equipo favorito... ¡tal vez incluso su esposa!

Al revisar el tiempo, usted puede obtener el pronóstico del día siguiente, o puede mirar el pronóstico para los próximos 5 días o incluso para los próximos 10. ¿Pero alguna vez se preguntó qué tan fidedignas son estas predicciones? Muchas personas cuentan con que estos pronósticos a largo plazo logren predecir con precisión las condiciones climáticas futuras, pero ¿son realmente confiables, o son más bien el equivalente meteorológico a mirar en una bola de cristal?

En este artículo, examinaremos datos sobre la temperatura y utilizaremos diversas herramientas estadísticas para determinar qué tan confiable es el pronóstico.

Recolección de datos

Visitamos uno de los principales sitios web del clima y recolectamos las temperaturas más altas pronosticadas para el día siguiente, los 5 días siguientes y los 10 días siguientes (en ºC) para el área de State College, Pennsylvania, el lugar donde se encuentra la sede corporativa mundial de Minitab. Hicimos esto cada día durante 30 días y registramos las temperaturas pronosticadas, además de la temperatura real más alta para cada día, en Minitab Statistical Software.

Posteriormente, utilizando Calc > Calculadora, calculamos las diferencias entre las 3 temperaturas más altas pronosticadas y el valor de temperatura real para cada día.

 
Registramos los pronósticos de 10 días, 5 días y del día siguiente en Minitab, luego calculamos la diferencia entre las temperaturas más altas pronosticadas y las reales.

Pronósticos: ¿Predecibles o irregulares?

Independientemente del análisis, generar una representación gráfica de sus datos es siempre un buen paso para empezar. Dado que estos datos se recolectaron durante un período de tiempo, podemos usar Gráfica > Gráfica de series de tiempo para graficar las temperaturas reales y pronosticadas para cada día.

La siguiente gráfica muestra que el pronóstico es más confiable en algunos días, en comparación con otros. También muestra los picos y valles de temperatura que se produjeron en State College durante la parte final de la primavera.

 
Podemos utilizar una gráfica de series de tiempo para comparar el pronóstico con la temperatura real de cada día del estudio.

Para comparar fácilmente el centro y la dispersión de la diferencia entre la temperatura real y los tres pronósticos, podemos utilizar Gráfica > Gráfica de valores individuales.

 
La gráfica de valores individuales muestra que el pronóstico para 10 días exhibe mayor variación que los otros dos pronósticos.

Con una desviación estándar de 3.4 grados, podemos ver que el pronóstico para 10 días sobrestimó la temperatura más alta hasta en 5 grados y la subestimó hasta en 10 grados, como se observa en la gráfica siguiente. Los pronósticos para 5 días y del día siguiente fueron menos variables con desviaciones estándar de 2.4 y 1.2, respectivamente.

Ahora bien, ¿es esta diferencia en la variabilidad entre los 3 pronósticos estadísticamente significativa, o son probables estas muestras observadas dado que las varianzas son realmente iguales? Utilicemos una prueba de igualdad de varianzas para averiguarlo.

Hay varias formas de realizar una prueba de varianzas en Minitab. En este caso, utilizaremos Asistente > Pruebas de hipótesis para obtener un informe completo de nuestros resultados. Con un valor p de 0.000 (no se muestra), podemos concluir que existe una diferencia estadísticamente significativa entre las varianzas. Específicamente, la varianza correspondiente a la diferencia en el pronóstico del día siguiente es significativamente menor que las varianzas de las diferencias en los pronósticos para 5 días y 10 días.

Conclusión: El pronóstico del día siguiente es significativamente más preciso que los otros dos pronósticos.

A continuación, utilicemos Asistente > Pruebas de hipótesis para realizar un ANOVA de Welch para varianzas desiguales y evaluar la exactitud de los pronósticos. Utilizando un valor de nivel de significancia=0.05, el valor p de 0.011 es significativo. Por lo tanto, los tres promedios no son todos iguales (ver la figura abajo). Específicamente, la sobrestimación promedio de 0.4º para el pronóstico del día siguiente es significativamente mayor que la subestimación promedio de -1.7º correspondiente al pronóstico para 10 días.

Conclusión: Las diferencias promedio para el día siguiente y para los 5 días siguientes parecen ser igualmente exactas, con ambos intervalos de confianza mostrando 0.

 
La disparidad promedio correspondiente al pronóstico del día siguiente es significativamente menor que la del pronóstico para 10 días.

¿Traje de baño o suéter?

Ahora que hemos hecho nuestras comparaciones y determinamos que el pronóstico para 10 días es mucho menos exacto, vamos a evaluar qué tan efectivos pueden ser los pronósticos para 5 días y del día siguiente para predecir si se debería planear usar un traje de baño o un suéter.

Pronóstico para 5 días

Aunque el pronóstico para 5 días es más variable que el pronóstico del día siguiente, seguimos queriendo una bola de cristal: queremos mirar hacia el futuro, y tal vez por más de 24 horas. Para evaluar de forma visual y estadística qué tan bien podemos predecir la temperatura real con el pronóstico para 5 días, podemos realizar un análisis de regresión utilizando Estadísticas > Regresión > Gráfica de línea ajustada.

 
Podemos utilizar una gráfica de línea ajustada para explorar la relación entre la temperatura y el pronóstico de 5 días.

El valor p de 0.000, que se encuentra en la ventana Sesión, indica que existe una relación lineal significativa entre la temperatura real y el pronóstico de 5 días.

El valor R-cuadrado indica que este modelo explica el 77% de la variabilidad identificada en la alta temperatura real, que es probablemente mejor que su bola de cristal promedio.

Además, al utilizar gráficas residuales (no se muestran), podemos verificar los supuestos del modelo y concluir que el análisis es válido.

Pronóstico de día siguiente

Ahora, realicemos un análisis similar al pronóstico de día siguiente. La gráfica de abajo y el alto valor R-cuadrado indican que el pronóstico de día siguiente constituye un mejor y muy confiable predictor de la alta temperatura real.

 
Debido a que todos los puntos se encuentran cerca de la línea, el modelo de la regresión parece tener un ajuste adecuado.

Por medio de los intervalos de predicción, podemos calcular un intervalo de valores probable para un pronóstico de día siguiente determinado. Por ejemplo, podemos estar 95% seguros de que un pronóstico de día siguiente de 25ºC probablemente corresponderá a una temperatura real entre 22.3 y 26.9ºC.

Es importante tener en cuenta que si bien la regresión indica que existe una relación lineal, no especifica si se trata de una relación 1 a 1. En otras palabras, nuestro valor p podría ser significativo debido a que un pronóstico de 25ºC indica un valor alto de 25ºC, o podría ser significativo porque un pronóstico de 25ºC ofrece buenos resultados en la predicción de un alto valor de, supongamos, 12.5ºC (por ejemplo, si el coeficiente de la pendiente es 0.5).

Para determinar si existe una relación 1 a 1, podemos calcular los intervalos de confianza correspondientes a los coeficientes utilizando Estadísticas > Regresión > Regresión general > Resultados.


Podemos utilizar un intervalo de confianza para evaluar los coeficientes correspondientes a la intersección Y y la pendiente.

Debido a que el intervalo de confianza de la constante (-0.76, 3.38), que se muestra en el resultado anterior, incluye 0 y el intervalo de confianza del coeficiente de la pendiente (0.85, 1.01) incluye 1, podemos concluir que la relación entre el pronóstico de día siguiente y la temperatura real es en realidad 1 a 1.

Conclusión

Considerando todos los factores que intervienen, el clima es un proceso indiscutiblemente complejo y, por tal motivo, puede exhibir una variación considerable. Sin embargo, si realizará planes importantes basándose en el clima y desea minimizar la variación, los datos recogidos sugieren que lo más recomendable es confiar en el pronóstico del día siguiente.

No es mucho lo que podemos predecir con precisión para 5 días en el futuro, así que en términos relativos, el pronóstico de 5 días se acerca mucho más a lograr eso en comparación con la mayoría de los aspectos de la vida. En lo que respecta al pronóstico de 10 días, es probable que los meteorólogos sepan cuán impredecibles pueden ser las condiciones climáticas de los próximos 10 días. No obstante, nos ofrecen estos pronósticos porque deseamos saber lo que depara el futuro, a pesar de la falibilidad de las predicciones. Sin embargo, es bueno saber en cuáles pronósticos podemos confiar y cuáles se asemejan más a la adivinación del futuro.


Michelle Paret
Gerente de mercadotecnia de productos, Minitab Inc.

Eston Martz
Especialista senior en servicios creativos, Minitab Inc.

Descargar este artículo como un archivo PDF (Sólo en inglés)

Al utilizar este sitio, usted acepta el uso de cookies para efectos de análisis y contenido personalizado. Leer nuestra política