banner
Hogar / Blog / Medio preciso
Blog

Medio preciso

Apr 14, 2024Apr 14, 2024

Nature volumen 619, páginas 533–538 (2023)Cite este artículo

106k Accesos

4 citas

1534 altmétrico

Detalles de métricas

La previsión meteorológica es importante para la ciencia y la sociedad. En la actualidad, el sistema de pronóstico más preciso es el método de predicción numérica del tiempo (NWP), que representa los estados atmosféricos como cuadrículas discretizadas y resuelve numéricamente ecuaciones diferenciales parciales que describen la transición entre esos estados1. Sin embargo, este procedimiento es computacionalmente costoso. Recientemente, los métodos basados ​​en inteligencia artificial2 han demostrado potencial para acelerar el pronóstico del tiempo en órdenes de magnitud, pero la precisión del pronóstico sigue siendo significativamente menor que la de los métodos de PNT. Aquí presentamos un método basado en inteligencia artificial para un pronóstico meteorológico global preciso y de mediano alcance. Mostramos que las redes profundas tridimensionales equipadas con antecedentes específicos de la Tierra son efectivas para lidiar con patrones complejos en datos meteorológicos, y que una estrategia de agregación temporal jerárquica reduce los errores de acumulación en el pronóstico de mediano plazo. Nuestro programa, Pangu-Weather, formado con 39 años de datos globales, obtiene resultados de pronóstico deterministas más sólidos en datos de reanálisis en todas las variables probadas en comparación con el mejor sistema de PNT del mundo, el sistema operativo integrado de pronóstico del Centro Europeo para el Tiempo a Plazo Medio. Previsiones (CEPMWF)3. Nuestro método también funciona bien con pronósticos meteorológicos extremos y pronósticos por conjuntos. Cuando se inicializa con datos de reanálisis, la precisión del seguimiento de ciclones tropicales también es mayor que la del ECMWF-HRES.

El pronóstico del tiempo es una aplicación importante de la informática científica que tiene como objetivo predecir cambios climáticos futuros, especialmente en lo que respecta a eventos climáticos extremos. En la última década, los sistemas informáticos de alto rendimiento han acelerado enormemente la investigación en el campo de los métodos de predicción numérica del tiempo (PNT)1. Los métodos convencionales de PNT se ocupan principalmente de describir las transiciones entre cuadrículas discretizadas de estados atmosféricos utilizando ecuaciones diferenciales parciales (PDE) y luego resolverlas con simulaciones numéricas4,5,6. Estos métodos suelen ser lentos; una sola simulación de un pronóstico de diez días puede requerir horas de cálculo en una supercomputadora que tiene cientos de nodos7. Además, los algoritmos convencionales de PNT se basan en gran medida en la parametrización, que utiliza funciones aproximadas para capturar procesos no resueltos, donde se pueden introducir errores por aproximación8,9.

El rápido desarrollo del aprendizaje profundo10 ha introducido una dirección prometedora, a la que la comunidad científica se refiere como métodos basados ​​en inteligencia artificial (IA)2,11,12,13,14,15,16. Aquí, la metodología consiste en entrenar una red neuronal profunda para capturar la relación entre la entrada (reanalizar los datos meteorológicos en un momento determinado) y la salida (reanalizar los datos meteorológicos en el momento objetivo). En dispositivos computacionales especializados, como las unidades de procesamiento de gráficos (GPU), los métodos basados ​​en IA son extremadamente rápidos. Para dar un ejemplo reciente, FourCastNet2 tarda solo 7 s en calcular un pronóstico de 24 horas de 100 miembros, que es órdenes de magnitud más rápido que los métodos convencionales de PNT. Sin embargo, la precisión de FourCastNet aún no es satisfactoria; su error cuadrático medio (RMSE) de un pronóstico Z500 (geopotencial de 500 hPa) de 5 días es 484,5, que es mucho peor que el 333,7 informado por el sistema operativo integrado de pronóstico (IFS) del Centro Europeo de Previsiones Meteorológicas a Plazo Medio. (CEPPMM)3. En una encuesta reciente17, los investigadores coincidieron en que la IA tiene un gran potencial, pero admitieron que “se necesitan una serie de avances fundamentales” antes de que los métodos basados ​​en la IA puedan vencer a la PNT.

Estos avances parecen estar ocurriendo antes de lo esperado. Aquí presentamos Pangu-Weather (consulte Métodos para obtener una explicación del nombre 'Pangu'), un poderoso sistema de pronóstico del tiempo basado en inteligencia artificial que produce resultados de pronóstico deterministas más sólidos que el IFS operativo en todas las variables climáticas probadas frente a datos de reanálisis. Nuestras contribuciones técnicas son dobles. Primero, integramos información de altura en una nueva dimensión para que la entrada y salida de nuestras redes neuronales profundas puedan conceptualizarse en tres dimensiones. Además, diseñamos una arquitectura de transformador tridimensional (3D) específica de la Tierra (3DEST) para inyectar antecedentes específicos de la Tierra en las redes profundas. Nuestros experimentos muestran que los modelos 3D, al formular la altura en una dimensión individual, tienen la capacidad de capturar la relación entre los estados atmosféricos en diferentes niveles de presión y, por lo tanto, producen ganancias de precisión significativas, en comparación con modelos bidimensionales como FourCastNet2. En segundo lugar, aplicamos un algoritmo de agregación temporal jerárquico que implica entrenar una serie de modelos con tiempos de entrega de pronóstico crecientes. Por lo tanto, en la etapa de prueba, se redujo en gran medida el número de iteraciones necesarias para el pronóstico del tiempo a mediano plazo y se aliviaron los errores de pronóstico acumulativos. Los experimentos con la quinta generación de datos de reanálisis del ECMWF (ERA5)18 validaron que Pangu-Weather es bueno en pronósticos deterministas y pronósticos de condiciones climáticas extremas y, al mismo tiempo, es más de 10 000 veces más rápido que el IFS operativo.

Establecimos nuestro sistema de pronóstico del tiempo mediante aprendizaje profundo. La metodología implica entrenar redes neuronales profundas para tomar datos meteorológicos de reanálisis en un momento dado como entrada y luego producir datos meteorológicos de reanálisis en un momento futuro como salida. Utilizamos un único punto en el tiempo tanto para la entrada como para la salida. La resolución temporal de los datos ERA5 es de 1 h; en el subconjunto de entrenamiento (1979-2017), hubo hasta 341,880 puntos temporales, la cantidad de datos de entrenamiento en una época. Para aliviar el riesgo de sobreajuste, permutamos aleatoriamente el orden de la muestra de los datos de entrenamiento al comienzo de cada época. Entrenamos cuatro redes profundas con tiempos de entrega (la diferencia de tiempo entre entrada y salida) de 1 h, 3 h, 6 h y 24 h, respectivamente. Cada una de las cuatro redes profundas se entrenó durante 100 épocas y cada una de ellas tarda aproximadamente 16 días en un grupo de 192 GPU NVIDIA Tesla-V100.

La arquitectura de nuestra red profunda se muestra en la Fig. 1a. Esta arquitectura se conoce como transformador 3D específico de la Tierra (3DEST). Introducimos todas las variables meteorológicas incluidas, incluidas 13 capas de variables en altitud y las variables de superficie, en una única red profunda. Luego realizamos la incrustación de parches para reducir la resolución espacial y combinamos los datos muestreados en un cubo 3D. Los datos 3D se propagan a través de una arquitectura codificador-decodificador derivada del transformador Swin19, una variante de un transformador de visión20, que tiene 16 bloques. La salida se divide en variables de altitud y variables de superficie y se aumenta el muestreo con recuperación de parches para restaurar la resolución original. Para inyectar antecedentes específicos de la Tierra en la red profunda, diseñamos un sesgo posicional específico de la Tierra (un mecanismo para codificar la posición de cada unidad; detallado en Métodos) para reemplazar el sesgo posicional relativo original de Swin. Esta modificación aumenta el número de parámetros de sesgo en un factor de 527, y cada red profunda 3D contiene aproximadamente 64 millones de parámetros. Sin embargo, en comparación con la línea de base, 3DEST tiene el mismo costo computacional y una velocidad de convergencia más rápida.

a, arquitectura 3DEST. Basándonos en el diseño estándar de codificador-decodificador de los transformadores de visión, ajustamos el mecanismo de ventana desplazada19 y aplicamos un sesgo posicional específico de la Tierra. b, Agregación temporal jerárquica. Una vez que se nos dio un plazo de entrega, utilizamos un algoritmo codicioso para realizar pronósticos con la menor cantidad de pasos posible. Usamos FM1, FM3, FM6 y FM24 para indicar los modelos de pronóstico con tiempos de entrega de 1 h, 3 h, 6 h o 24 h, respectivamente. A0 es el estado meteorológico de entrada y \({\hat{{\bf{A}}}}_{t}\) denota el estado meteorológico previsto en el momento t (en horas).

El plazo de entrega de un pronóstico meteorológico de mediano plazo es de 7 días o más. Esto nos llevó a llamar a las redes profundas base (los tiempos de entrega son 1 h, 3 h, 6 h o 24 h) de forma iterativa, utilizando cada resultado pronosticado como entrada del siguiente paso. Para reducir los errores de pronóstico acumulativos, introdujimos la agregación temporal jerárquica, un algoritmo voraz que siempre requiere la red profunda con el mayor tiempo de entrega asequible. Matemáticamente, esto reduce en gran medida el número de iteraciones. Como ejemplo, cuando el tiempo de entrega fuera de 56 h, ejecutaríamos el modelo de pronóstico de 24 horas 2 veces, el modelo de pronóstico de 6 horas 1 vez y el modelo de pronóstico de 1 hora 2 veces (Fig. 1b). En comparación con FourCastNet2, que utiliza un modelo de pronóstico fijo de 6 horas, nuestro método es más rápido y preciso. La limitación de esta estrategia se analiza en Métodos.

Evaluamos Pangu-Weather con los datos ERA518, que se considera la estimación más conocida para la mayoría de las variables atmosféricas21,22. Para comparar de manera justa Pangu-Weather con FourCastNet2, entrenamos nuestras redes profundas 3D con 39 años de datos (de 1979 a 2017), las validamos con datos de 2019 y las probamos con datos de 2018. Estudiamos 69 factores, incluidas 5 variables en altitud en 13 niveles de presión (50 hPa, 100 hPa, 150 hPa, 200 hPa, 250 hPa, 300 hPa, 400 hPa, 500 hPa, 600 hPa, 700 hPa, 850 hPa, 925 hPa y 1.000 hPa) y 4 variables de superficie. Cuando se compara con datos de reanálisis, para cada variable probada, Pangu-Weather produce un RMSE más bajo y un coeficiente de correlación de anomalías (ACC) más alto que el IFS operativo y FourCastNet, los mejores métodos basados ​​en NWP e IA, respectivamente. En particular, con un pronóstico de un solo miembro, Pangu-Weather informa un RMSE de 296,7 para un pronóstico Z500 de 5 días, que es inferior al de IFS operativo y FourCastNet, que informaron 333,7 y 462,5, respectivamente. Además, el costo de inferencia de Pangu-Weather es de 1,4 s en una sola GPU, que es más de 10.000 veces más rápido que el IFS operativo y está a la par con FourCastNet. Pangu-Weather no sólo produce resultados cuantitativos sólidos (por ejemplo, RMSE y ACC), sino que también conserva suficientes detalles para investigar ciertos fenómenos meteorológicos extremos. Para demostrar esta capacidad, estudiamos la importante aplicación del seguimiento de ciclones tropicales. Al encontrar el mínimo local de presión media al nivel del mar (MSLP), una de las variables de la superficie, nuestro algoritmo logró una alta precisión en el seguimiento de 88 ciclones tropicales con nombre en 2018, incluidos algunos (por ejemplo, el tifón Kong-rey y el tifón Yutu) que sigue siendo un desafío para los mejores sistemas de seguimiento del mundo, como ECMWF-HRES (donde HRES significa alta resolución). Nuestra investigación arroja luz sobre los sistemas de pronóstico meteorológico de mediano alcance basados ​​en IA y avanza en el camino hacia el establecimiento de la IA como complemento o sustituto de la PNT, un logro que anteriormente se pensaba que estaba lejano en el futuro17.

Realizamos el pronóstico determinista sobre los estados iniciales imperturbados de ERA5. Luego comparamos Pangu-Weather con los métodos más potentes tanto en PNT como en IA, a saber, el IFS operativo de ECMWF (datos descargados del archivo TIGGE (THORPEX Interactive Grand Global Ensemble)3) y FourCastNet2. La resolución espacial de Pangu-Weather, 0,25° × 0,25°, fue determinada por los datos de entrenamiento, que es comparable al pronóstico de control de ECMWF ENS5 e idéntico a FourCastNet. El espaciado del pronóstico (la unidad mínima de tiempo de pronóstico) de Pangu-Weather es de 1 h, 6 veces menor que el de FourCastNet.

Los resultados generales del pronóstico para 2018 se muestran en la Fig. 2. Para cada variable probada, incluidas las variables en altitud y de superficie, Pangu-Weather informa resultados más precisos que el IFS operativo y FourCastNet (cuando se informa la variable). En términos de RMSE (cuanto más bajo, mejor), Pangu-Weather normalmente informa valores un 10 % más bajos que el IFS operativo y valores un 30 % más bajos que FourCastNet. La ventaja persiste en todos los plazos de entrega (de 1 h a 168 h, es decir, 7 días), y para algunas variables como Z500, la ventaja se vuelve más significativa cuanto mayor es el plazo de entrega. Para estudios cuantitativos en el hemisferio norte, el hemisferio sur y los trópicos, consulte las figuras de datos ampliados. 1–3. Para conocer los resultados previstos para 2020 y 2021 y la comparación con los resultados de 2018, consulte la Figura 4 de datos ampliados.

Se compararon diez variables en términos de RMSE ponderado por latitud (más bajo es mejor) y ACC (más alto es mejor), donde las primeras cinco variables se informaron en FourCastNet y las últimas cinco no. Aquí, Z500, T500, Q500, U500 y V500 indican el geopotencial, la temperatura, la humedad específica y los componentes u y v de la velocidad del viento a 500 hPa, respectivamente. Z850 y T850 indican el geopotencial y la temperatura a 850 hPa, respectivamente. T2M indica la temperatura a 2 m, y U10 y V10 indican el componente u y el componente v de la velocidad del viento a 10 m, respectivamente.

Datos fuente

Para demostrar nuestra ventaja, introdujimos un concepto llamado "ganancia de tiempo de pronóstico", que corresponde a la diferencia promedio entre los tiempos de entrega de Pangu-Weather y los de un competidor cuando informan la misma precisión. Pangu-Weather normalmente muestra una ganancia de tiempo de pronóstico de 10 a 15 h con respecto al IFS operativo, y para algunas variables como la humedad específica, la ganancia es de más de 24 h. Esto implica la dificultad que tienen los métodos convencionales de PNT a la hora de pronosticar variables específicas; sin embargo, los métodos basados ​​en IA se benefician al aprender patrones efectivos a partir de una gran cantidad de datos de entrenamiento. En comparación con FourCastNet, la ganancia de tiempo de pronóstico de Pangu-Weather es de hasta 40 h, lo que muestra la ventaja significativa de nuestro diseño técnico, resultante especialmente de las redes profundas 3D y la estrategia avanzada de agregación temporal. Las ganancias de tiempo de pronóstico de Pangu-Weather en términos de diferentes variables climáticas se resumen en la Tabla de datos ampliados 2.

La Figura 3 muestra una visualización de los resultados del pronóstico de 3 días de Pangu-Weather. Estudiamos dos variables en altitud, Z500 y T850 (temperatura de 850 hPa), y dos variables de superficie, temperatura a 2 m y velocidad del viento a 10 m, y comparamos los resultados con el IFS operativo y la verdad en tierra ERA5. Los resultados tanto de Pangu-Weather como del IFS operativo están suficientemente cerca de la verdad sobre el terreno, aunque existen diferencias visibles entre ellos. Pangu-Weather produjo líneas de contorno más suaves, lo que implica que el modelo tiende a pronosticar valores similares para las regiones vecinas. Es una propiedad general de cualquier algoritmo de regresión (incluidas las redes neuronales profundas) converger en valores promedio. Por el contrario, el pronóstico IFS operativo es menos fluido, porque calcula un único valor estimado en cada celda de la cuadrícula resolviendo un sistema de PDE con condiciones iniciales, mientras que la naturaleza caótica del clima y el conocimiento inevitablemente impreciso de las condiciones iniciales y sub- Los procesos a escala de cuadrícula pueden causar incertidumbres estadísticas en cada pronóstico.

El pronóstico de 3 días de dos variables en altitud (Z500 y T850) y dos variables de superficie (temperatura a 2 m y velocidad del viento a 10 m). Para cada caso, se muestran Pangu-Weather (izquierda), el IFS3 operativo (centro) y la verdad sobre el terreno ERA518 (derecha). Para todos los casos, la hora de entrada son las 00:00 UTC del 1 de septiembre de 2018.

A continuación, utilizamos Pangu-Weather para rastrear ciclones tropicales. Dado un punto de tiempo inicial, establecimos el tiempo de entrega en múltiplos de 6 h (ref. 23) e iniciamos Pangu-Weather para pronosticar estados climáticos futuros. Buscamos el mínimo local de MSLP que cumpliera ciertas condiciones, como el ojo del ciclón. El algoritmo de seguimiento se describe en el material complementario de este artículo. Utilizamos el proyecto International Best Track Archive for Climate Stewardship (IBTrACS)24,25, que contiene las mejores estimaciones disponibles para ciclones tropicales.

Comparamos Pangu-Weather con ECMWF-HRES, un potente método de seguimiento de ciclones basado en pronósticos meteorológicos operativos de alta resolución (9 km × 9 km). Elegimos 88 ciclones tropicales con nombre en 2018 que aparecen tanto en IBTrACS como en ECMWF-HRES. Como se muestra en la Fig. 4, Pangu-Weather produjo estadísticamente resultados de seguimiento más precisos que ECMWF-HRES para estos ciclones. Los errores de posición directa medios de 3 y 5 días para los ojos de los ciclones se informaron en 120,29 km y 195,65 km para Pangu-Weather, que son menores que 162,28 km y 272,10 km para ECMWF-HRES, respectivamente. Los desgloses de los errores de seguimiento con respecto a regiones e intensidades se proporcionan en la figura 5 de datos ampliados. La ventaja de Pangu-Weather se vuelve más significativa a medida que aumenta el tiempo de entrega. También mostramos los resultados del seguimiento de los dos ciclones más fuertes del Pacífico occidental, Kong-rey y Yutu, en la Fig. 4. Consulte el material complementario para obtener un análisis detallado.

a,b, Resultados de seguimiento de dos ciclones tropicales fuertes en 2018, es decir, el tifón Kong-rey (2018–25) y Yutu (2018–26). El punto de tiempo inicial se muestra debajo de cada panel. El intervalo de tiempo entre puntos vecinos es de 6 h. Pangu-Weather pronostica la trayectoria correcta de Yutu (es decir, se dirige a Filipinas) a las 12:00 UTC del 23 de octubre de 2018, mientras que ECMWF-HRES obtiene la misma conclusión 2 días después, antes de lo cual predice que Yutu hará un gran giro hacia el noreste. c, Una comparación entre Pangu-Weather y ECMWF-HRES en términos de error medio de posición directa de 88 ciclones en 2018. Cada número entre paréntesis en el eje x indica el número de muestras utilizadas para calcular el promedio. Por ejemplo, '(788)' significa que hay un total de 788 puntos iniciales desde los cuales el tifón dura al menos 24 horas, y los 788 errores de posición directa de Pangu-Weather y ECMWF-HRES se promediaron en los resultados finales. Los paneles a y b se trazaron utilizando el kit de herramientas Matplotlib Basemap.

Datos fuente

A pesar de los resultados de seguimiento prometedores, señalamos que la comparación directa entre Pangu-Weather y ECMWF-HRES es algo injusta, porque ECMWF-HRES utilizó los datos de condición inicial de IFS como entrada, mientras que Pangu-Weather utilizó datos de reanálisis.

Como método basado en IA, Pangu-Weather es más de 10.000 veces más rápido que el IFS operativo. Esto ofrece una oportunidad para realizar pronósticos de conjuntos de miembros grandes con pequeños costos computacionales. Investigamos FourCastNet2 para estudiar un método de conjunto preliminar que agrega perturbaciones a los estados climáticos iniciales. Luego generamos 99 perturbaciones aleatorias (detalladas en Métodos) y las agregamos al estado inicial imperturbado. Por lo tanto, obtuvimos un pronóstico de conjunto de 100 miembros simplemente promediando los resultados del pronóstico. Como se muestra en la Fig. 5, para cada variable, la media del conjunto es ligeramente peor que el método de un solo miembro en los pronósticos meteorológicos a corto plazo (por ejemplo, 1 día), pero significativamente mejor cuando el tiempo de anticipación es de 5 a 7 días. . Esto se alinea con FourCastNet2, lo que indica que los pronósticos de conjuntos de miembros grandes son especialmente útiles cuando la precisión de un solo modelo es menor, pero presentan el riesgo de introducir ruido inesperado en los pronósticos de corto plazo. El pronóstico conjunto presenta más beneficios para variables no uniformes como Q500 (humedad específica de 500 hPa) y U10 (componente u de 10 m de la velocidad del viento). Además, la relación dispersión-habilidad de Pangu-Weather es menor que 1, lo que indica que el método de conjunto actual es algo poco dispersivo. En comparación con los métodos NWP, Pangu-Weather reduce en gran medida el costo de la predicción por conjuntos, lo que permite a los meteorólogos aplicar su experiencia para controlar el ruido y mejorar la precisión de la predicción por conjuntos.

El RMSE del pronóstico medio conjunto (cuanto más bajo, mejor) para tres variables en altitud (Z500, Q500 y U500) y dos variables de superficie (T2M y U10). También seguimos un trabajo reciente35 para trazar dos métricas, el CRPS (cuanto más bajo, mejor) y la proporción de habilidades extendidas (un modelo de conjunto ideal produce proporciones de habilidades extendidas de 1,0, que se muestran como líneas discontinuas), que demuestran aún más las propiedades de nuestros resultados de pronóstico conjunto. Aquí, Z500, Q500 y U500 indican el geopotencial, la temperatura y el componente u de la velocidad del viento a 500 hPa, respectivamente. T2M indica la temperatura a 2 m y U10 indica el componente u de la velocidad del viento a 10 m.

Datos fuente

En este artículo, presentamos Pangu-Weather, un sistema basado en inteligencia artificial que entrena redes profundas para un pronóstico meteorológico numérico rápido y preciso. Las principales contribuciones técnicas incluyen el diseño de la arquitectura 3DEST y la aplicación de la estrategia de agregación temporal jerárquica para pronósticos de mediano plazo. Al entrenar los modelos con 39 años de datos meteorológicos globales, Pangu-Weather produce mejores resultados de pronóstico determinista sobre datos de reanálisis que el mejor sistema de PNT del mundo, el IFS operativo del ECMWF, y al mismo tiempo es mucho más rápido. Además, Pangu-Weather es excelente para pronosticar eventos climáticos extremos y realizar pronósticos meteorológicos conjuntos. Pangu-Weather revela el potencial de utilizar grandes modelos previamente entrenados para diversas aplicaciones posteriores, mostrando la misma tendencia que otros ámbitos de la IA, como la visión por computadora26,27, el procesamiento del lenguaje natural28,29, la comprensión intermodal30 y más.

A pesar de la prometedora precisión del pronóstico de los datos del reanálisis, nuestro algoritmo tiene algunas limitaciones. En primer lugar, a lo largo de este documento, Pangu-Weather fue entrenado y probado con datos de reanálisis, pero los sistemas de pronóstico del mundo real funcionan con datos de observación. Existen diferencias entre estas fuentes de datos; por lo tanto, es necesario investigar más a fondo el rendimiento de Pangu-Weather en todas las aplicaciones. En segundo lugar, en este artículo no se investigaron algunas variables climáticas, como la precipitación. La omisión de estos factores puede hacer que el modelo actual carezca de algunas capacidades, por ejemplo, hacer uso de datos de precipitación para la predicción precisa de fenómenos meteorológicos extremos a pequeña escala, como los brotes de tornados31,32. En tercer lugar, los métodos basados ​​en IA producen resultados de pronóstico más fluidos, lo que aumenta el riesgo de subestimar la magnitud de los fenómenos meteorológicos extremos. Estudiamos un caso especial, el seguimiento de ciclones, pero queda mucho más trabajo por hacer. En cuarto lugar, se puede introducir inconsistencia temporal mediante el uso de modelos con diferentes plazos de entrega. Este es un tema desafiante que merece una mayor investigación.

De cara al futuro, hay margen de mejora tanto para los métodos basados ​​en IA como para los métodos de PNT. En el lado de la IA, se pueden encontrar mayores beneficios incorporando más niveles verticales y/o variables atmosféricas, integrando la dimensión temporal y entrenando redes profundas de cuatro dimensiones33,34, utilizando redes más profundas y/o más amplias, o simplemente aumentando el número de entrenamientos. épocas. Todas estas direcciones requieren clústeres de GPU más potentes con memorias más grandes y FLOPS (operaciones de punto flotante por segundo) más altos, que es la tendencia actual de la comunidad de IA. En lo que respecta a la PNT, se pueden desarrollar métodos de posprocesamiento para aliviar los sesgos predecibles de los modelos de PNT. Esperamos que en el futuro se combinen los métodos basados ​​en IA y NWP para lograr un rendimiento aún mayor.

Denotamos todas las variables climáticas globales estudiadas en el momento t como At. Esta es una matriz 3D de tamaño Nlat × Nlon × 69, donde Nlat = 1,440 y Nlon = 721 son la resolución espacial a lo largo de los ejes de longitud y latitud, respectivamente, y 69 es el número de variables estudiadas. En otras palabras, cada píxel horizontal ocupa 0,25° × 0,25° en la superficie de la Tierra. El problema matemático es que dado el punto de tiempo de pronóstico t0, supongamos que At para todos los t ≤ t0 están disponibles, se le pide al algoritmo que prediga \({{\bf{A}}}_{{t}_{0}+ \Delta t}\) donde Δt se llama tiempo de entrega. Debido a la limitación de la memoria de la GPU, en nuestro trabajo, el algoritmo de pronóstico solo usó \({{\bf{A}}}_{{t}_{0}}\) como entrada y predijo \({{\bf {A}}}_{{t}_{0}+\Delta t}\) como salida. Para este propósito, entrenamos una red neuronal profunda, \(f({{\bf{A}}}_{{t}_{0}}\,;{\boldsymbol{\theta }})\), donde θ denota los parámetros que se pueden aprender.

Cuando la versión predicha de At está disponible (t = t0 + Δt), denotada como \({\hat{{\bf{A}}}}_{t}\), calculamos dos métricas, RMSE y ACC, definidas como sigue:

Aquí, v es cualquier variable meteorológica, \({{\bf{A}}}_{i,j,t}^{v}\) es un escalar que representa el valor de v en el tiempo t y la coordenada horizontal (i, j). \(L\left(i\right)={N}_{{\rm{lat}}}\times \frac{{\rm{\cos }}{\phi }_{i}}{{\sum }_{{i\text{'}}=1}^{{N}_{{\rm{lat}}}}{\rm{\cos }}{\phi }_{{i\text{' }}}}\) es el peso en la latitud ϕi. A′ denota la diferencia entre A y la climatología, es decir, la media a largo plazo de los estados meteorológicos que se estiman a partir de los datos de entrenamiento durante 39 años. Los valores RMSE y ACC se promediaron en todos los tiempos y coordenadas horizontales para producir los números promedio para la variable v y el tiempo de entrega Δt. Las métricas RMSE y ACC también se pueden evaluar para regiones específicas, por ejemplo, en el hemisferio norte, el hemisferio sur y los trópicos. Consulte la Fig. 2 y las Figs. de datos ampliados. 1 a 3 para los resultados generales y desglosados ​​de 2018.

Seguimos un trabajo reciente35 para calcular dos métricas para el pronóstico meteorológico conjunto, a saber, la puntuación de probabilidad clasificada continua (CRPS) y la relación de habilidad extendida (SSR). Matemáticamente, CRPS se define como

donde F(·) denota la función de distribución acumulativa de la distribución del pronóstico y \({\mathbb{I}}\)(·) es una función indicadora que toma un valor de 1 si la afirmación es verdadera y 0 en caso contrario. Seguimos el artículo original y utilizamos el paquete Python xskillscore para calcular el CRPS. SSR se obtiene dividiendo el 'spread' por RMSE siendo el spread

Aquí, var(·) indica la varianza en la dimensión del conjunto. Los valores de diferencial y RMSE promediados de todos los pronósticos se utilizan para calcular el SSR. Si un conjunto es perfectamente confiable, debería reportar un SSR de 1,0.

El conjunto de datos ERA518 contiene datos globales de reanálisis por hora de los últimos 60 años. Los datos de observación y la predicción de modelos numéricos se combinan en datos de reanálisis utilizando métodos de asimilación numérica, proporcionando un punto de referencia de alta calidad para el pronóstico del tiempo global. Utilizamos los datos de reanálisis de cada hora para que el algoritmo pueda realizar pronósticos meteorológicos cada hora. Mantuvimos la resolución espacial más alta disponible en ERA5, 0,25° × 0,25° en la esfera de la Tierra, lo que resultó en una resolución de entrada de 1440 × 721: la dimensión de latitud tiene una entrada adicional porque las posiciones más al norte y más al sur no se superponen.

Seguimos WeatherBench13 para elegir 13 de 37 niveles de presión (50 hPa, 100 hPa, 150 hPa, 200 hPa, 250 hPa, 300 hPa, 400 hPa, 500 hPa, 600 hPa, 700 hPa, 850 hPa, 925 hPa y 1000 hPa). ) y el nivel de la superficie. Para realizar una comparación justa con la versión en línea del pronóstico de control del ECMWF, elegimos pronosticar los factores publicados en el conjunto de datos TIGGE3, a saber, cinco variables en altitud (geopotencial, humedad específica, temperatura y los componentes u y v de velocidad del viento) y cuatro variables de superficie (temperatura a 2 m, componente u y componente v de la velocidad del viento a 10 m, y MSLP). Para obtener una lista completa de las variables estudiadas y las abreviaturas correspondientes, consulte la Tabla de datos ampliados 1. Además, se agregaron tres máscaras constantes (la máscara topográfica, la máscara tierra-mar y la máscara de tipo de suelo) a la entrada de variables de superficie.

Cuando nos preparamos para los datos de prueba en 2018, excluimos los puntos de prueba el 1 de enero de 2018 debido a la superposición con los datos de entrenamiento. Además, todos los puntos de prueba en diciembre de 2018 no están disponibles para las variables en altitud debido a un error del servidor del ECMWF. FourCastNet también excluyó estos datos de la fase de prueba.

Hay dos fuentes de datos de entrada y salida, a saber, variables en altitud y variables de superficie. El primero involucra 13 niveles de presión, cada uno de los cuales tiene 5 variables, y juntos forman un volumen de 13 × 1,440 × 721 × 5. Este último contiene un volumen de 1.440×721×4. Estos parámetros se incrustaron primero desde el espacio original en un espacio latente de dimensión C. Utilizamos una técnica común llamada incrustación de parches para reducir la dimensionalidad. Para la parte en altitud, el tamaño del parche es 2 × 4 × 4, por lo que los datos incrustados tienen una forma de 7 × 360 × 181 × C. Para las variables de superficie, el tamaño del parche es 4 × 4, por lo que los datos incrustados tienen una forma de 360 ​​× 181 × C, donde C es el ancho del canal base y se estableció en 192 en nuestro trabajo. Luego, estos dos volúmenes de datos se concatenaron a lo largo de la primera dimensión para producir un volumen de 8 × 360 × 181 × C. Luego, el volumen se propagó a través de una arquitectura de codificador-decodificador estándar con 8 capas de codificador y 8 capas de decodificador. La salida del decodificador sigue siendo un volumen de 8 × 360 × 181 × C, que se proyectó nuevamente al espacio original con recuperación de parche, produciendo la salida deseada. A continuación, describimos los detalles técnicos de cada componente.

Seguimos el transformador de visión estándar para usar una capa lineal con activación GELU (Unidad lineal de error gaussiano) para la incrustación de parches. En nuestra implementación, un parche tiene 2 × 4 × 4 píxeles para variables en altitud y 4 × 4 para variables de superficie. El paso de las ventanas deslizantes es el mismo que el tamaño del parche, y se agregó el relleno de valor cero necesario cuando el tamaño de los datos es indivisible por el tamaño del parche. El número de parámetros para la inclusión de parches es (4 × 4 × 2 × 5) × C para variables en altitud y (4 × 4 × 4) × C para variables de superficie. La recuperación de parches realiza la operación opuesta: tiene la misma cantidad de parámetros, pero estos parámetros no se comparten con la incrustación de parches.

El tamaño de los datos permanece sin cambios en 8 × 360 × 181 × C para las primeras 2 capas del codificador, mientras que para las siguientes 6 capas, las dimensiones horizontales se redujeron en un factor de 2 y el número de canales se duplicó, lo que resultó en un tamaño de datos de 8×180×91×2C. La parte decodificadora es simétrica a la parte codificadora, teniendo las primeras 6 capas de decodificador un tamaño de 8 × 180 × 91 × 2C y las 2 capas siguientes teniendo un tamaño de 8 × 360 × 181 × C. Las salidas del segundo codificador La capa y la séptima capa decodificadora se concatenaron a lo largo de la dimensión del canal. Seguimos la implementación de transformadores Swin19 para conectar las capas adyacentes de diferentes resoluciones con operaciones de muestreo ascendente y descendente. Para reducir el muestreo, fusionamos cuatro tokens en uno (la dimensionalidad de la característica aumenta de C a 4C) y realizamos una capa lineal para reducir la dimensionalidad a 2C. Para el muestreo ascendente se realizaron las operaciones inversas.

Cada capa de codificador y decodificador es un bloque 3DEST. Es similar al bloque transformador de visión estándar20 pero está diseñado específicamente para alinearse con la geometría de la Tierra. Utilizamos el mecanismo de autoatención estándar de los transformadores de visión. Para reducir aún más los costos computacionales, heredamos el mecanismo de atención de ventanas19 para dividir los mapas de características en ventanas, cada una de las cuales contiene como máximo 2 × 12 × 6 tokens. El mecanismo de ventana desplazada19 se aplicó de modo que para cada capa, la partición de la cuadrícula difiera de la anterior en la mitad del tamaño de la ventana. Como las coordenadas en la dirección de longitud son periódicas, las medias ventanas en los bordes izquierdo y derecho se fusionan en una ventana completa. La operación de fusión no se realizó en la dirección de latitud porque no es periódica. Remitimos al lector a los artículos originales19,20 para obtener más detalles sobre los transformadores de visión.

Swin Transformer19 utilizó un sesgo posicional relativo para representar el componente invariante de traducción de las atenciones, donde el sesgo se calculó sobre la coordenada relativa de cada ventana. Sin embargo, para el pronóstico del tiempo global, la situación es un poco diferente: cada ficha corresponde a una posición absoluta en el sistema de coordenadas de la Tierra; Como el mapa es una proyección de la esfera terrestre, el espacio entre fichas vecinas puede ser diferente. Más importante aún, algunos estados meteorológicos están estrechamente relacionados con la posición absoluta. En la figura 6 de datos ampliados se muestran ejemplos de geopotencial, velocidad del viento y temperatura. Para capturar estas propiedades, introdujimos un sesgo posicional específico de la Tierra, que funciona agregando un sesgo posicional a cada token en función de su valor absoluto (en lugar de relativo). coordinar.

Matemáticamente, supongamos que todo el mapa de características sea un volumen con una resolución espacial de Npl × Nlon × Nlat, donde Npl, Nlon y Nlat indican el tamaño a lo largo de los ejes de niveles de presión, longitud y latitud, respectivamente. El volumen de datos se dividió en ventanas Mpl × Mlon × Mlat, y cada ventana tiene un tamaño de Wpl × Wlon × Wlat. La matriz de sesgo posicional específica de la Tierra contiene submatrices Mpl × Mlat (Mlon no aparece aquí porque diferentes longitudes comparten el mismo sesgo: los índices de longitud son cíclicos y el espaciado se distribuye uniformemente a lo largo de este eje), cada una de las cuales tiene \({W} _{{\rm{pl}}}^{2}\times {\left(2{W}_{{\rm{lon}}}-1\right)\times W}_{{\rm{lat }}}^{2}\) parámetros que se pueden aprender. Cuando la atención se calculó entre dos unidades dentro de la misma ventana, utilizamos los índices del nivel de presión y la latitud, (mpl, mlat), para ubicar la submatriz de sesgo correspondiente. Luego, usamos las coordenadas dentro de la ventana, \(\left({h}_{1}^{{\prime} },{\lambda }_{1}^{{\prime} },{\phi } _{1}^{{\prime} }\right)\) y \(\left({h}_{2}^{{\prime} },{\lambda }_{2}^{{\prime } },{\phi }_{2}^{{\prime} }\right)\), para buscar el valor de sesgo en \(\left({h}_{1}^{{\prime} } \,+\,{h}_{2}^{{\prime} }\times {W}_{{\rm{pl}}},{\lambda }_{1}^{{\prime} } -{\lambda }_{2}^{{\prime} }\,+\,{W}_{{\rm{lon}}}-1,{\phi }_{1}^{{\prime } }\,+\,{\phi }_{2}^{{\prime} }\,\times \,{W}_{{\rm{lat}}}\right)\) del (mpl , mlat)ésima submatriz.

Discutimos brevemente otras opciones de diseño. Debido a la gran sobrecarga de entrenamiento, no realizamos estudios exhaustivos sobre los hiperparámetros y creemos que existen configuraciones o hiperparámetros que conducen a una mayor precisión. Primero, utilizamos 8 (2 + 6) capas de codificador y decodificador, lo cual es significativamente menos que el transformador Swin estándar19. Esto es para reducir la complejidad tanto del tiempo como de la memoria. Si uno tiene un clúster más potente con mayor memoria de GPU, aumentar la profundidad de la red puede brindar una mayor precisión. En segundo lugar, es posible reducir el número de parámetros utilizados en el sesgo posicional específico de la Tierra compartiendo parámetros u otras técnicas. Sin embargo, no lo consideramos una cuestión clave, porque es poco probable que se implemente el modelo de pronóstico del tiempo en dispositivos periféricos con almacenamiento limitado. En tercer lugar, es posible y prometedor introducir los estados meteorológicos de más índices de tiempo en el modelo, lo que cambia todos los tensores de tres dimensiones a cuatro dimensiones. Aunque la comunidad de IA ha demostrado la eficacia de las redes profundas de cuatro dimensiones33,34, el limitado presupuesto computacional disponible nos impidió explorar este método.

Los cuatro modelos individuales fueron entrenados durante 100 épocas utilizando el optimizador Adam. Utilizamos la pérdida de error absoluto medio. La normalización se realizó en cada campo de entrada bidimensional (por ejemplo, Z500) por separado. Funcionó restando el valor medio del campo bidimensional y luego dividiéndolo por la desviación estándar. La media y la desviación estándar de cada variable se calcularon a partir de los datos meteorológicos de 1979 a 2017. La ponderación de cada variable fue inversamente proporcional al valor de pérdida promedio calculado en una ejecución inicial, que fue diseñada para facilitar la equivalencia de las contribuciones de estas variables. . Específicamente, las ponderaciones para las variables en altitud fueron 3,00, 0,60, 1,50, 0,77 y 0,54 para Z, Q, T, U y V, respectivamente, y las ponderaciones para las variables de superficie fueron 1,50, 0,77, 0,66 y 3,00 para MSLP, U10. , V10 y T2M, respectivamente. Agregamos una ponderación de 1,0 a la pérdida de error medio absoluto de las variables en altitud y 0,25 a la de las variables de superficie, y sumamos las dos pérdidas. Usamos un tamaño de lote de 192 (es decir, 1 muestra de entrenamiento por GPU). La tasa de aprendizaje comenzó con 0,0005 y gradualmente se recoció hasta 0 siguiendo el programa del coseno. Todos los puntos temporales de inicio en el subconjunto de entrenamiento (1979-2017) se permutaron aleatoriamente en cada época para aliviar el sobreajuste. Se adoptó una caída de peso de 3 × 10−6 y ScheduledDropPath36 con una relación de caída de 0,2 para aliviar el sobreajuste. Descubrimos que todos los modelos aún no han llegado a una convergencia total al final de 100 épocas, por lo que esperamos que ampliar el procedimiento de entrenamiento pueda mejorar la precisión del pronóstico. Representamos gráficamente la precisión de algunas variables probadas con respecto a diferentes tiempos de entrega (1 h, 3 h, 6 h y 24 h) en la Fig. 7 de datos ampliados.

La velocidad de inferencia de Pangu-Weather es comparable a la de FourCastNet2. En una comparación a nivel de sistema, FourCastNet requiere 0,28 s para inferir un pronóstico de 24 horas en una GPU Tesla-A100 (312 teraFLOPS), mientras que Pangu-Weather necesita 1,4 s en una GPU Tesla-V100 (120 teraFLOPS). Teniendo en cuenta el rendimiento de la GPU, Pangu-Weather es aproximadamente un 50% más lento que FourCastNet. Pangu-Weather es más de 10.000 veces más rápido que el IFS operativo, que requiere varias horas en una supercomputadora con cientos de nodos.

Seguimos un trabajo anterior37 para comparar los valores de los cuantiles de nivel superior calculados sobre el resultado del pronóstico y la verdad sobre el terreno. Matemáticamente, establecemos D = 50 percentiles, denotados como q1, q2, ..., qD. Seguimos FourCastNet2 para establecer q1 = 90% y qD = 99,99%, y los valores del percentil intermedio se distribuyeron linealmente entre q1 y qD en la escala logarítmica. Luego, los cuantiles correspondientes, denotados como Q1, Q2, ..., QD, se calcularon individualmente para cada par de variable climática y tiempo de anticipación. Por ejemplo, para todos los pronósticos de 3 días de la variable U10, se recopilaron valores de píxeles de todos los fotogramas para realizar estadísticas. Seguimos FourCastNet2 para trazar los percentiles extremos con respecto al tiempo de entrega en la figura 7 de datos extendidos.

Finalmente, se calculó el error cuantil relativo (RQE) para medir la diferencia general entre la verdad del terreno y cualquier algoritmo de pronóstico del tiempo:

donde Qd y \({\hat{Q}}_{d}\) son el désimo cuantil calculado sobre la verdad fundamental de ERA5 y el algoritmo de pronóstico que se está investigando. RQE puede medir la tendencia general, donde RQE < 0 y RQE > 0 implican que el algoritmo de pronóstico tiende a subestimar y sobreestimar la intensidad de los extremos, respectivamente. Descubrimos que tanto Pangu-Weather como el IFS operativo tienden a subestimar los extremos. Pangu-Weather sufre una subestimación mayor a medida que aumenta el tiempo de entrega. Cabe señalar que RQE y los valores de cuantiles individuales tienen limitaciones: no evalúan si los valores extremos ocurren en el lugar y momento correctos, sino que solo observan la distribución de valores. La capacidad de Pangu-Weather para capturar eventos extremos individuales se validó aún más con experimentos de seguimiento de ciclones tropicales.

Seguimos un algoritmo clásico38 que localiza el mínimo local de MSLP para rastrear el ojo de los ciclones tropicales. Dado el punto de tiempo de inicio y la posición inicial correspondiente del ojo de un ciclón, solicitamos iterativamente el algoritmo de pronóstico de 6 horas y buscamos un mínimo local de MSLP que satisfaga las siguientes condiciones:

Hay un máximo de vorticidad relativa de 850 hPa mayor que 5 × 10−5 dentro de un radio de 278 km para el hemisferio norte, o un mínimo menor que −5 × 10−5 para el hemisferio sur.

Hay un espesor máximo entre 850 hPa y 200 hPa en un radio de 278 km cuando el ciclón es extratropical.

La velocidad máxima del viento a 10 m es mayor que 8 m s-1 en un radio de 278 km cuando el ciclón está en tierra.

Una vez localizado el ojo del ciclón, el algoritmo de seguimiento continuó buscando la siguiente posición en unas proximidades de 445 km. El algoritmo de seguimiento finaliza cuando no se encuentra ningún mínimo local de MSLP que satisfaga las condiciones anteriores. Consulte la figura 8 de datos ampliados para ver dos ejemplos de seguimiento.

Ampliamos la Fig. 4c trazando los errores medios de posición directa con respecto a diferentes cuencas o diferentes intensidades en la Fig. 5 de datos extendidos. En cada subconjunto, Pangu-Weather informa errores más bajos y la ventaja se vuelve más significativa con un mayor tiempo de entrega, alineando con las conclusiones que sacamos de todo el conjunto de datos. Nuevamente, enfatizamos que la comparación con ECMWF-HRES es algo injusta, porque ECMWF-HRES usó datos de condición inicial de IFS, mientras que Pangu-Weather usó datos de reanálisis.

A continuación se muestra un análisis más detallado de cuatro ciclones tropicales. La ventaja de Pangu-Weather reside principalmente en el seguimiento de las trayectorias de los ciclones en las primeras etapas.

El tifón Kong-rey (2018-25) es uno de los ciclones tropicales más poderosos del mundo en 2018. Como se muestra en la figura 4, ECMWF-HRES pronostica que Kong-rey aterrizaría en China, pero en realidad no fue así. Pangu-Weather, en cambio, produce resultados de seguimiento precisos que casi coinciden con la verdad sobre el terreno. Además, la Fig. 8 de datos ampliados muestra los resultados de seguimiento de Pangu-Weather y ECMWF-HRES en diferentes puntos temporales: el resultado del pronóstico de Pangu-Weather apenas cambia con el tiempo, y ECMWF-HRES llega a la conclusión de que Kong-rey no aterrizó en China más de 48 h después que Pangu-Weather.

El tifón Yutu (2018-26) es un ciclón tropical extremadamente poderoso que causó una destrucción catastrófica en las Islas Marianas y Filipinas. Se empata con Kong-rey como el ciclón tropical más poderoso del mundo en 2018. Como se muestra en la Fig. 4, Pangu-Weather hace el resultado de pronóstico correcto (Yutu va a Filipinas) tan pronto como 6 días antes de aterrizar, mientras que ECMWF-HRES Predice incorrectamente que Yutu dará un gran giro hacia el noreste en la etapa inicial. ECMWF-HRES produce los resultados de seguimiento correctos más de 48 h más tarde que Pangu-Weather.

El huracán Michael (2018-13) es el huracán más fuerte de la temporada de huracanes del Atlántico de 2018. Como se muestra en la figura 8 de datos ampliados, con una hora de inicio que es más de 3 días antes del aterrizaje, tanto Pangu-Weather como ECMWF-HRES pronosticaron el aterrizaje en Florida. Sin embargo, el retraso en la hora de aterrizaje prevista es de sólo 3 h para Pangu-Weather, mientras que es de 18 h para ECMWF-HRES. Además, Pangu-Weather muestra grandes ventajas en el seguimiento de Michael después de su aterrizaje, mientras que el seguimiento de ECMWF-HRES es más corto y obviamente se desplaza hacia el este.

El tifón Ma-on (2022-09) es una tormenta tropical severa que afectó a Filipinas y China. Como se muestra en la Fig. 8 de datos ampliados, cuando el punto de tiempo de inicio es aproximadamente 3 días antes del aterrizaje, ECMWF-HRES produce un resultado de pronóstico incorrecto de que Ma-on aterrizaría en Zhuhai, China, mientras que el resultado de pronóstico de Pangu-Weather está cerca de la verdad.

Los mejores resultados de seguimiento de Pangu-Weather se heredan principalmente de la exactitud del pronóstico determinista en los datos de reanálisis. En la figura 8 de datos ampliados, mostramos cómo Pangu-Weather rastrea el huracán Michael y el tifón Ma-on siguiendo el algoritmo de seguimiento especificado. Entre las cuatro variables, el MSLP y la velocidad del viento a 10 m fueron producidos directamente por un pronóstico determinista, y el espesor y la vorticidad se derivaron del geopotencial y la velocidad del viento. Esto indica que Pangu-Weather puede producir resultados intermedios que respalden el seguimiento de ciclones, lo que ayuda aún más a los meteorólogos a comprender y explotar los resultados del seguimiento.

Cada perturbación generada para el pronóstico meteorológico conjunto contiene 3 octavas de ruido Perlin, con escalas de 0,2, 0,1 y 0,05, y el número de períodos a generar a lo largo de cada eje (la longitud o la latitud) es 12, 24 y 48, respectivamente. Usamos el código proporcionado en un repositorio de GitHub (https://github.com/pvigier/perlin-numpy) y modificamos el código para acelerar. Agregamos una sección al pseudocódigo.

Existen principalmente dos líneas de investigación para la predicción del tiempo. A lo largo de este artículo, hemos estado utilizando métodos 'PNT convencionales' o simplemente 'PNT' para referirnos a los métodos de simulación numérica, y utilizamos métodos 'basados ​​en IA' para especificar sistemas de pronóstico basados ​​en datos. Entendemos que, verbalmente, los métodos basados ​​en IA también pertenecen a la PNT, pero seguimos la convención17 para utilizar estas terminologías.

Los métodos de PNT a menudo dividen los estados atmosféricos en cuadrículas discretizadas, utilizan PDE para describir la transición entre ellos1,39,40 y resuelven los PDE mediante simulaciones numéricas. El espaciado de las cuadrículas es clave para la precisión de los pronósticos, pero está limitado por el presupuesto computacional y, por lo tanto, la resolución espacial de los pronósticos meteorológicos suele ser limitada. La parametrización41 es un método eficaz para capturar procesos no resueltos. Los métodos de PNT se han aplicado ampliamente, pero se ven afectados por el aumento superlineal de la sobrecarga computacional1,42 y, a menudo, es difícil realizar una paralelización eficiente para ellos43. La gran sobrecarga computacional de la PNT también restringe el número de miembros del conjunto, debilitando así la diversidad y precisión de los pronósticos meteorológicos probabilísticos.

Los métodos basados ​​en IA ofrecen una vía complementaria para la previsión meteorológica. La tecnología de vanguardia de la IA reside en el aprendizaje profundo10, que supone que la compleja relación entre los datos de entrada y salida se puede aprender a partir de abundantes datos de entrenamiento sin conocer el procedimiento físico o las fórmulas reales. En el ámbito de la predicción meteorológica, los métodos basados ​​en IA se aplicaron por primera vez a los problemas de predicción de precipitaciones basados ​​en datos de radar44,45,46,47 o datos satelitales48,49, donde se sustituyeron los métodos tradicionales que están muy influenciados por las condiciones iniciales. mediante métodos basados ​​en el aprendizaje profundo. La poderosa capacidad expresiva de las redes neuronales profundas condujo al éxito en estos problemas, lo que animó aún más a los investigadores a profundizar en la predicción meteorológica a medio plazo2,11,12,13,14,15,16 como un complemento o sustituto más rápido de los métodos de PNT. Los métodos de aprendizaje profundo de última generación se basan principalmente en modelos grandes (es decir, con una gran cantidad de parámetros que se pueden aprender) para aprender patrones complejos a partir de los datos de entrenamiento.

Pangu es un ser primordial y figura de la creación en la mitología china que separó el cielo y la tierra y se convirtió en accidentes geográficos como montañas y ríos (ver https://en.wikipedia.org/wiki/Pangu). Pangu también es una serie de modelos de IA previamente entrenados desarrollados por Huawei Cloud que cubren visión por computadora, procesamiento del lenguaje natural, comprensión multimodal, informática científica (incluido el pronóstico del tiempo), etc.

Para entrenar y probar Pangu-Weather, descargamos un subconjunto del conjunto de datos ERA5 (alrededor de 60 TB) de https://cds.climate.copernicus.eu/, el sitio web oficial de Copernicus Climate Data (CDS). Para comparar con el IFS operativo, descargamos los datos de pronóstico y los resultados del seguimiento de ciclones tropicales del ECMWF de https://confluence.ecmwf.int/display/TIGGE, el sitio web oficial del archivo TIGGE. Descargamos las rutas reales de los ciclones tropicales del proyecto International Best Track Archive for Climate Stewardship (IBTrACS), https://www.ncei.noaa.gov/products/international-best-track-archive. Todos estos datos están disponibles públicamente para fines de investigación. Los datos originales se proporcionan con este documento.

La base del código de Pangu-Weather se estableció en PyTorch, una biblioteca basada en Python para aprendizaje profundo. Para construir y optimizar las redes troncales, utilizamos el código base de Swin Transformer, disponible en https://github.com/microsoft/Swin-Transformer. Otros detalles, incluidas arquitecturas de red, módulos, trucos de optimización e hiperparámetros, están disponibles en el documento y en el pseudocódigo. El cálculo de la métrica CRPS se basó en el paquete Python xskillscore, https://github.com/xarray-contrib/xskillscore/. La implementación del ruido Perlin se heredó de un repositorio de GitHub, https://github.com/pvigier/perlin-numpy. También utilizamos otras bibliotecas de Python, como NumPy y Matplotlib, en el proyecto de investigación. Publicamos los modelos entrenados, el código de inferencia y el pseudocódigo de detalles al público en un repositorio de GitHub: https://github.com/198808xc/Pangu-Weather (https://doi.org/10.5281/zenodo.7678849). Los modelos entrenados permiten a los investigadores explorar la capacidad de Pangu-Weather en los campos iniciales de ERA5 o en los campos iniciales de ECMWF, donde este último es más práctico ya que puede usarse como API para el pronóstico del tiempo casi en tiempo real.

Bauer, P., Thorpe, A. y Brunet, G. La revolución silenciosa de la predicción numérica del tiempo. Naturaleza 525, 47–55 (2015).

Artículo ADS CAS PubMed Google Scholar

Pathak, J. y col. FourCastNet: un modelo meteorológico global de alta resolución basado en datos que utiliza operadores neuronales adaptativos de Fourier. Preimpresión en https://arxiv.org/abs/2202.11214 (2022).

Bougeault, P. y col. El gran conjunto global interactivo THORPEX. Toro. Soy. Meteorol. Soc. 91, 1059-1072 (2010).

ADS del artículo Google Scholar

Skamarock, WC y cols. Una descripción de la versión 2 del WRF de investigación avanzada (División de Meteorología de mesoescala y microescala del Centro Nacional de Investigación Atmosférica, 2005).

Molteni, F., Buizza, R., Palmer, TN y Petroliagis, T. El sistema de predicción por conjuntos del ECMWF: metodología y validación. Meteorol QJR. Soc. 122, 73-119 (1996).

ADS del artículo Google Scholar

Ritchie, H. y col. Implementación del método semi-Lagrangiano en una versión de alta resolución del modelo de pronóstico del ECMWF. Lun. Tiempo Rev. 123, 489–514 (1995).

2.0.CO;2" data-track-action="article reference" href="https://doi.org/10.1175%2F1520-0493%281995%29123%3C0489%3AIOTSLM%3E2.0.CO%3B2" aria-label="Article reference 6" data-doi="10.1175/1520-0493(1995)1232.0.CO;2">ADS del artículo Google Scholar

Bauer, P. y col. El Programa de Escalabilidad del ECMWF: Progresos y Planes (Centro Europeo de Pronósticos Meteorológicos a Plazo Medio, 2020).

Allen, MR, Kettleborough, JA y Stainforth, DA Error del modelo en el pronóstico del tiempo y el clima. En Seminario sobre previsibilidad del tiempo y el clima del ECMWF 279–304 (Centro Europeo de Pronósticos Meteorológicos a Plazo Medio, 2022); http://www.ecmwf.int/publications/library/do/references/list/209.

Palmer, TN y cols. Representar la incertidumbre del modelo en la predicción del tiempo y el clima. Año. Rev. Planeta Tierra. Ciencia. 33, 163-193 (2005).

Artículo ADS MathSciNet CAS MATH Google Scholar

LeCun, Y., Bengio, Y. y Hinton, G. Aprendizaje profundo. Naturaleza 521, 436–444 (2015).

Artículo ADS CAS PubMed Google Scholar

Weyn, JA, Durran, DR y Caruana, R. ¿Pueden las máquinas aprender a predecir el clima? Uso del aprendizaje profundo para predecir la altura geopotencial cuadriculada de 500 hPa a partir de datos meteorológicos históricos. J. Adv. Modelo. Sistema Tierra. 11, 2680–2693 (2019).

ADS del artículo Google Scholar

Scher, S. & Messori, G. Predicción meteorológica y climática con redes neuronales: utilizando modelos de circulación general (GCM) con diferente complejidad como campo de estudio. Geociencias. Desarrollo de modelos. 12, 2797–2809 (2019).

ADS del artículo Google Scholar

Rasp, S. y col. WeatherBench: un conjunto de datos de referencia para el pronóstico del tiempo basado en datos. J. Adv. Modelo. Sistema Tierra. 12, e2020MS002203 (2020).

ADS del artículo Google Scholar

Weyn, JA, Durran, DR, Caruana, R. & Cresswell‐Clay, N. Pronóstico subestacional con un gran conjunto de modelos de predicción meteorológica de aprendizaje profundo. J. Adv. Modelo. Sistema Tierra. 13, e2021MS002502 (2021).

ADS del artículo Google Scholar

Keisler, R. Predicción del clima global con redes neuronales gráficas. Preimpresión en https://arxiv.org/abs/2202.07575 (2022).

Hu, Y., Chen, L., Wang, Z. & Li, H. SwinVRNN: un modelo de pronóstico conjunto basado en datos mediante perturbación de distribución aprendida. J. Adv. Modelo. Sistema Tierra. 15, e2022MS003211(2023).

Schultz, MG y cols. ¿Puede el aprendizaje profundo superar la predicción meteorológica numérica? Fil. Trans. R. Soc. A 379, 20200097 (2021).

Artículo ADS MathSciNet CAS PubMed PubMed Central Google Scholar

Hersbach, H. y col. El reanálisis global del ERA5. Meteorol QJR. Soc. 146, 1999-2049 (2020).

ADS del artículo Google Scholar

Liu, Z. y col. Transformador Swin: transformador de visión jerárquica mediante ventanas desplazadas. En Proc. Conferencia internacional sobre visión por computadora 10012–10022 (IEEE, 2021).

Dosovitskiy, A. et al. Una imagen vale 16x16 palabras: transformadores para el reconocimiento de imágenes a escala. Preimpresión en https://arxiv.org/abs/2010.11929 (2020).

Betts, AK, Chan, DZ y Desjardins, RL Sesgos cercanos a la superficie en ERA5 sobre las praderas canadienses. Frente. Reinar. Ciencia. 7, 129 (2019).

Artículo de Google Scholar

Jiang, Q. y col. Evaluación del conjunto de datos de precipitación del reanálisis ERA5 en China continental. J. hidrol. 595, 125660 (2021).

Artículo de Google Scholar

Magnusson, L. y col. Actividades de ciclones tropicales en ECMWF (Centro Europeo de Previsiones Meteorológicas a Plazo Medio, 2021).

Knapp, KR, Kruk, MC, Levinson, DH, Diamond, HJ y Neumann, CJ El mejor archivo internacional de seguimiento para la gestión climática (IBTrACS) que unifica los datos de ciclones tropicales. Toro. Soy. Meteorol. Soc. 91, 363–376 (2010).

ADS del artículo Google Scholar

Knapp, KR, Diamond, HJ, Kossin, JP, Kruk, MC & Schreck, CJ Proyecto International Best Track Archive for Climate Stewardship (IBTrACS), versión 4 (Centros Nacionales de Información Ambiental de la NOAA, 2018).

He, K., Fan, H., Wu, Y., Xie, S. y Girshick, R. Contraste de impulso para el aprendizaje de representación visual no supervisado. En Proc. Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 9729–9738 (IEEE, 2020).

Bao, H., Dong, L. y Wei, F. Beit: entrenamiento previo BERT de transformadores de imágenes. Preimpresión en https://arxiv.org/abs/2106.08254 (2021).

Devlin, J., Chang, MW, Lee, K. y Toutanova, K. BERT: entrenamiento previo de transformadores bidireccionales profundos para la comprensión del lenguaje. En Proc. Conferencia Capítulo Norteamericano de la Asociación de Lingüística Computacional Vol. 1, 4171–4186 (NAACL, 2019).

Brown, T. y col. Los modelos de lenguaje son aprendices de pocas oportunidades. Adv. Neural. inf. Proceso. Sistema. 33, 1877-1901 (2020).

Radford, A. y col. Aprendizaje de modelos visuales transferibles a partir de la supervisión del lenguaje natural. En Proc. Conferencia internacional sobre aprendizaje automático 8748–8763 (PMLR, 2021).

Chasteen, MB y Koch, SE Aspectos multiescala del brote de tornados del 26 al 27 de abril de 2011. Parte I: cronología del brote y evolución ambiental. Lun. Tiempo Rev. 150, 309–335 (2022).

ADS del artículo Google Scholar

Chasteen, MB y Koch, SE Aspectos multiescala del brote de tornados del 26 al 27 de abril de 2011. Parte II: modificaciones ambientales y retroalimentaciones de alto nivel que surgen de procesos latentes. Lun. Tiempo Rev. 150, 337–368 (2022).

ADS del artículo Google Scholar

Choy, C., Gwak, JY y Savarese, S. Convnets espacio-temporales 4D: redes neuronales convolucionales de Minkowski. En Proc. Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 3075–3084 (IEEE, 2019).

Zhang S., Guo, S., Huang, W., Scott MR y Wang, L. V4D: redes neuronales convolucionales 4D para el aprendizaje de representación a nivel de video. Preimpresión en https://arxiv.org/abs/2002.07442 (2020).

Garg, S., Rasp, S. y Thuerey, N. Probabilidad de WeatherBench: un conjunto de datos de referencia para el pronóstico meteorológico probabilístico de mediano plazo junto con modelos de referencia de aprendizaje profundo. Preimpresión en https://arxiv.org/abs/2205.00865 (2022).

Zoph, B., Vasudevan, V., Shlens, J. & Le, QV Aprendizaje de arquitecturas transferibles para el reconocimiento de imágenes escalable. En Proc. Conferencia IEEE/CVF sobre visión por computadora y reconocimiento de patrones 8697–8710 (IEEE, 2017).

Fildier, B., Collins, WD y Muller, C. Distorsiones de la distribución de la lluvia con calentamiento, con y sin autoagregación. J. Adv. Modelo. Sistema Tierra. 13, e2020MS002256 (2021).

Artículo ADS PubMed PubMed Central Google Scholar

White, P. Newsletter No. 102—Invierno 2004/05 (Centro Europeo de Pronósticos Meteorológicos a Plazo Medio, 2005); https://www.ecmwf.int/node/14623 (2005).

Kalnay, E. Modelado atmosférico, asimilación de datos y previsibilidad (Cambridge Univ. Press, 2003).

Lynch, P. Los orígenes de la predicción meteorológica por computadora y el modelado climático. J. Computación. Física. 227, 3431–3444 (2009).

Artículo ADS MathSciNet MATH Google Scholar

Stensrud, Esquemas de parametrización de DJ: claves para comprender los modelos numéricos de predicción meteorológica (Cambridge Univ. Press 2009).

Bauer, P. y col. El Programa de Escalabilidad del ECMWF: Progresos y Planes (Centro Europeo de Pronósticos Meteorológicos a Plazo Medio, 2020).

Nakaegawa, T. Computación de alto rendimiento en meteorología en el contexto de una era de unidades de procesamiento gráfico. Computadoras 11, 114 (2022).

Artículo de Google Scholar

Shi, X. y col. Red convolucional LSTM: un enfoque de aprendizaje automático para la predicción inmediata de las precipitaciones. Adv. Neural. inf. Proceso. Sistema. 28, 802–810 (2015).

Google Académico

Shi, X. y col. Aprendizaje profundo para la predicción inmediata de las precipitaciones: un punto de referencia y un nuevo modelo. Adv. Neural. inf. Proceso. Sistema. 30, 5617–5627 (2017).

Google Académico

Agrawal, S. y col. Aprendizaje automático para la predicción inmediata de precipitaciones a partir de imágenes de radar. Preimpresión en https://arxiv.org/abs/1912.12132 (2019).

Ravuri, S. y col. Hábil predicción inmediata de las precipitaciones utilizando modelos generativos profundos de radar. Naturaleza 597, 672–677 (2021).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Lebedev, V. y otros. Previsión inmediata de precipitaciones con imágenes de satélite. En Proc. Conferencia internacional ACM SIGKDD sobre descubrimiento de conocimientos y minería de datos 2680–2688 (ACM, 2019).

Sønderby, CK et al. Metnet: un modelo meteorológico neuronal para la predicción de precipitaciones. Preimpresión en https://arxiv.org/abs/2003.12140 (2020).

Descargar referencias

Agradecemos al ECMWF por ofrecer el conjunto de datos ERA5 y el archivo TIGGE; Centros Nacionales de Información Ambiental de la NOAA para el conjunto de datos IBTrACS; y otros miembros del equipo de Pangu para discusiones y apoyo con las GPU. Nuestro agradecimiento también al equipo de Verificación de Integración de Huawei Cloud EI, que nos ofrece una plataforma de computación paralela de alto rendimiento.

Nube de Huawei, Shenzhen, China

Kaifeng Bi, Lingxi Xie, Hengheng Zhang, Xin Chen, Xiaotao Gu y Qi Tian

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

KB diseñó el proyecto y entrenó las redes profundas 3D para Pangu-Weather. LX mejoró el diseño técnico. HZ, XC y XG establecieron el entorno de prueba y se prepararon para los datos. QT gestionó y supervisó el proyecto de investigación. KB y LX escribieron el artículo.

Correspondencia a Qi Tian.

KB, LX, HZ, XC, XG y QT son empleados de Huawei Cloud. Se presentó una patente provisional (aún no se le ha concedido una identificación) que cubre el algoritmo generativo descrito en este artículo, y enumera a los autores KB, LX y QT como inventores.

Nature agradece a Matthew Chantry, Imme Ebert-Uphoff y Martin Schultz por su contribución a la revisión por pares de este trabajo. Los informes de los revisores pares están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Solo comparamos Pangu-Weather con el IFS3 operativo porque FourCastNet2 no informó los resultados del desglose. Seguimos al ECMWF para definir el “hemisferio norte” como la región entre la latitud de 20° (exclusiva) y 90° (inclusive). Aquí, Z500/T500/Q500/U500/V500 indica el geopotencial, la temperatura, la humedad específica y los componentes u y v de la velocidad del viento a 500 hPa. Z850/T850 indica el geopotencial y la temperatura a 850 hPa. T2M indica la temperatura a 2 m y U10/V10 indica el componente u y el componente v de la velocidad del viento a 10 m.

Datos fuente

Solo comparamos Pangu-Weather con el IFS3 operativo porque FourCastNet2 no informó los resultados del desglose. Seguimos al ECMWF para definir el "hemisferio norte" como la región entre la latitud de -20° (exclusiva) y -90° (inclusive). Aquí, Z500/T500/Q500/U500/V500 indica el geopotencial, la temperatura, la humedad específica y los componentes u y v de la velocidad del viento a 500 hPa. Z850/T850 indica el geopotencial y la temperatura a 850 hPa. T2M indica la temperatura a 2 m y U10/V10 indica el componente u y el componente v de la velocidad del viento a 10 m.

Datos fuente

Solo comparamos Pangu-Weather con el IFS3 operativo porque FourCastNet2 no informó los resultados del desglose. Seguimos al ECMWF para definir los “trópicos” como la región entre la latitud de +20° (inclusive) y −20° (inclusive). Aquí, Z500/T500/Q500/U500/V500 indica el geopotencial, la temperatura, la humedad específica y los componentes u y v de la velocidad del viento a 500 hPa. Z850/T850 indica el geopotencial y la temperatura a 850 hPa. T2M indica la temperatura a 2 m y U10/V10 indica el componente u y el componente v de la velocidad del viento a 10 m.

Datos fuente

Los valores y tendencias de RMSE y ACC son cercanos entre los tres años, lo que indica la capacidad de pronóstico estable de Pangu-Weather en diferentes años. Aquí, Z500/T500/Q500/U500/V500 indica el geopotencial, la temperatura, la humedad específica y los componentes u y v de la velocidad del viento a 500 hPa. Z850/T850 indica el geopotencial y la temperatura a 850 hPa. T2M indica la temperatura a 2 m y U10/V10 indica el componente u y el componente v de la velocidad del viento a 10 m.

Datos fuente

a) La descomposición en seis océanos. b) El desglose en tres intervalos de intensidad. Las estadísticas generales se muestran en la Fig. 4c.

Datos fuente

a) El mapa horizontal corresponde a una distribución espacial desigual en la esfera terrestre. b) La altura geopotencial está estrechamente relacionada con la latitud. c) La velocidad media del viento y la temperatura están estrechamente relacionadas con la altura (formulada como niveles de presión). Las subfiguras b) yc) se trazaron utilizando estadísticas sobre los datos de ERA5.

a) Errores de prueba de modelo único. Muestra los errores de prueba (en RMSE) con respecto al tiempo de pronóstico utilizando modelos únicos (es decir, los tiempos de entrega son 1 h, 3 h, 6 h y 24 h, respectivamente). Tenga en cuenta la acumulación de errores de pronóstico a medida que aumenta el tiempo de pronóstico. b) Visualización de la tendencia de los cuantiles con respecto al tiempo de entrega. Muestra la tendencia de todas las variables mostradas en la Fig. 2 y las comparaciones con IFS3 y ERA518 operativos. Pangu-Weather a menudo informa valores de cuantiles más bajos porque los métodos basados ​​en IA tienden a producir pronósticos fluidos. Aquí, Z500/T500/Q500/U500/V500 indica el geopotencial, la temperatura, la humedad específica y los componentes u y v de la velocidad del viento a 500 hPa. Z850/T850 indica el geopotencial y la temperatura a 850 hPa. T2M indica la temperatura a 2 m y U10/V10 indica el componente u y el componente v de la velocidad del viento a 10 m.

Datos fuente

a) Los resultados del seguimiento de los ojos del ciclón del huracán Michael (2018–13) y el tifón Ma-on (2022–09) por Pangu-Weather y ECMWF-HRES, con una comparación con la verdad sobre el terreno (por IBTrACS24,25). b) Una ilustración del proceso de seguimiento, donde utilizamos Pangu-Weather como ejemplo. El algoritmo localiza el ojo del ciclón comprobando cuatro variables (a partir de los resultados del pronóstico), a saber, la presión media al nivel del mar, la velocidad del viento a 10 m, el espesor entre 850 hPa y 200 hPa y la vorticidad de 850 hPa). Las cifras mostradas corresponden a los resultados de pronóstico de estas variables en un tiempo de anticipación de 72 h, y los ojos de ciclón seguidos se indican mediante la cola de flechas. c) Los resultados del seguimiento procesal del tifón Kong-rey (2018-25). Los resultados de Pangu-Weather se compararon con los de ECMWF-HRES y Ground-Truth (por IBTrACS24,25). Mostramos seis puntos de tiempo, siendo el primero las 12:00 UTC del 29 de septiembre de 2018, y el intervalo de tiempo entre las subfiguras vecinas es de 12 h. La trayectoria histórica (observada) de los ojos de los ciclones se muestra con líneas discontinuas. Tenga en cuenta la diferencia significativa entre los resultados de seguimiento de Pangu-Weather y ECMWF-HRES (Pangu-Weather es más preciso) en las cuatro subcifras del medio. Las subfiguras con mapas se trazaron utilizando el kit de herramientas Matplotlib Basemap.

Datos fuente

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Bi, K., Xie, L., Zhang, H. et al. Predicción meteorológica global precisa de mediano alcance con redes neuronales 3D. Naturaleza 619, 533–538 (2023). https://doi.org/10.1038/s41586-023-06185-3

Descargar cita

Recibido: 05 de enero de 2023

Aceptado: 09 de mayo de 2023

Publicado: 05 de julio de 2023

Fecha de emisión: 20 de julio de 2023

DOI: https://doi.org/10.1038/s41586-023-06185-3

Cualquier persona con la que comparta el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Informes Científicos (2023)

Reseñas de la naturaleza Tierra y medio ambiente (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.