Auteurs
- Imad JANBAIN, Docteur, Université de Rouen Normandie
- Nicolas MASSEI, Professeur des Universités, Université de Rouen Normandie
- Abderrahim JARDANI, Professeur des Universités, Université de Rouen Normandie
Résumé
Les résultats présentés ici sont issus de méthodologies de l’intelligence artificielle et du deep learning appliquées à l’hydrologie. Ce travail qui se base sur le traitement des données de niveaux d’eau et de débits de crue constitut une première étape pour la simulation et la prévision des inondations en Seine et dans les rivières de la Métropole de Rouen.
Sommaire
Introduction
Si la problématique inondation – ainsi que celle, plus générale de la simulation et de la prévision de l’aléa « événement hydrologique extrême » – est le plus souvent traitée à partir de modélisations hydrologiques et hydrauliques à base physique, représentant donc mathématiquement les mécanismes physiques présidant à ces événements, la complexité des phénomènes en jeu et surtout de leurs interactions rend ces approches relativement lourdes en matière de temps de calcul et également très consommatrices de données de tous types (météorologiques, hydrologiques, géologiques, physio-graphiques incluant l’occupation des sols…). Ces données ne sont pas nécessairement toujours disponibles, auquel cas l’approche à base physique finit, paradoxalement, par se heurter assez rapidement au problème d’une représentation physiquement suffisamment réaliste des processus.
C’est ce qui a conduit l’équipe à proposer dans le cadre du développement de la plateforme de modélisation multirisque, pour ce volet inondation, une approche comprenant d’une part la spatialisation de la sensibilité au risque « inondation » , et d’autre part la simulation et la prévision des niveaux d’eau, moyennes et extrêmes, par deep learning.
Cette méthodologie présente l’avantage de pouvoir extraire toute l’information pertinente enregistrée par les données météorologiques et hydrologiques pour simuler l’hydrologie et l’hydrodynamique conduisant aux événements d’intérêt particulier1. L’approche par deep learning ne doit pas se concevoir comme un substitut aux autres méthodes de modélisation, à base physique ou même statistique, mais constitue bel et bien un complément méthodologique, rapide à mettre en œuvre et donnant généralement de très bons résultats tant que sa mise en œuvre reste sous contrôle de l’expertise hydrologique.
Deux approches principales destinées à traiter deux types de problématiques différentes susceptibles d’affecter le territoire métropolitain ont été testées, qui contribueront à alimenter la plateforme de modélisation multirisques. Nous avons, d’une part, abordé la question de la prévision des niveaux de crue de la Seine dans la région rouennaise et, d’autre part, celle de la prévision des événements hydrologiques intenses (très rapides montées de crue) dans les rivières de la métropole, en prenant l’exemple du bassin du Cailly à Notre-Dame-de-Bondeville et à Fontaine-le-Bourg.
La prévision des niveaux de crue sur la Seine à Rouen
Données et méthodes
Dans le domaine de la prévision des inondations extrêmes à l’aide d’outils d’apprentissage profond, la littérature existante met en évidence trois pistes :
- Le développement d’une structure de modèle complexe sophistiquée et robuste capable de capturer les tendances et la complexité des données associées à ces événements2 ;
- La deuxième approche souligne l’importance de techniques efficaces de manipulation des données, englobant l’augmentation et la génération de données en particulier pour les cas d’événements rares afin d’exploiter au mieux les informations disponibles3 ;
- La dernière approche, qui est l’objet principal de cette partie du travail sur les niveaux d’eau en Seine, se concentre sur l’affinement de la manière dont le modèle est optimisé pendant le processus d’apprentissage – un facteur essentiel pour améliorer la précision de la prévision des niveaux extrêmes.
Cette stratégie a donc été appliquée pour la prévision des niveaux extrêmes et a impliqué le développement de fonctions de perte personnalisées, spécialement adaptée à la problématique. Le modèle utilisé ici est une architecture de réseau de neurones profond de type réseau récurrent (i.e. à mémoire) bi-directionnel incluant un mécanisme d’attention. Les données d’entrée utilisées pour l’apprentissage sont données dans le tableau 1, et les résultats présentés ici (figure 1) utilisent le scénario C4. Ce scénario correspond à l’utilisation de l’ensemble des données du tableau, à savoir :
- Des données de réanalyse ERA54 à l’amont (upstream) et à l’aval (downstream) de la station-cible de niveau d’eau à modéliser et prévoir : température atmosphérique, vitesse du vent, précipitations, pression au niveau de la mer ;
- Les niveaux d’eau antérieurs (donc connus) à l’amont et à l’aval de la station-cible ;
- Le niveau de la mer à Honfleur ;
- Les niveaux et débits antérieurs des rivières adjacentes ;
- Les niveaux de nappe pour tenir compte de la contribution des eaux souterraines au voisinage de la station-cible.

Tableau 1 : Données d’entrée utilisées dans les modèles. Les résultats présentés ci-après correspondent au scénario C4, utilisant toutes les données d’entrée disponibles (Imad Janbain, 2024)
Résultats, analyse et interprétation
La figure 1, ci-dessous, fournit un exemple illustratif des résultats de simulation du modèle en utilisant deux fonctions de perte différentes sur une partie des données d’essai pour la station de Rouen, en se concentrant sur l’application du modèle Bi-GRU-Attention dans le cadre du scénario C4 pour la prévision à 7 jours. L’étendue temporelle complète, couvrant différentes saisons sur plusieurs années, est montrée en haut, tandis que la section inférieure zoome sur trois périodes notables pour mettre en évidence l’effet de la fonction de perte adaptée. Ces périodes sélectionnées comprennent deux saisons hivernales en 2017 et 2018, chacune marquée par deux inondations, et une période estivale distincte où la Seine était dans des conditions normales. Ces périodes spécifiques ont été choisies pour mettre en évidence la performance du modèle en termes de régression pour reconstruire les niveaux normaux et pour détecter les événements extrêmes dans des conditions différentes.
Alors que les deux fonctions de perte personnalisées fonctionnent bien dans des conditions normales, la fonction de perte traditionnelle MSE peine à détecter les inondations extrêmes de décembre 2017 et février 2020. Elle détecte également très tardivement la deuxième inondation de janvier 2018 et de mars 2020. En revanche, notre fonction de perte personnalisée garantit que la simulation du modèle correspond aux deux conditions normales tout en détectant parfaitement les événements extrêmes. Cela démontre la performance supérieure et la polyvalence de notre approche.

Figure 1 : Comparaison des résultats des modèles de simulation à la station de Rouen avec deux fonctions de perte, mettant l’accent sur trois périodes comprenant deux inondations et une condition normale. Un exemple illustrant le scénario C45 (Imad Janbain, 2024)
Nos fonctions de perte personnalisées ont joué un rôle essentiel dans cette partie de l’étude, en améliorant la capacité du modèle à interpréter et à utiliser les données de manière efficace. Cette approche personnalisée équilibre habilement la détection des valeurs aberrantes tout en minimisant les erreurs pour les points de données non aberrantes, ce qui la rend inestimable pour les régions connaissant des inondations occasionnelles. Il est important de noter que ces améliorations ont été obtenues sans manipulation extensive des données, en s’appuyant uniquement sur des modèles d’apprentissage profond simples. En outre, nous soulignons le rôle critique des facteurs externes dans les modèles de prévision des inondations, y compris les conditions en amont, l’hydrologie sous-fluviale, les données piézométriques et les variables météorologiques. Notre analyse révèle les limites de la dépendance aux seules données météorologiques pour une simulation précise des inondations. L’ajout de données météorologiques provenant d’une zone plus étendue a entraîné une diminution notable de la précision des prévisions, probablement en raison du bruit, de données non corrélées ou d’un excès de données très similaires, ce qui rend difficile pour le modèle d’extraire des informations significatives. En revanche, l’intégration des données relatives au niveau de la mer, aux conditions hydrologiques en amont, aux données sous-fluviales et aux données piézométriques améliore considérablement les prévisions d’inondation. En outre, notre étude permet une interprétation, facilitant une compréhension nuancée de la détection des inondations extrêmes et des perspectives de régression.
Ce travail souligne les avantages de l’utilisation de modèles d’apprentissage profond avancés, en particulier ceux incluant les mécanismes d’attention. Ces modèles démontrent leur efficacité dans le filtrage du bruit, la stabilisation des prédictions en plusieurs étapes, l’amélioration des performances et l’extraction d’informations précieuses à partir de caractéristiques hydrologiques supplémentaires, améliorant ainsi la précision de la détection des événements extrêmes. En outre, les modèles les plus simples ont été utiles pour la sélection des entrées, l’interprétabilité et l’explicabilité, car ils sont moins robustes et moins sensibles au choix des entrées. Cette étude nous a permis de faire progresser de manière significative les techniques de prévision des inondations adaptées aux systèmes fluviaux urbanisés. Nous avons démontré l’utilité pratique de la fonction de perte personnalisée et souligné l’importance de prendre en compte une série de facteurs hydrologiques et météorologiques dans la prévision des inondations. Notre analyse fournit un examen complet et interprétable, approfondissant notre compréhension de la dynamique complexe dans la région de la Seine. En outre, nous avons identifié des caractéristiques influentes clés qui surpassent les autres afin d’améliorer l’explicabilité des modèles d’apprentissage profond dans la prévision des inondations. En fin de compte, nos efforts visent à renforcer la préparation aux inondations, les stratégies de réponse et les mesures d’atténuation, protégeant ainsi les communautés et atténuant l’impact socio-économique des événements hydrologiques extrêmes.
La prévision des débits de crue sur le bassin du Cailly
Données et méthodes
Cette étude s’est concentrée sur l’amélioration de la prévision du débit des rivières dans le bassin de la rivière Cailly dans la région de Normandie, dans le nord de la France, en abordant les défis posés par les limitations de données dans les petits bassins. Nous avons cette fois-ci cherché à prédire le débit de pointe sur 24 heures à l’aide de données à l’échelle horaire. Le travail cible ici la rivière Cailly, un petit bassin où les données sont limitées par rapport à un bassin de plus grande échelle spatiale et où la dynamique est fortement sensible aux facteurs locaux. La figure 2, ci-après, montre la localisation des stations-cible de Notre-Dame-de-Bondeville et Fontaine-le-Bourg ainsi que l’emplacement des stations de mesures pour les données explicatives.

Figure 2 : Localisation de la station du Cailly à Notre-Dame-de-Bondeville et à Fontaine-le-Bourg et des stations de mesure des données explicatives dans les environs de la station-cible (Imad Janbain, 2024)
L’objectif principal était de maximiser l’utilité des données limitées sans incorporer d’autres caractéristiques externes provenant de bassins à plus grande échelle. Nous nous appuyons à nouveau sur l’utilisation d’un modèle d’apprentissage profond Bi-GRU-Attention6 (architecture identique à celle utilisée pour les niveaux de la Seine), avec un travail poussé sur le choix des caractéristiques (i.e. les variables explicatives) de manière à transformer les données brutes en informations significatives pour améliorer la précision de la prédiction sans l’incorporation de caractéristiques externes supplémentaires provenant de bassins à plus grande échelle.
La figure 3, qui suit, illustre un exemple d’évolution des caractéristiques choisies comme variables explicatives sur une courte période de 10 jours. Nous observons des cas où il n’y a pas de précipitations ou des cas où l’augmentation du débit est attribuée à des précipitations consécutives, ce qui indique une réponse tardive. En outre, nous constatons que la saturation du sol et les changements piézométriques présentent une dynamique lente et ne sont pas étroitement corrélés avec les données relatives au débit cible. Par exemple, la saturation du sol peut présenter des changements minimes au cours d’une période de 24 heures.

Figure 3: Évolution temporelle des différentes caractéristiques (variables explicatives) sélectionnées pour la simulation et la prévision hydrologique (Imad Janbain, 2024)
Nous avons donc utilisé une approche complète d’ingénierie des caractéristiques pour fournir au modèle plus d’informations, facilitant une meilleure extraction des corrélations entre caractéristiques (variables explicatives) et variable hydrologique à simuler, et améliorant ainsi l’interprétabilité du modèle. Notre processus d’ingénierie des caractéristiques a consisté à transformer des variables environnementales brutes limitées en représentations significatives qui capturent la dynamique sous-jacente du système. Plus précisément, nous avons classé la saturation du sol et les niveaux piézométriques en catégories discrètes basées sur des seuils prédéfinis, ce qui permet au modèle de distinguer les états de saturation faible, modérée et élevée. Ces seuils ont été établis après analyse de la saturation du sol et des valeurs piézométriques au cours de diverses périodes d’événements historiques. Par exemple, les valeurs inférieures au premier quartile sont considérées comme faibles, celles qui se situent entre le premier et le deuxième quartile sont modérées et celles qui dépassent le deuxième quartile sont considérées comme élevées. De même, nous avons incorporé des caractéristiques basées sur les seuils pour identifier les niveaux critiques, par exemple pour la station de Notre-Dame-de-Bondeville, nous pouvons obtenir une catégorisation à trois niveaux : les débits inférieurs à 2,5 m3/s sont classés comme faibles, ceux compris entre 2,5 et 4 m3/s sont considérés comme modérés, et les débits supérieurs à 4 m3/s sont étiquetés comme élevés.
Nous avons également créé une variable « time from last event », qui indique le temps écoulé depuis le dernier pic ou creux et fournit un contexte temporel sur la récurrence des événements. En complément, des caractéristiques cumulatives des précipitations (moyennes mobiles simples et exponentielles sur des fenêtres de 6 à 120 heures) ont été extraites pour traiter la problématique de décalage entre précipitations et crues, et une décomposition LOESS (STL) a été intégrée pour isoler les composantes saisonnières, de tendance et résiduelles des données. Toutefois, les montées de crue soudaines peuvent également apparaître dans des conditions normales, comme en été (voir figure 4, ci-dessous), où les valeurs de débit sont inférieures à 4 m3/s.

Figure 4 : Illustration, de la problématique à traiter, pour la station de Notre-Dame-de-Bondeville7 (Imad Janbain, 2024)
Résultats, analyse et interprétation
La figure 5, ci-après, illustre les prévisions du modèle pour les 24 heures à venir en utilisant la combinaison d’entrées optimisées identifiées précédemment pour la station de débit de Notre-Dame-de-Bondeville. Elle illustre les résultats des prévisions sur des périodes plus longues et plus courtes. Enfin, avec les caractéristiques d’entrée soigneusement choisies, le modèle capture avec succès les tendances générales à long terme et à court terme, en particulier les hausses soudaines. La sous-figure 5.b illustre un exemple de montées de crue soudaines dans des conditions normales au cours de l’été 2021 à la station de Notre-Dame-de-Bondeville.

Figure 5 : Prévision à 24h du débit à la station de Notre-Dame-de-Bondeville8 (Imad Janbain, 2024)
Conclusion
En démontrant l’efficacité des modèles d’apprentissage profond combinés à une démarche stratégique de sélection des caractéristiques, cette étude contribue clairement à faire progresser les pratiques de prévision hydrologique. Le modèle a réussi à détecter de petites variations à court terme et des hausses soudaines 24 heures à l’avance, en hiver (non montré ici) comme en été (figure 31b), en utilisant les caractéristiques disponibles sans qu’il soit nécessaire de recourir à des caractéristiques externes supplémentaires provenant de zones à plus grande échelle, ce qui constitue une avancée significative en hydrologie pour des contextes similaires de petits bassins.
Les recherches futures pourraient explorer d’autres interactions de caractéristiques, affiner l’architecture du modèle et appliquer ces connaissances à d’autres petits bassins dans le monde entier et pour des horizons de prévision plus longs. En fin de compte, nos résultats soulignent l’importance d’une sélection personnalisée des caractéristiques et d’une évaluation rigoureuse des modèles pour optimiser la précision des prévisions tout en relevant les défis liés à la rareté des données.
Bibliographie
Chung, J., Gulcehre, C., Cho, K., Bengio, Y., 2014. Empirical evaluation of gated recurrent neural networks on sequence modeling. arXiv preprint arXiv:1412.3555. doi: 10.48550/arXiv.1412.3555.
Clark, S. R., Lerat, J., Perraud, J.-M., and Fitch, P., 2024. Deep learning for monthly rainfall–runoff modelling: a large-sample comparison with conceptual models across Australia, Hydrol. Earth Syst. Sci., 28, 1191–1213, https://doi.org/10.5194/hess-28-1191-2024.
Graves, A.; Schmidhuber, J. Framewise, 2005. Phoneme Classification with Bidirectional LSTM and Other Neural Network Architectures. Neural Netw., 18, 602–610.
Hochreiter, S., Schmidhuber, J., 1997. Long short-term memory. Neural Computation. 9,1735–1780. doi: 10.1162/neco.1997.9.8.1735.
Kao, I.F., Zhou, Y., Chang, L.C., Chang, F.J., 2020. Exploring a Long Short-Term Memory based Encoder-Decoder framework for multi-step-ahead flood forecasting. Journal of Hydrology. 583, 124631 https://doi.org/10.1016/j.jhydrol.2020.124631.
Kao, I.F., Liou, J.Y., Lee, M.H., Chang, F.J., 2021. Fusing stacked autoencoder and long short-term memory for regional multistep-ahead flood inundation forecasts. Journal of Hydrology 598, 126371. https://doi.org/10.1016/j.jhydrol.2021.126371.
Vaswani, A.; Shazeer, N.; Parmar, N.; Uszkoreit, J.; Jones, L.; Gomez, A.N.; Kaiser, Ł.; Polosukhin, I., 2017. Attention Is All You Need. In Advances in Neural Information Processing Systems; Guyon, I., Von Luxburg, U., Bengio, S.,Wallach, H., Fergus, R., Vishwanathan, S., Garnett, R., Eds.; Curran Associates, Inc.: Red Hook, NY, USA, 2017; Volume 30
Weng P, Tian Y, Liu Y, Zheng Y., 2023. Time-series generative adversarial networks for flood forecasting. J Hydrol 622:129702. https://doi.org/10.1016/j.jhydrol.2023.129702
Wi, S. and Steinschneider, S., 2024. On the need for physical constraints in deep learning rainfall–runoff projections under climate change: a sensitivity analysis to warming and shifts in potential evapotranspiration, Hydrol. Earth Syst. Sci., 28, 479–503, https://doi.org/10.5194/hess-28-479-2024.
Xiang, Z., Yan, J., & Demir, I., 2020. A rainfall-runoff model with LSTM-based sequence-to-sequence learning. Water Resources Research, 56, e2019WR025326. https://doi.org/10.1029/2019WR025326
Yao, Zhiyuan & Wang, Zhaocai & Wang, Dangwei & Wu, Junhao & Chen, Lingxuan., 2023. An ensemble CNN-LSTM and GRU adaptive weighting model based improved sparrow search algorithm for predicting runoff using historical meteorological and runoff data as input. Journal of Hydrology. 625.https://doi.org/10.1016/j.jhydrol.2023.129977
Yuan, X., Chen, C., Lei, X., Yuan, Y., Muhammad Adnan, R., 2018. Monthly runoff forecasting based on LSTM–ALO model. Stochastic Environmental Research and Risk Assessment. 32, 2199–2212. https://doi.org/10.1007/s00477-018-1560-y.
- Clark, S. et al. 2024 ; Wi, S. et al. 2024 ; Xiang, Z. et al. 2020 ↩︎
- Yao, Z. et al. 2023 ; Yuan, X. et al. 2018 ; Kao, I.F. et al. 2020 ; Kao, I.F. et al. 2021 ↩︎
- Weng, P. et al. 2023 ↩︎
- https://cds.climate.copernicus.eu/cdsapp#!/dataset/reanalysis-era5-single-levels?tab=overview ↩︎
- Cet exemple utilise le modèle Bi-GRU-Attention pour la prévision à 7 jours ↩︎
- Hochreiter, S. et al. 1997 ; Chung, J. et al. 2014 ; Graves, A. et al. 2005 ; Vaswani, A. et al 2017 ↩︎
- Le modèle doit être capable de simuler et prévoir les augmentations fortes et soudaines de débit sur un petit bassin en plein cœur de la métropole rouennaise, y compris en réponse à des événements orageux estivaux ↩︎
- La figure 5b montre que le modèle est capable d’atteindre une excellente prévision des montées de crue soudaines et très rapides, y compris dans un contexte d’étiage, pendant l’été 2021 ↩︎