Un bref aperçu de l’activité Assimilation de Données au CEREA
L'assimilation de données de données est un des trois axes de recherche du
CEREA. Il s'agit de combiner de façon mathématiquement optimale des
observations portant sur un système géophysique avec des sorties d'un modèle
numérique de la dynamique de ce système. Les techniques de l'assimilation de
données ont par exemple permis la mise en oeuvre de prévisions numériques
météorologiques de grande précision (dans des centres de prévision
opérationnels tels que Météo-France). Elles sont aujourd'hui appliquées dans
de nombreux domaines des géosciences : océan, surfaces continentales, climat,
cryosphère, chimie atmosphérique, qualité de l'air, etc; et parfois au-delà
(voir Asch et al., 2016). Les méthodes les plus emblématiques sont le 3D-Var
(approche variationnelle agissant à un temps fixé) le 4D-Var (approche
variationnelle issue du contrôle optimal appliquée sur une fenêtre temporelle)
et le filtre de Kalman d'ensemble (EnKF, construit à partir du filtre de Kalman).
Au CEREA, nous nous intéressons en particlier aux aspects théoriques de ces
méthodes. Il peut s'agir de démontrer par les mathématiques des propriétés des
méthodes d'assimilation de données ; on veut par exemple comprendre l'impact de la dynamique sur la précision de l'assimilation de données (Bocquet et al., 2017). Il s'agit cependant le plus souvent de construire de nouveaux algorithmes permettant d'atteindre une plus grande précision ou bien une meilleure efficacité numérique (nous sommes en géosciences dans un contexte de Big Data et la complexité numérique est donc critique).
Pour réaliser la fusion d'une quantité massive de données et des sorties de modèles numériques de taille très conséquente, les algorithmes de l'assimilation de données étaient initialement simples, faisant principalement appel à la théorie de l'estimation linéaire. Avec la croissance des moyens de calculs et la démocratisation d'approches formelles plus sophistiquées, les méthodes se sont complexifiées et traitent aujourd'hui de dynamiques modérément non-linéaires et de statistiques sous-jacentes non-gaussiennes.
Sur le plan théorique, nous avons par exemple oeuvré à l'unification des deux
grands familles de méthodes, variationnelle et statistique (filtrage
d'ensemble), et proposé les premières méthodes non-linéaires bâties sur une
analyse variationnelle dans l'espace d'une ensemble de trajectoires. Nous
avons proposé des méthodes rigoureuses permettant de corriger certains défauts
de fabrique du filtre de Kalman d'ensemble. Par exemple la faible taille de
l'ensemble de l'EnKF engendre des erreurs dites d'échantillonnage qui mettent
en péril la stabilité de la méthode et requiert l'utilisation d'une inflation
de l'incertitude estimée. Nous avons montré comment s'abstraire de ce besoin
d'inflation (Bocquet, 2011 ; Bocquet et al., 2015).
Au CEREA, nous nous intéressons également à l'application de ces méthodes aux
géosciences. En particulier, de nombreux de nos travaux portent sur la
dispersion atmosphérique, la chimie atmosphérique et la qualité de l'air. Par
exemple, nous avons étudié l'impact de la donnée lidar sur la prévision des
aérosols, et prouvé ainsi son utilité (Wang et al., 2013-2014).
Pour certains de ces problèmes, l'assimilation de données s'identifie à un
problème inverse, qu’on appelle aussi modélisation inverse par abus de
langage. En particulier nous nous intéressons à l'estimation des flux
d'émission de polluants, comme les composés organiques volatils, les gaz à
effet de serre, les précurseurs de l'ozone, etc. Nous travaillons également à
l'estimation du terme source atmosphérique émis lors d'un accident industriel
ou nucléaire, comme les accidents de Tchernobyl et Fukushima-Daiichi; des
recherches que nous menons avec nos partenaires de l'Institut de
Radioprotection et de Sûreté Nucléaire (IRSN). Nous avons par exemple non
seulement estimé le terme source de ces accidents mais fourni également une
estimation objective de l'incertitude associée (comme les barres d'erreur
associées).
M. Asch, M. Bocquet et M. Nodet : Data assimilation:Methods, Algorithms and Applications. The Society for Industrial and Applied Mathematics (SIAM), 2016.
J.-M. Haussaire and M. Bocquet. A low-order coupled chemistry meteorology model for testing online and offline data assimilation schemes: L95-GRS (v1.0). Geosci. Model Dev., 9:393-412, 2016.
M. Bocquet and P. Sakov. Joint state and parameter estimation with an iterative ensemble Kalman smoother. Nonlin. Processes Geophys., 20:803-818, 2013.
M. Bocquet. Ensemble Kalman filtering without the intrinsic need for inflation. Nonlin. Processes Geophys., 18:735-750, 2011.
M. Bocquet, P. N. Raanes, and A. Hannart. Expanding the validity of the ensemble Kalman filter without the intrinsic need for inflation. Nonlin. Processes Geophys., 22:645-662, 2015.
Y. Wang, K. Sartelet, M. Bocquet, and P. Chazette. Assimilation of ground versus lidar observations for PM10 forecasting. Atmos. Chem. Phys., 13:269-283, 2013.
Y. Wang, K. Sartelet, M. Bocquet, and P. Chazette. Modelling and assimilation of lidar signals over Greater Paris during the MEGAPOLI summer campaign. Atmos. Chem. Phys., 14:3511-3532, 2014.
Y. Wang, K. N. Sartelet, M. Bocquet, P. Chazette, M. Sicard, G. D'Amico,
J.-F. Léon, L. Alados-Arboledas, A. Amodeo, P. Augustin, J. Bach,
L. Belegante, I. Binietoglou, X. Bush, A. Comerón, H. Delbarre,
D. García-Vízcaino, J. L. Guerrero-Rascado, M. Hervo, M. Iarlori,
P. Kokkalis, D. Lange, F. Molero, N. Montoux, A. Muñoz, C. Muñoz,
D. Nicolae, A. Papayannis, G. Pappalardo, J. Preissler, V. Rizi,
F. Rocadenbosch, K. Sellegri, F. Wagner, and F. Dulac. Assimilation of lidar signals: application to aerosol forecasting in the western Mediterranean basin. Atmos. Chem. Phys., 14:12031-12053, 2014.