MACRO - Entwicklung von Methoden des maschinellen Lernens zur maßstabsübergreifenden Regionalisierung hydrogeologischer Flächeninformation
Land / Region: Deutschland
Projektanfang: 01.09.2019
Projektende: 30.09.2024
Projektstand: 15.01.2024
Quelle: BGR
Zur Regionalisierung von Punktinformationen werden herkömmlicherweise deterministische und geostatistische Interpolationsmethoden wie Inverse Distance Weighting (IDW) bzw. Kriging-Verfahren verwendet. Diese stammen allerdings aus einer Zeit mit weitaus dünnerer Datenlage und geringerer Rechenleistung. Mit der zunehmenden Datenverfügbarkeit werden Methoden wie maschinelles Lernen (engl. "machine learning") notwendig, um die in größeren Datenmengen enthaltenen Informationen möglichst optimal ausnutzen zu können.
Maschinelles Lernen gewinnt in den Geowissenschaften allgemein und der Hydrogeologie im Speziellen seit einigen Jahren zunehmend an Bedeutung, insbesondere für die Vorhersage von Grundwasserzeitreihen. Da jedoch die Datenerhebung in der Hydrogeologie sehr aufwendig und kostenintensiv ist, spielt die Regionalisierung, d. h. die Übertragung von Punktinformationen in die Fläche, eine herausragende Rolle bei der Interpretation und Bewertung von hydrogeologischen und hydrogeochemischen Eigenschaften des Untergrunds.
Quelle: BGR
In diesem Projekt sollen die Grundlagen für die Nutzung des maschinellen Lernens zur maßstabsübergreifenden Regionalisierung hydrogeologischer Flächeninformationen entwickelt und anhand spezifischer Anwendungsfälle getestet werden. Dafür sollen state-of-the-art Methoden des maschinellen Lernens, wie z. B. Extreme Gradient Boosting (XGBoost) und Convolutional Neural Networks (CNNs) untersucht, weiterentwickelt und schließlich zur Generierung von Flächeninformationen eingesetzt werden.
Neben diesem Fokus auf Art und Architektur eines Algorithmus treten schon vor deren Anwendung zentrale Fragen auf. Nennenswert sind hier unter anderem die Zusammenstellung, Generierung und Verwendung sinnvoller Prädiktoren (engl. "predictors", "explanatory variables" oder "features"). Als Prädiktoren werden zusätzliche Inputvariablen bezeichnet, die Informationen zu all den Prozessen enthalten, die die Zielvariable (engl. "target variable") maßgeblich beeinflussen. Dazu gehören auch Informationen aus angrenzenden Fachgebieten, welche hier für eine Vielzahl an Prädiktoren verwendet werden: digitale Höhenmodelle, thematische Karten aus der Bodenkunde und Hydrogeologie, Klimadaten, modellierte Daten und Fernerkundungsdaten.
Die trainierten Modelle können anschließend eingesetzt werden, um bestehende Flächeninformationen zu validieren, Datenlücken zu füllen, aber auch um gänzlich neue thematische Flächeninformationen zu erstellen.
Literatur:
Paper:
- NÖLSCHER, M, MUTZ, M. & BRODA, S. (2022): Multiorder Hydrologic Position for Europe — a Set of Features for Machine Learning and Analysis in Hydrology. - Sci Data 9, 662. doi: 10.1038/s41597-022-01787-4
Tagungsbeiträge:
- NÖLSCHER, M., COOKE, A.-K., WILLKOMMEN, S., GOMEZ, M. & BRODA, S. (2023): AwesomeGeodataTable - Towards a community-maintained searchable table for data sets easily usable as predictors for spatial machine learning. - EGU General Assembly, Vienna, Austria, 24–28 Apr 2023, EGU23-5394. doi: 10.5194/egusphere-egu23-5394.
- NÖLSCHER, M. & BRODA, S. (2021): Using an Extreme Gradient Boosting Learner for Mapping Hydrogeochemical Parameters in Germany. - EGU General Assembly, online, 19-30 Apr 2021, EGU21-12818. doi: 10.5194/egusphere-egu21-12818.
- NÖLSCHER, M., MUTZ, M. & BRODA, S. (2021): Multiorder Hydrologic Position for Europe (EU-MOHP) as a Set of Environmental Predictor Variables for Hydrologic Modelling and Groundwater Mapping with Focus on the Application of Machine Learning. - AGU Fall Meeting, online, 13-17 Dec 2021.
- NÖLSCHER, M., HÄNTZE, H., BRODA, S., JÄGER, L., PRASSE, P. & MAKOWSKI, S. (2020). Using Convolutional Neural Networks for the Prediction of Groundwater Levels. - 19th Conference on Artificial Intelligence for Environmental Science, Boston, MA, USA.