Unüberwachter Ansatz zur geodynamischen Trennung | GeoSep

Die NASA- und ESA-Erdbeobachtungsmissionen liefern immer größere Mengen an Satellitenbeobachtungen. Die meisten dieser Beobachtungen messen eine Überlagerung von verschiedenen Quellen und Dynamiken. In diesem Projekt zielen wir darauf ab, die jeweiligen Satellitenbeobachtungen in die zugehörigen unzusammenhängenden Dynamiken zu trennen. Zum Beispiel ist die satellitenbeobachtete Meeresoberflächentemperatur (SST) eine sehr wichtige Variable, um die ozeanische Wärmeaufnahme und damit den Fortschritt des Klimawandels auf der Erde abzuschätzen. Allerdings überlagern sich die jeweiligen SST-Beobachtungen mit Beiträgen von Gezeiten, Konvektion, Advektion, Turbulenz, Trends und Messrauschen (Abb. 1). Da nicht alle diese Prozesse auf die gleiche Weise (oder sogar mit dem gleichen Vorzeichen) zur ozeanischen Wärmeaufnahme beitragen, würde eine Aufteilung der beobachteten SST in ihre dynamischen Beiträge die Schätzungen der ozeanischen Wärmeaufnahme und die entsprechenden langfristigen Vorhersagen sowie die Strategien zur Eindämmung des Klimawandels erheblich verbessern ( ). Bestehende Methoden für diese Aufgabe, z. B. die Datenassimilation, sind stark von den verwendeten Vorabinformationen, z. B. aus numerischen Modellen, abhängig und auf diese ausgerichtet. In den Datenwissenschaften werden diese Methoden als überwachte Methoden bezeichnet.

Das Hauptziel des Projekts besteht darin, satellitengestützte Erdsystembeobachtungen durch unüberwachtes maschinelles Lernen (ML) in ihre dynamischen Komponenten zu zerlegen. Die Vorteile gegenüber bestehenden Methoden sind 1) die einfache Wiederanwendung auf alle Arten von (auch nicht-ozeanischen) Satellitendaten, ohne zusätzliche Trainingsdaten zu erzeugen oder physikalische Einschränkungen zu kodieren; 2) das Weglassen von Verzerrungen und Fehlern, die normalerweise durch das Vorwissen, z. B. aus numerischen Modellen, eingeführt werden. 

In diesem Projekt wird die Trennung vollständig auf formalen Kriterien basieren und benötigt keine vorherigen bereichsspezifischen Informationen:

Eine Trennung gilt als erfolgreich, d.h. dynamisch-disjunkt, wenn durch das Entfernen eines der getrennten Teile eine ML-Prognosefähigkeit, die nur auf dem verbleibenden Datensatz basiert, so weit wie möglich verringert wird. Die ML-Prognosefähigkeit wird durch punktweise Verluste als RMSE und durch Wertverteilungsverluste als Wasserstein-Distanz bewertet. Aus technischer Sicht entwickeln wir einen antagonistischen Hin- und Her-Trainingsansatz von zwei neuronalen Netzen (NN), einem Separation-NN und einem Forecast-NN, die eine neue Art von dynamikfokussiertem maskiertem Autoencoder bilden. 

Dieses Projekt wird von der Helmholtz Einstein International Berlin Research School in Data Science (HEIBRiDS) gefördert (https://www.heibrids.berlin/)

 

zurück nach oben zum Hauptinhalt