Schwach überwachte Deep-Learning-Modelle zur Erkennung und Überwachung räumlich-zeitlicher Anomalien der Erdoberfläche in optischen und Radarsatelliten-Zeitreihen (WeMonitor)
Ziele und Schwerpunkte
Mit den jüngsten Satellitenmissionen und neuen Konzepten wie dem Copernicus-Programm und der Planet Labs-Flotte hat ein goldenes Zeitalter für die Erdbeobachtung begonnen. Wir haben Zugang zu sehr großen und ständig wachsenden Datenmengen von Satellitenbild-Zeitreihen (engl.: satellite image time series: SITS) auf globaler Ebene, die es ermöglichen, globale Anwendungen mit einer noch nie dagewesenen räumlichen Auflösung und Wiederholungsrate in Angriff zu nehmen. Sie ermöglichen nun die Beobachtung kleinräumiger und schneller Veränderungen an der Erdoberfläche. Solche raum-zeitlichen Anomalien der Erdoberfläche werden häufig durch natürliche oder vom Menschen verursachte Katastrophen verursacht, wie z. B. Hangrutschungen, Entwaldung, Dammbrüche, Brände, Vulkanausbrüche und illegale Müllkippen, die sich aufgrund ihrer Schnelligkeit deutlich von langfristigen und saisonalen Dynamiken unterscheiden.
Ausgehend von zwei beispielhaften Anwendungen (Hangrutschungen und Müllkippen) von raum-zeitlichen Anomalien in SITS werden wir eine generische Deep-Learning-Architektur entwickeln, die interdisziplinär in den HGF-Forschungsbereichen "Erde und Umwelt" (GFZ) und "Luftfahrt, Raumfahrt und Verkehr" (DLR) trainiert und angewendet werden kann.
Die Algorithmen müssen jedoch so effizient und übertragbar sein, dass sie auch für die großflächige Überwachung von zahlreichen Gebieten eingesetzt werden können. Trotz des Erfolgs bestehender Deep-Learning-Modelle für die Erkennung von Anomalien schränkt der Mangel an relevanten und großen Trainingsdatensätzen derzeit ihre Anwendbarkeit in vielen Anwendungsbereichen ein. Außerdem können die meisten Modelle nur mit multitemporalen Fernerkundungsdaten aus einer einzigen Datenquelle umgehen und schöpfen den potenziellen Wert von Fernerkundungszeitreihen aus mehreren Quellen (z. B. optische und SAR-Daten) nicht vollständig aus. Darüber hinaus besteht das Problem "ein Datensatz, ein Modell", was bedeutet, dass ein Modell zur Erkennung von Anomalien für verschiedene Regionen, Landschaften oder sogar Bildszenen neu trainiert werden muss, was die Übertragbarkeit und Verallgemeinerungsfähigkeit beeinträchtigt. Um diese Unzulänglichkeiten zu überwinden, konzentriert sich unser Projekt auf drei Hauptziele:
A) Entwicklung interaktiver Methoden zur Datenannotation im Rahmen einer aktiven Lernstrategie zur Verbesserung des Trainings schwach überwachter Deep-Learning-Modelle;
B) Implementierung von Transfer-Learning-Algorithmen, um von den Ähnlichkeiten der Erkennung räumlich-zeitlicher Anomalien in verschiedenen Forschungsbereichen zu profitieren;
C) Entwicklung effizienter multimodaler Lernmethoden, um den komplementären Informationsgehalt multimodaler Datenquellen für die Erkennung raum-zeitlicher Anomalien in SITS zu nutzen.
Die folgenden Hauptergebnisse werden erwartet:
- Code: Open-Source-Verfügbarkeit auf gitlab/github,
- Datenveröffentlichungen: Trainingsdaten für Erdrutsche und Mülldeponien,
- Datensatz: annotierte SITS,
- Datensatz: resultierende Erdrutschinventare und Deponieerfassungen,
- Wissenschaftliche Veröffentlichungen.