Helmholtz-Zentrum Deutsches Geoforschungszentrum

Big Data Analytics and XAI Group

Wir sind ein Team von Informatikern mit mehr als 15 Jahren Erfahrung in der Entwicklung von Methoden zur Datenexploration und -analyse für interdisziplinäre Forschungsprojekte. Wir konzentrieren uns auf zwei Hauptbereiche: Big-Data-Analytik Erklärbare Künstliche Intelligenz (XAI).

Unsere Gruppe spezialisiert sich auf explorative Datenanalyse, die die Rechenleistung der Datenanalytik mit der menschlichen Fähigkeit zur visuellen Mustererkennung kombiniert. Diese Integration ermöglicht es Wissenschaftlern, große Datenmengen und Aspekte von ML-Modellen interaktiv und effektiv zu erkunden, zu analysieren und zu verstehen.

Unsere Forschung ist in der Informatik verwurzelt, aber wir entwickeln unsere Methoden in enger Zusammenarbeit mit den Anwendern der Methoden. Zur Entwicklung unserer Methoden führen wir einen Dialog mit Wissenschaftlern durch, indem wir eine Benutzer- und Aufgabenanalyse durchführen.

Big Data Analytics

Big Data Analytics ist ein wichtiges Werkzeug in der aktuellen wissenschaftlichen Forschung, das es Wissenschaftlern ermöglicht, mehr Wert aus den zunehmenden Mengen wissenschaftlicher Daten zu ziehen, indem sie fortschrittliche analytische Techniken neben traditionellen statistischen Erkenntnissen einsetzen. Unsere Forschung wird durch praktische wissenschaftliche Anwendungen in Bereichen wie Fernerkundung, Modellierung von Fluidsystemen und Erdmodellierung vorangetrieben. Unsere Forschungsrichtungen sind:

Identifikation von Beziehungen zwischen heterogenen Daten

Geowissenschaftler nutzen Daten von Sensoren, Geoarchiven (wie Bohrkerne) und Simulationen. Die Daten beschreiben Prozesse auf unterschiedlichen Skalen in Raum und Zeit mit verschiedenen Variablen. Die von uns entwickelten Methoden erleichtern  die integrierte Analyse von heterogenen Daten und den Vergleich von Daten aus verschiedenen Quellen.

Forschung & Technologien:

Extraktion von relevanten Informationen aus großen Datensätzen

Simulationsmodelle und Beobachtungssysteme generieren umfangreiche Datensätze. Unsere Methoden unterstützen Wisschenschaftler dabei relevante Informationen aus großen Datenmengen zu extrahieren.

Forschung & Technologien:

Exploration von mehrdimensionalen Daten

Wichtiger Bestandteil geowissenschaftlicher Forschung ist das Verständnis von mehrdimensionalen Daten. Wir entwickeln Lösungen für die räumliche und zeitliche Datenexploration um relevante Informationen in diesen mehrdimensionalen Daten erkennen zu können.

Forschung & Technologien:

Erklärbare Künstliche Intelligenz

Die Integration von ML in wissenschaftliche Forschung wird häufig durch die undurchsichtige Natur vieler ML-Modelle und die Komplexität ihrer Anwendung behindert. XAI-Methoden helfen, diese Barrieren zu überwinden, indem sie die undurchsichtige Natur des ML-Modells transparenter machen. Wissenschaftler können das entwickelte Modell mit größerem Vertrauen nutzen. Wir entwickeln XAI-Methoden, um ML für Geowissenschaftler transparenter zu machen. Unsere Forschungsrichtungen sind:

Model-agnostische XAI-Methoden: Erklärung verschiedener Aspekte von Black-Box-ML-Modellen

Unser Fokus liegt darauf, die inneren Arbeitsweisen von maschinellen Lernmodellen durch modellagnostische Methoden zu erklären. Indem wir uns auf modellagnostische XAI-Techniken konzentrieren, streben wir danach, Einblicke in Black-Box-Modelle zu ermöglichen, unabhängig von ihrer zugrunde liegenden Architektur.

Forschung & Technologien:

  • HSExplorer ermöglicht es Geowissenschaftlern, Änderungen an den Eingabedaten zu testen und zu beobachten, wie sich diese Veränderungen auf die Modellantworten auswirken, um Einblicke in das Verhalten des Modells unter verschiedenen Szenarien zu gewinnen.

Modellspezifische XAI-Methoden

Fortgeschrittene ML-Modelle wie Transformers, Autoencoder und Reservoir-Computing-Modelle sind wichtig für die Analyse komplexer räumlicher, zeitlicher und dynamischer Systeme in den Geowissenschaften. Diese ML-Modelle weisen einzigartige architekturale Merkmale und Lernprozesse auf. Die Entwicklung von modellorientierten XAI-Techniken, die auf diese spezifischen Eigenschaften zugeschnitten sind, kann relevantere und aufschlussreichere Erklärungen liefern.

XAI-Methoden zur Transparenz bei der Entwicklung von ML-Modellen

Um ML-Modelle in geowissenschaftlicher Forschung einzusetzen, müssen Wissenschaftler mehrere Schritte unternehmen: Daten bereinigen und vorbereiten, relevante Merkmale und Architekturen auswählen, das Modell trainieren, um optimale Hyperparameter-Konfigurationen zu finden, und das resultierende Modell testen und evaluieren. Die Komplexität dieser Phasen macht den ML-Pipeline oft undurchsichtig und erfordert ein hohes Maß an ML-Expertise, das vielen Wissenschaftlern möglicherweise fehlt. Unser Ziel ist es, diesen Prozess transparenter zu gestalten, um Geowissenschaftlern zu ermöglichen, das Vertrauen in die Anwendung von ML-Methoden in ihrer Forschung zu gewinnen.

Forschung & Technologien:

  • HPExplorer unterstützt Geowissenschaftler dabei, den Hyperparameter-Raum zu erkunden, indem stabile Regionen identifiziert werden, in denen ML-Modelle eine konsistente Leistung zeigen. Dies wird durch eine Analyse der Hyperparameter-Importanz ergänzt, um das Verständnis für die Auswirkungen jedes Parameters zu verbessern.

XAI-Methoden zur Erklärung von Kausalität

Konventionelle ML-Modelle sind oft gut darin, Muster und Assoziationen in Daten zu finden, haben jedoch Schwierigkeiten, die zugrunde liegenden kausalen Beziehungen zu erfassen. Die Erforschung von Kausalität in XAI ist besonders wichtig für Geowissenschaftler, da sie ihnen ermöglicht, die zugrunde liegenden Ursache-Wirkungs-Beziehungen innerhalb ihrer Daten zu verstehen.

ClarifAI Plattform

ClarifAI integriert die XAI-Methoden unserer Forschungsgruppe in eine zusammenhängende Plattform. Seine benutzerzentrierte Designphilosophie verbessert die Benutzerfreundlichkeit und vereinfacht die Anwendung von XAI-Methoden für Geowissenschaftler ohne höhe Expertise in ML. Das strategische Ziel von ClarifAI ist es, eine umfassende XAI-Pipeline zu entwickeln, die eine detaillierte, schrittweise Anleitung durch die Transparenzherausforderungen des gesamten ML-Modell-Lebenszyklus bietet. Diese Pipeline soll Geowissenschaftler mit den wesentlichen Werkzeugen ausstatten, um ML-Methoden in ihrer Forschung mit größerem Selbstvertrauen einzusetzen.

zurück nach oben zum Hauptinhalt