DataHub
Der DataHub ist eine zentrenübergreifende, integrative Initiative mit Beteiligung der sieben Forschungszentren des Forschungsbereichs Erde und Umwelt in der Helmholtz-Gemeinschaft und im gemeinsamen Forschungsprogramm des Forschungsbereich verankert, um die bisher getrennten Daten der marinen, terrestrischen und atmosphären Forschung sowie ihren Querschnittsfeldern in einer offenen, interoperablen Informationsinfrastruktur (Hub) zusammenzuführen. Die Daten des Forschungsbereichs werden so den FAIR-Prinzipien folgend zugänglich gemacht.
Als Querschnittsaktivität des Forschungsprogramms "Changing Earth" und Vermittler für datengetriebene Wissenschaften ist der DataHub ein wesentlicher Beitrag, um die Digitalisierung in der Forschung und den damit verbundenen kulturellen Wandel zu befördern. Die Werkzeuge und Services des DataHub sollen in den Topics des gemeinsamen Forschungsprogramms zentrenübergreifend im Forschungsbereich „Erde und Umwelt“ bei der wissenschaftlichen Arbeit mit Daten eingesetzt werden und helfen, die gestellten Forschungsfragen mit modernen IT-gestützten Methoden effektiv und effizient in PoF IV und V anzugehen.
Als zentrenübergreifende, vernetzte und interoperable Dateninfrastruktur mit einem auf die Forschung abgestimmten und ineinander verzahnten Angebot von digitalen Werkzeugen und Diensten liegt der Fokus auf der Integration und Verzahnung verschiedener digitaler Werkzeuge, deren Weiterentwicklung und Verankerung im produktiven Betrieb.
Der DataHub verfolgt das Ziel, den Zugang und das einfache Arbeiten mit Forschungsdaten kompartimenteübergreifend zu ermöglichen. Entwicklung und Betrieb fokussieren sich auf die drei wichtigen Aufgaben
- Bereitstellung von dezentral gespeicherten Daten in dem integrierenden Earth Data Portal (www.earth-data.de),
- Bereitstellung von Werkzeugen zur Einbindung von Forschungsdaten in eigene Arbeitsprozesse und -abläufe, sowie
- Stärkung des systematischen Forschungsdatenmanagements durch den Auf- und Ausbau durchgängiger, digitaler Prozesse von der Datenerhebung bis zur Archivierung.
Der DataHub bildet ein digitales Ökosystem, das die gemeinsame Nutzung von Forschungsdaten und die Zusammenarbeit zwischen Forschenden verschiedener wissenschaftlicher Disziplinen und Institutionen erleichtert. Hierfür bietet der DataHub verschiedene Werkzeuge nicht nur für die Verwaltung und den Austausch von Daten sondern auch für deren Annotation, Visualisierung und Analyse, um die Datenverarbeitung und -interpretation zu verbessern. Die Dateninfrastruktur mit deren digitalen Werkzeugen werden den gesamten Data Life Cycle vom Sensor bis zur Publikation abdecken und Forschende mit einem auf sie abgestimmten und ineinander verzahnten Angebot von Diensten bei den verschiedenen, aufeinander folgenden Arbeiten mit Forschungsdaten weitestgehend im Self-Service unterstützen und der Community im erdsystemwissenschaftlichen Bereich und darüber hinaus bereitgestellt.
Der DataHub ist eng eingebettet in den Aufbau der Nationalen Forschungsdateninfrastruktur (NFDI), sowie der European Open Science Cloud (EOSC). Darüber hinaus wird die Vernetzung mit anderen datenhaltenden Quellen im Bereich der Erdsystemwissenschaften, wie beispielsweise der nationalen Geodateninfrastruktur GDI-DE oder der nationalen Infrastruktur für marine Daten MDI-DE, vorangebracht.
Die Technologien des DataHub sind inzwischen so weit entwickelt, dass thematische Viewer für spezifische Forschungsfragen leicht umzusetzen sind. Exemplarische Workflows wurden für konkrete Anwendungsszenarien konzeptionell vorbereitet und exemplarisch umgesetzt, die eine Einbindung eigener Daten in Szenarienrechnungen ermöglichen, was die zukünftige Entwicklung digitaler Zwillinge vereinfacht. Ein automatisierter Zugriff auf Forschungsdaten (maschinenlesbar), wie er für Anwendungen unter Verwendung künstlicher Intelligenz benötigt wird, wurde ebenso exemplarisch umgesetzt.