Datenzentren
Erfassen von Primärdaten
Das Datenzentrum des GFZ kann auf einige Jahre Erfahrung bei der Erfassung von Primärdaten zurückblicken. Seit 1998 wird dafür das Drilling Information System (DIS) eingesetzt, das in Zusammenarbeit von DRZ, ICDP Operational Support Group und der Firma smartcube entwickelt wurde. Im Rahmen der Planungsarbeit der Joint European Ocean Drilling Initiative (JEODI) hat der British Geological Survey Interesse bekundet, das Drilling Information System zur Erfassung der Primärdaten im europäischen Teil des Integrated Ocean Drilling Program (IODP) zu verwenden.
Das Drilling Information System ist als allein betriebsfähiges Datenbanksystem aufgebaut, das über eine Schnittstelle zum ICDP-Data Warehouse verfügt. Das DIS ist als elektronischer Werkzeugkasten konzipiert, der bereits eine große Anzahl von Basiskomponenten und Datenmuster (Templates) bereitstellt. Es kann dann für das jeweilige Projekt den spezifischen Anforderungen wissenschaftlicher Bohrungen im kontinentalen Bereich entsprechend in ein individuelles Projekt-DIS überführt werden. Dieses angepasste DIS begleitet das Projekt von der Bohrphase, über die Laborphase bis hin zur offiziellen Veröffentlichung. In allen Phasen werden die Informationen und Daten unmittelbar nach ihrer Erfassung über das ICDP-Data Warehouse den Projektteilnehmern (Science Team) zur Verfügung gestellt.
Langzeitarchivierung von Daten
Auf der internationalen Ebene haben die World Data Center (WDC) des International Council of Scientific Unions (ICSU) die Aufgabe der langfristigen Datensicherung übernommen. Einrichtungen, die ein Weltdatenzentrum betreiben wollen, müssen die langfristige Nutzbarkeit der Datenarchive garantieren. In Deutschland haben das System PANGAEA des AWI/MARUM und das Deutsche Fernerkundungsdatenzentrum der DLR den Status von Weltdatenzentren. WDCs beschränken sich nicht nur auf die langfristige Archivierung von Daten und Sicherung des Zugangs zu diesen, sondern bieten zunehmend auch die Funktionalität eines Dateninformationssystems.
WDC-MARE/PANGAEA ermöglicht die Erfassung von Raum/Zeit-orientierten Daten aus der naturwissenschaftlichen Grundlagenforschung. Die allgemeine Verfügbarkeit über das Internet entspricht dem Stand des heute technisch Möglichen. Das System beinhaltet in seinem gegenwärtigen Stand über 146000 geologische und hydrographische Stationen aus allen Weltmeeren und ca. 27000 Datensätze.
Aufgabe des WDC-MARE ist das Sammeln, Prüfen und Verbreiten von Daten aus den Gebieten globaler Umweltveränderungen, Ozeanographie, Meeresgeologie, Paläozeanographie und Meeresbiologie. Der Focus liegt dabei auf georeferenzierten Daten, die im PANGAEA System vorgehalten werden. Die Daten können vom Nutzer über verschiedene Internet-Gateways abgerufen werden. Ebenso können Daten von Nutzern zur Speicherung in WDC-MARE übergeben werden. Darüber hinaus ist PANGAEA auch offizielle mirror site des Ocean Drilling Program und hält außerdem eine große Zahl Daten aus DSDP/ODP-Kernen bereit. Mit dem zukünftigen IODP ist die Zusammenarbeit geplant.
Für das seit 1996 operierende International Continental Scientific Drilling Program wurde am GFZ Potsdam ein Data Webhouse zur Langzeitsicherung der dort gewonnenen Daten aufgebaut. Das System besteht aus zwei Komponenten, dem ICDP-Clearinghouse und dem eigentlichen ICDP-Data Warehouse. Das ICDP-Clearinghouse ist ein Katalogsystem, in dem Metadaten über Daten und Dokumente gespeichert sind und recherchierbar gemacht werden. Es übernimmt die Rolle eines Portals und Datenrepositoriums. Das ICDP-Data Warehouse dient der integrierten Evaluierung und Analyse von Bohrungsdaten und wissenschaftlichen Ergebnissen.
Geowissenschaftliche Portale und Mehrwertdienste
Das Datenzentrum des GFZ und die Operational Support Group ICDP (OSG) betreiben seit 1998 ein Clearinghouse als Portal zum ICDP Information Network. Hier können über das Internet Informationen über ICDP Projekte, und solche, die mit Unterstützung der OSG durchgeführt wurden, abgerufen werden. Zusätzlich zu einer direkten Navigation über die einzelnen ICDP Lokationen steht auch ein mehrdimensionales Suchwerkzeug zur Verfügung. Der Nutzer kann entlang der Dimensionen "Fachbereich" (domain), "Text" (keywords), "Raum" (space), "Zeit" (time), und "Paläo-Zeit" (stratigraphy) sein Suchprofil iterativ aufbauen und anhand der Suchergebnisse verfeinern. In allen der Dimensionen steht ein Thesaurus-basiertes Suchwerkzeug zur Verfügung.
Die Thesaurus-Technologie, auf die das ICDP-Portal zurückgreift, ist inzwischen durch das GFZ Datenzentrum, das MARUM und Stratigraphy.net gemeinsam weiterentwickelt worden mit dem Ziel, Thesauri als Webdienste über das Internet verfügbar zu machen.
Zur Verbesserung der Kommunikation in räumlich weit verteilten Forschergruppen betreibt das Datenzentrum des GFZ ein Online-Forum. Es handelt sich hierbei um ein lizenziertes kommerzielles Produkt (Jive Forum 2.5.2).
Stratigraphy.net ist eine Initiative zur Schaffung eines Informationsnetzwerks für Stratigraphie. Derzeit besteht in Stratigraphy.net ein Modul für die biostratigraphische Datierung und für die lithostratigraphische Beschreibung von stratigraphischen Einheiten. Das lithostratigraphische Modul wurde in Zusammenarbeit mit dem Institut für Geologie der TU Bergakademie Freiberg (Sachsen) entwickelt. Der paläontologische Thesaurus befindet sich bereits in der Testphase.
Im Rahmen des DFG-Schwerpunktprogramms ICDP hat das Datenzentrum des GFZ die Entwicklung einer paläontologisch-taxonomischen Datenbank beantragt. In diesem Projekt soll durch einen Online-Speziesatlas und eine taxonomische Datenbank die Bestimmung von Diatomeen im Baikalsee verbessert und vereinheitlicht werden, um Daten aus paläoklimatischen Transferfunktionen vergleichbar zu machen.
Das WDC-MARE/PANGAEA System ist für die Erfassung von Datensätzen aus der Klima- und Umweltforschung vorgesehen. Hierbei wird vorerst ein Schwerpunkt auf historischen, geologischen und marinen Daten liegen. In diesem Rahmen wird angestrebt, alle auf den entsprechenden Gebieten arbeitenden Institute in Deutschland in das Netzwerk einzubinden. Neuen Projekten wird eine Nutzung angeboten. Suchwerkzeuge, die auf allen Ebenen die gleiche Funktionalität aufweisen, erlauben die Extraktion beliebiger Teilmengen von Daten. Zum Export von Datensätzen stehen Abfrage- und Konfigurationswerkzeuge zur Verfügung, die nach einem einheitlichen Schema eine Verknüpfung beliebiger Felder mit variablen Bedingungen und Formaten erlauben. Suchwerkzeuge auf der Primärdaten-Ebene erlauben komplexe Abfragen auch nach Teilmengen größerer Datensätze (z.B. Raum/Zeitscheiben) und den Export in Verbindung mit Metainformationen.
Als weitere Dienstleistungen bietet WDC-MARE die Bereitstellung und Spiegelung elektronischer Veröffentlichungen an sowie Software-Produkte zur Analyse, Visualisierung und Transformation von Daten an.
Derzeit bereitet eine vom Deutschen Klimarechenzentrum und vom Daten- und Rechenzentrum des GFZ über den Deutschen Landesausschuss von CODATA initiierte Projektgruppe ein Pilotprojekt zum Thema "Publikation und Zertifizierung von wissenschaftlichen Daten" vor. Gleichzeitig wird die erste kommerzielle Zertifizierungsstelle für Geodaten aufgebaut. Nach ihrer Akkreditierung entspricht der Status dieser Institution einem "TÜV" für Geodaten.