Ausbildung bei FIZ Karlsruhe

KnowEsis Mapping-Dienst

Um die heutige Vielfalt an digitalen Objekten zu bewältigen, ist die Menge der Informationen in Form von Metadaten stark angewachsen, damit diese Objekte effizient verwaltet und aufgefunden werden können. Außer beschreibenden Metadaten für bibliografische Angaben benötigt man häufig auch technische oder strukturelle und administrative Metadaten.
Als Mapping bezeichnet man den Prozess, Datenelemente aus zwei verschiedenen Datenmodellen aufeinander abzubilden. Bei vielen Arten der Datenintegration wird Datenmapping häufig als erster Schritt verwendet.
Ein wichtiger Aspekt ist die Vereinheitlichung von Daten, die viele Vorteile bietet:

  • die Vereinfachung interner Arbeitsabläufe
  • innovative Anwendungen auf Basis heterogener Quellen, z.B. Mashups (Erstellung neuer Inhalte durch Kombination bereits bestehender)
  • Datenanalyse und -visualisierung durch Angleichung semantischer Differenzen

Als Anbieter und Host von bibliografischen, Patent- und Volltextdatenbanken muss FIZ Karlsruhe viele verschiedene Eingabeformate der Datenproduzenten verarbeiten können. Kurzfristig vorgenommene Änderungen an den Metadaten-Schemata oder der Kodierung sind keine Seltenheit und müssen sehr schnell berücksichtigt werden, um die Datenbanken aktuell zu halten. Daher haben wir schon lange eine Spezialistengruppe für das Mapping und die Datenumwandlung eingesetzt, die u.a. aus Bibliothekaren, Informationsfachleuten und Softwareentwicklern besteht.
Die Abbildung von vielen, oft firmeneigenen Eingabeschemata auf ein allen Datenbanken von FIZ Karlsruhe gemeinsames Schema gehört zum Tagesgeschäft. Unerlässlich hierfür ist die Kenntnis von Standards wie MARC und Dublin Core und der Anwendung von geeigneten Software-Werkzeugen. Unsere Zielschemata sind in XML erstellt und wir verwenden XSLT und Java zur Datenumwandlung. Wir besitzen ausgezeichnete Fachkenntnisse im Umgang mit Patentdokumenten und mit Chemiedokumenten:

  • Migration von vorhandenen Sammlungen in ein gut organisiertes Repository
  • Analyse von Datenformaten
  • Erstellung von Abbildungsregeln
  • Vereinheitlichung und Abbildung auf Standardformate