Integrator

Der Integrator hat die Aufgabe Daten aus verschieden Portalen zusammenzuführen, zu bereinigen, zu vereinheitlichen für eine spätere Nutzung in Anwendungsprogrammen oder Portalen zur Verfügung zu stellen. Die Zusammenführung und Aufbereitung der Metadaten erfolgt entsprechend einer Prozesskette wie sie aus der Data-Warehouse-Technologie bekannt (Abb.1) ist.

Im konkreten Fall einer Zusammenführung von Tourismus-Daten aus dem Tourism Data Hub und Metadaten aus den Kultureinrichtungen wie sie in Museum.digital verwaltet werden, erfolgt der Datenabgleich über eine Georeferenzierung. Nach Datenbereinigung und Datenzusammenführung können die Daten in einer Karte betrachtet werden. Zur Verwaltung der Metadaten und deren Beziehungen wird im Integrator Semantic Web-Technologien (RDF-Triple-Store) und NoSQL-Datenbanktechnologie verwendet. Die Bereitstellung der integrierten Metadaten erfolgt über SPARQL-Endpoints.

Nach einer erfolgreichen Datenintegration kann neben der Georeferenzierung mit automatisierten semantischen Verfahren weitere Datenanalysen durchgeführt werden, um anwendungsspezifische Anforderungen zu erfüllen. So können beispielsweise zeithistorische Dokumente für bestimmte touristische Ziele (Point of Interest POI) zusammengestellt werden.

Mit Hilfe des Integratorkonzeptes ist es möglich daten aus unterschiedlichen Portalen zusammenzuführen und für eine spätere anwendungsspezifische Nutzung aufzubereiten. Dabei spielt die Datenqualität eine entscheidende Rolle.