PORTFOLIO

Projektdarstellungen auf der Webseite

Jedes von der Gebert Rüf Stiftung geförderte Projekt wird mit einer Webdarstellung zugänglich gemacht, die über die Kerndaten des Projektes informiert. Mit dieser öffentlichen Darstellung publiziert die Stiftung die erzielten Förderresultate und leistet einen Beitrag zur Kommunikation von Wissenschaft in die Gesellschaft.

Close

Linked (Open) Data – Von der Theorie zur Praxis

Redaktion

Für den Inhalt der Angaben zeichnet die Projektleitung verantwortlich.

Kooperation

Dieses von der Gebert Rüf Stiftung geförderte Projekt wird von folgenden weiteren Projektpartnern mitgetragen: Hochschule für Technik und Wirtschaft HTW Chur; Schweizerisches Institut für Informationswissenschaft SII; Institut für Photonics und ICT IPI-

Projektdaten

  • Projekt-Nr: GRS-049/14 
  • Förderbeitrag: CHF 120'000.00 
  • Bewilligung: 23.01.2015 
  • Dauer: 04.2015 - 08.2016 
  • Handlungsfeld:  Pilotprojekte, 1998 - 2018

Projektleitung

Projektbeschreibung

Öffentliche Verwaltungen publizieren grosse Mengen an Daten im Web. Viele dieser Daten sind wenig aussagekräftig, da sie isoliert sind. Ähnlich sehen sich Unternehmen damit konfrontiert, dass ihre Daten in unzähligen «Silos» liegen und nur ausgetauscht werden können, wenn aufwändige Schnittstellen erstellt werden. Linked (Open) Data ist ein Konzept, das verspricht, flexibler Verknüpfungen zwischen den Daten erstellen zu können, wodurch ihr Nutzen massiv gesteigert werden kann.

In dem Projekt haben wir je eine Linked Data-Applikation für offen zugängliche und für betriebliche Daten erstellt und den Prozess der Erstellung in Online-Handbüchern beschrieben. Die Handbücher und die Applikationen zusammen ermöglichen es Interessierten, das Potential einer Datenverwaltung mit Linked Data zu erkennen und den Aufwand zur Erstellung einer Applikation abzuschätzen.

Was ist das Besondere an diesem Projekt?

Bislang existieren noch wenig Quellen, die den erfolgreichen Einsatz von Linked (Open) Data in der Praxis verständlich darstellen. Zum einen ist das Konzept in der Literatur erst «theoretisch-experimentell» beschrieben, zum andern finden sich kaum Anwendungsbeispiele, die den potentiellen Mehrwert einer LOD-Lösung aufzuzeigen vermöchten.

Stand/Resultate

In unserem Projekt haben wir die obigen zwei Faktoren, die einer Durchsetzung des Linked-Data-Konzepts hinderlich sind, zwei Handbücher entgegengesetzt, in denen wir im Detail darstellen, wie eine Linked Open Data Applikation resp. ein Linked Enterprise Data System erstellt werden kann. Beide Handbücher richten sich an zwei unterschiedliche Zielgruppen: Einerseits können Informationsarchitekten oder Informationsverantwortliche in einer Institution nachvollziehen, welche konzeptionellen Schritte beim Aufbau einer solchen Umgebung zu gehen sind. Andererseits gibt es zu jedem Kapitel die Beilage ‚Protokoll der Realisierung‘ in der unsere Techniker zuhanden von Technikern ihre Realisierungen beim Aufbau der Applikationen protokollieren. Damit ist der Weg zu einer LOD resp. LED-Applikation ein wenig einfacher.

Die LOD-Applikation greift offene statistische Daten von Institutionen (konkret: Bibliotheken) auf und verlinkt diese mit anderen offenen Daten, um sie optimal zu kontextualisieren und daraus Erkenntnisse zu gewinnen. Wir haben Daten von OpenStreetmap, von Swisstopo und von Geonames beigezogen, um unsere Statistikdaten in einen geographischen Kontext zu stellen. Wir haben weiter Sozialdaten des Bundesamtes für Statistik beigezogen, um auch Zusammenhänge zur sozialen Zusammensetzung der Bevölkerung herzustellen. Lagen diese Daten nicht in RDF vor, haben wir sie konvertiert und in einem eigenen Triple-Store abgelegt. Daten, die über einen SPARQL-Endpoint zugänglich sind, haben wir so verlinkt.

Mit der LED-Applikation machen wir das Potential des Linked Data Ansatzes für die betriebsinterne Verwaltung von Daten deutlich. In der Applikation ist es gelungen,
- Mikrodaten von Partnerfirmen in das Informations-Ökosystem unserer fiktiven Firma zu integrieren und so eine Lösung zu entwickeln, wie deren Stammdaten jederzeit aktuell gehalten werden können.
- einen externen Thesaurus zur Entwicklung eines firmeneigenen Vokabulars zu nutzen und dieses zur Erschliessung sehr unterschiedlicher Daten einzusetzen.
- den Thesaurus zur Vereinheitlichung des Vokabulars zu verwenden, ohne die Partnerfirmen zur Übernahme eines kontrollierten Vokabulars zu verpflichten.
- Abfragen über Daten unterschiedlicher Herkunft zu ermöglichen und so selbst Daten bestehender relationaler Datenbanken aus ihren Silos zu befreien.
- die Daten so zu verwalten, dass auf diesen aufbauend jederzeit neue Funktionalitäten realisiert werden können.
Wir haben so gezeigt, dass die oft postulierte Flexibilität eines Linked Data Ansatzes realisierbar ist. Besonders wichtig für die Praxis ist, dass es möglich ist, bestehende Fachanwendungen weiterhin im Einsatz zu halten, die Daten aus diesen aber auch in einer flexiblen Linked Data Umgebung zu nutzen.

Im Laufe der Entwicklung der beiden Applikationen haben wir wichtige Erfahrungen gemacht, die wir weitergeben wollen, denn unser Projekt war begleitet von zahlreichen Überraschungen:
- Es hat sich gezeigt, dass die meisten Tools, die aktuell zur Verfügung stehen, aus Projekten stammen und noch nicht stabil funktionierten
- Linked Data ist eine Technologie, die theoretisch beschrieben und in Pilotprojekten realisiert ist. Bei der Umsetzung zeigt sich aber, dass noch sehr viel Informatikentwicklung notwendig ist, bis Applikationen realisiert werden können, die das Potential der Technologie real ausschöpfen.
- Die Analyse der Datenstruktur ist für den Aufbau einer LD-Umgebung wie für die Recherche in einer solchen entscheidend. Es braucht dringend Tools, die diese Analyse erleichtern.
- Komplexe Suchabfragen mit SPARQL zu erstellen ist nur Spezialisten möglich. Es gilt noch Hilfsmittel zu entwickeln, um einem breiteren Publikum ohne SPARQL-Kenntnisse zu ermöglichen, aus (natürlichsprachigen) Frageformulierungen automatisch adäquate SPARQL Queries zu generieren.
- Aufgrund der oft mangelhaften Datenqualität, ist der (intellektuelle) Aufwand zur Interpretation der Daten trotz dem Potential von Linked Data, erheblich.

Publikationen

Publikationen sind derzeit in Arbeit. Nennungen erfolgen zu einem späteren Zeitpunkt.

Links

Am Projekt beteiligte Personen

Prof. Dr. Niklaus Stettler, Projektleiter, Leiter Schweizerisches Institut für Informationswissenschaft SII, HTW Chur Prof. Bruno Wenk, stv. Projektleiter, Institut für Photonics und ICT IPI, HTW Chur
Michael Aschwanden, wissenschaftlicher Mitarbeiter, SII, HTW Chur
Elena Mastrandrea, wissenschaftliche Mitarbeiterin, SII, HTW Chur
Norman Süsstrunk, wissenschaftlicher Mitarbeiter, IPI, HTW Chur

Letzte Aktualisierung dieser Projektdarstellung  03.11.2019