3 Buzzwords zum Thema Open Data

Was ist Open Data eigentlich?

Open Data beschreibt im wörtlichen Sinne Daten, die von jedermann und ohne weitere Einschränkungen frei genutzt, weiterverbreitet und weiterverwendet werden dürfen.

Die Idee hinter Open Data ist, Synergien über den freien Zugriff auf Daten zu schaffen, die eine völlige Transparenz und die Zusammenarbeit mit diesen Daten schaffen könnten.

Denkbar wäre im touristischen Umfeld, dass sich jeder vor allem auf die Datensätze konzentrieren kann, bei denen er offensichtlich über das meiste Wissen verfügt. Also die Daten, die sich innerhalb seiner Destination befinden. Diese reichert er dann mit den Daten an, die um diesen Wissenskreis liegen und für die wiederum andere das offensichtlich größte Wissen haben.

Für uns ist Open Data grundsätzlich kein neues Thema mehr, da wir per se schon immer offen mit unserer Architektur, Denkweise und unseren Schnittstellen umgegangen sind. Daher sind wir von den Veränderungen im Markt weniger betroffen als andere Marktbegleiter, die mit ihren Daten bis jetzt komplett oder teilweise verschlossen umgegangen sind. Im Folgenden erklären wir den Hintergrund zu 3 Buzzwords , denen man in Bezug auf Open Data derzeit öfter begegnet: Lizenzenschema.org und linked open data.

BUZZWORD No. 1: Lizenzen - was muss ich hier beachten?

Seit 2001 veröffentlicht die Organisation Creative Commons unter dem Kürzel CC verschiedene Standard-Lizenzverträge, die die Nutzungsrechte hinter den Werken eines Urhebers festlegen. Diese Lizenzen schränken die Nutzung entweder recht stark ein oder befreien ein Werk sogar ganz von entsprechenden Einschränkungen.

Worauf muss ich achten, wenn ich meine Inhalte für den jeweiligen Vermarktungskanal, in dem Fall Open Data, freischalten möchte?

Für die Veröffentlichung von Inhalten im Bereich Open Data benötigt das Werk mindestens eine CC-BY-Lizenz, besser sogar eine CC-O-Lizenz. Diese Lizenzen erlauben die Nutzung der Inhalte im Sinne von Open Data, also eine freie Nutzung, Weiterverarbeitung oder Weiterverwendung. Im Falle von CC-BY mit der zusätzlichen Nennung des Urhebers.

Da die Rückverfolgung ab einem gewissen Grad der Verbreitung schwierig werden könnte, empfehlen wir darauf zu achten, dass Inhalte und Werke (bspw. Fotos) über eine CC-0-Lizenz verfügen.

Wenn ich eine CC-O-Lizenz für meine Inhalte habe, was dann?

Open Data, also in gewisser Weise ein Datenpool mit für die Allgemeinheit offenen Daten, ist auch nur ein weiterer Vermarktungskanal für touristische Inhalte. Um meine Daten also in diesen Vermarktungskanal einzuspeisen, müssen diese gewisse Strukturen aufweisen.

Für die Strukturierung meiner Daten benötige ich ein Redaktionssystem, in dem ich offene Daten erfassen kann.

Solche Systeme verfügen über einheitliche Eingabefelder für Daten gleicher Kategorien (bspw. POI oder Wandertouren) und die Möglichkeit pro Datensatz die entsprechende Rechtestruktur bzw. Lizenzen zu erfassen. Damit wird dann geregelt, welcher Datensatz in den Open Data-Kanal ausgespielt werden darf und welcher nicht.

destination.data

Das Redaktionssystem von neusta

neusta bietet mit seinem Redaktionssystem destination.data ein System, das genau diese Voraussetzungen erfüllt und bei vielen Destinationen bereits im Einsatz ist. Mit der Pflege der Destinationsdaten in destination.data sind alle Weichen in Richtung Open Data gestellt.

Und wo finde ich jetzt diesen Open Data-Contentpool?

Destination.data ist mit einem eigenen Contentpool verknüpft, der sich „Vermarktung touristischer Grundversorgung“ nennt. Der Kunde kann diesen Pool zur Freigabe seiner Daten auswählen und somit einem großen Publikum als Open Data zur Verfügung stellen. Über das Portal http://www.touristische-grundversorgung.de steht eine frei zugängliche Open Data Plattform zur Verfügung, auf der Inhalte, die mit der CC-0 oder CC-BY Lizenz freigegeben sind, automatisch veröffentlicht werden.

BUZZWORD No. 2: Schema.org
Schema.org ist seit ein paar Monaten ein Begriff, der immer wieder im Zusammenhang mit Open Data genannt wird. Doch was versteckt sich eigentlich hinter schema.org?

Schema.org ist ebenfalls der Name einer Initiative, die sich damit befasst, dass Daten, die in Datenbanken strukturiert erfasst werden, einer einheitlichen Systematik folgen. Genauer gesagt die Ausgabe der Daten über eine Webseite. Diese Initiative wurde ursprünglich von den drei großen Suchmaschinen Google, Bing und Yahoo gegründet und derzeit durch die Unternehmen Google, Microsoft, Yahoo und Yandex finanziert.

Die Unternehmen hinter dem Begriff schema.org lassen bereits erkennen, in welche Richtung der Sinn der Initiative geht. Alle Unternehmen betreiben große Internetsuchmaschinen und haben ein Interesse daran, dass Daten einer einheitlichen Systematik folgen, damit die Suchmaschinen für bestmögliche Suchergebnisse auf Basis dieser Daten sorgen können.

Aber was heißt das für mich? Ich will doch, dass die Leute auf meine Destinationsseite kommen.

Haben Sie schon mal den Begriff SEO gehört? Vermutlich schon. Im Grunde machen wir die letzten Jahre nichts anderes. Wir optimieren die Inhalte unserer Destinationsseiten dahin, dass Google und andere Suchmaschinen unsere Seite bestmöglich darstellen. Und diese urteilen auf Grund der Qualität der Inhalte auf unseren Seiten.

Mittlerweile hat Google für viele Dinge bereits eine eigene Ausgabemöglichkeit geschaffen, wie Informationen schnell und kompakt direkt bei den Suchergebnissen dargestellt werden können. Erst wenn man weiterführende Informationen benötigt wird auf die jeweilige Quellseite weitergeleitet.

Daher ist der nächste logische Schritt, dass wir mit der Strukturierung und der sogenannten schema.org-Annotation (aus dem lateinischen für Anmerkung) unsere Daten soweit aufbereiten, dass wir Google unsere Destinationsdaten bestmöglich zur Verfügung stellen und zur Quelle der Wahl für Informationen werden, zu denen wir Wissen haben.

Das Internet spricht viele Sprachen

Bildlich gesprochen ist schema.org dabei nur eine eigene Sprache. Eben die Sprache der vier großen Suchmaschinen. Und wie wir es auch aus der realen Welt kennen, gibt es auch in der digitalen Welt mehrere Sprachen. Diese Sprachen unterscheiden sich beispielsweise in der Bezeichnung von Feldern innerhalb der strukturierten Datenbanken. In destination.data kann man zum Beispiel Veranstaltungen pflegen, in der Sprache von schema.org heißt der gleiche Datensatz event. Schema.org spricht beispielsweise auch von der Kategorie Lodging Business mit den Unterkategorien Motel, Hotel, Hostel und BedAndBreakfast. In destination.data würden Destinationen Hotels, Ferienwohnungen, Pensionen und Jugendherbergen pflegen.

Mit der automatischen Annotation, die bei der Datenausgabe in destination.data hinterlegt ist, werden die passenden Felder automatisch so verknüpft, dass die Suchmaschinen die richtigen Informationen auf ihre Suchanfragen erhalten.

Wer sich nicht sicher ist, wie seine Daten aktuell aufgestellt sind, der kann das mit dem kostenlosen Test-Tool von Google ganz einfach überprüfen. (ein konkretes Beispiel in Verbindung mit unserem Produkt destination.pages siehe hier). Hier kann man sehen, ob und wie weit die Daten bereits gemäß schema.org annotiert sind.

neusta fact

Wir prüfen kontinuierlich die neuesten verfügbaren Annonationen und sind selbst in Gremien vertreten welche schema.org im Tourismus weiterentwickeln. Somit können wir für unsere Kunden sicherstellen, dass sie automatisch auf dem aktuellsten Stand sind und sich destination data verlässlich kontinuierlich und automatisch weiterentwickelt.

BUZZWORD No. 3: Linked Open Data

Mit Linked Open Data wird die Idee von Open Data, dass Daten gemeinschaftliche zur freien Verfügung stehen, aufgegriffen und logisch weitergedacht. Wie der Name schon sagt, geht es in diesem Schritt um die sinnvolle Verknüpfung der offenen Daten im world wide web.

Daten, die wir in unserem touristischen Umfeld erfassen müssen nicht nur für uns im Tourismus und unsere Gäste interessant sein. Es macht durchaus Sinn, Daten oder ganze Datensätze sinnvoll zu verknüpfen.

Beispiel: mögliche verknüpfte Datensätze im Kontext Wanderweg
  • GPX-Track des Wanderweges inkl. Höhenprofil und Streckendaten
  • Titel und Beschreibungstext
  • POI entlang des Tracks
  • Gastronomie entlang des Tracks
  • Übernachtungsbetriebe entlang des Tracks
  • ÖPNV-Infrastruktur entlang des Tracks
  • Öffentliche Toiletten entlang des Tracks
  • Wetterdaten
  • Schneeberichte/Lawinendaten
  • Frequentierung an Hand von Mobilfunkdaten
  • Bilder der Route gesammelt aus zahlreichen Quellen
  • Parkplätze
  • E-Ladestationen

Man sieht also, dass viele Daten, die möglicherweise nicht mal über die Destination erfasst werden oder dieser nicht mal zur Verfügung stehen durchaus interessant für einen Gesamteindruck sind. Diese Verknüpfung erfolgt auch Branchenübergreifen, beispielsweise POI-Daten in den Navigationsgeräten im Auto.

Aber wie machen wir jetzt aus Open Data auch noch Linked Open Data?

Dieses Problem wird über die Ausgabe aus destination.data automatisch gelöst, da schema.org bereits ein verlinktes Datenformat ist. Das heißt, ab dem Zeitpunkt, ab dem unsere Daten mit schema.org bereitgestellt werden, fließen sie auch vollautomatisch in ein entsprechendes Graphmodell, das auf schema.org basiert.

Quick Open Data Checklist (für destination.data-User):

  1. In destination.data einloggen und Inhalte definieren, die man in Open Data bereit stellen möchte
  2. Alle Datensätze kontrollieren und die jeweilige Lizenzstruktur, mit der Daten bereit gestellt werden sollen, auswählen
  3. Darauf achten, dass Webseiten mit schema.org annotiert sind, damit die Daten frei verfügbar sind.