SkoHub – kontrollierte Vokabulare (SKOS)

Das Simple Knowledge Organization System

Mit Hilfe kontrollierter Vokabulare können wir der Maschine jedoch sagen, dass es sich hierbei um dasselbe Fach handelt. Der Standard, der für das Anlegen und Pflegen solcher Vokabulare verwendet wird, nennt sich SKOS, Simple Knowledge Organization System (deutsche Einführung der DINI-KIM-AG). In Kurzform funktioniert es so: Es wird ein eindeutiger Identifier in Form einer URI für die Bezeichnung eines Items festgelegt (Bsp.: www.eine-persistente-url.de/mathematik). Diesem Identifier wird dann eine vorzugsweise verwendete Bezeichnung zugeordnet (Bsp: „Mathematik“@de –> das „@de“ bezeichnet die Sprache, in diesem Fall „Deutsch“). Dieses vorzugsweise verwendete Label nennt sich in SKOS „preferred Label“. Dieses Label gibt es dann für jede Sprache nur einmal. Damit weiß bspw. hinterher eine Webseite, dass sie dieses Label anzeigen soll. Außerdem können beliebig viele „alternative Labels“ für eine Sprache definiert werden. Hier könnte dann beispielsweise „Mathe“@de als umgangssprachliche Bezeichnung für das Fach „Mathematik“ in Deutschland definiert werden.

Das Hochschulbibliothekszentrum NRW (HBZ) hat zur Erstellung und Veröffentlichung solcher Vokabulare Tools entwickelt (http://skohub.io). Mit Hilfe dieser Tools können Vokabulare erstellt und im Internet unter einer URL veröffentlicht werden( Beispiel: vocabs.openeduhub.de). Besonders nützlich an diesem Tool ist, dass neben einer schönen menschenlesbaren Repräsentation der Vokabulare auch eine maschinenlesbare Repräsentation angefertigt wird. Dies bedeutet, dass in einem Crawling-Prozess die Maschine sich zunächst die möglichen Bezeichnungsarten einlesen kann und anschließend, wenn es ein Repositorium mit Lerninhalten durchsucht, die Werte dort mit dem Vokabular abgleicht.

Findet der Crawler nun beispielsweise die Bezeichnung „Mathe“ auf der Webseite, weiß die Maschine: „Ah, „Mathe“ ist ein alternativer Begriff für das Item mit dem Identifier „www.eine-persistente-url.de/mathematik“. Der Crawler speichert nun statt des Wertes „Mathe“ die URL und so kann die Webseite hinterher auf die URL schauen und sich das „preferred Label“ zur Bezeichnung des Eintrags holen. Diese Vorgehensweise besitzt den ungemeinen Vorteil, dass die Webseite stets die aktuelle Bezeichnung hat, selbst wenn sich das „preferred Label“ einmal ändern sollte. Es ist eben nur die Referenz zu dem Wert gespeichert, nicht aber der Wert selbst.

Erarbeitung und Veröffentlichung kontrollierter Vokabulare

Im Rahmen der Community Arbeit von Jointly sollen solche kontrollierten Vokabulare erstellt werden, damit künftige Infrastrukturen auf diese Wertelisten zugreifen können. Es bietet sich an, dass für dieses Vorhaben die Tools des HBZ genutzt werden. Die Entwicklung soll dabei auf der Plattform Github stattfinden, damit der Entwicklungsprozess öffentlich einsehbar und gestaltbar ist. Außerdem wird die Entwicklung der Wertelisten in der OER-Metadatengruppe bekannt gemacht. Eine weitere Einbeziehung von Community-Mitgliedern wird angestrebt.

Zur Übersicht