Semantische Werkzeuge - Neue Ansätze gestalten die Zukunft

Ein völlig neues Werkzeug stellte Bill Inmon für die Behandlung von unstrukturierten Daten vor. In allen Unternehmen gibt es zahlreiche Dokumente, wie E-Mails, Word-Dokumente, PDF’s und vieles mehr, die nicht strukturiert sind und daher auch nicht für Auswertungen im Sinne eines Data Warehouse verwendet werden können. Mit Anwendung von Textual-ETL können diese Daten ebenfalls in das Data Warehouse geladen werden und stehen dort für Auswertungen und Analysen zur Verfügung.

semCockpit

Auch solvistas forscht im DWH-Umfeld und arbeitet gemeinsam mit der Linzer Johannes Kepler Universität an einem Projekt zum Thema Semantische Cockpits. Dabei sollen Cockpits und Dashboards durch semantische Technologien die AnwenderInnen bei der Analyse der Daten unterstützen.

Begriffserklärung

Um die beiden Werkzeuge besser einordnen zu können, möchten wir einen kurzen Überblick über die Begriffe Taxonomie, Thesaurus und Semantik/Ontologie geben.

Taxonomie:

In der Taxonomie wird ein hierarchisches System von Kategorien und Klassen erstellt. Dabei wird jede Klasse nur einer Oberklasse zugeordnet, wodurch sich eine einheitliche Baumstruktur ergibt. Als Beispiel wird ein Hund der Ordnung der Raubtiere, der Klasse der Säugetiere, usw. zugeordnet.

Thesaurus:

Bei Thesaurus handelt es sich um ein Wort-Netz, in dem Begriffe durch Relationen miteinander verbunden sind. Es ist eine systematisch geordnete Sammlung von Begriffen, die eine thematische Beziehung zueinander haben. Diese Thesaurus Anwendung kennt man von Word, in dem Synonyme - also Ober- und Unterbegriffe - für das ausgewählte Wort vorgeschlagen werden.

Semantik/Ontologie:

Lesen Sie mehr zu diesem Thema in den nächsten Ausgaben unseres Newsletters.