„Big Data Visualisierungen für multidimensionale Daten im Usability-Check“

Lisa Perkhofer und Hofer Peter

Bildschirme mit verschiedenen DarstellungenDas Projekt USIVIS – User-Centered Interactive Visualization for Big Data – hat zum Ziel, Informationen (vor allem im Zusammenhang mit großen strukturierten und semi-strukturierten Datenmengen) über geeignete und interaktive Visualisierung für den Benutzer zugänglich zu machen.

Dabei steht das benutzerzentrierte Design und das Definieren von geeigneten Interaktionskonzepten für ein intuitives Bedienen an oberster Stelle. Ein wesentlicher Erfolgsfaktor des Projekts liegt in der nahen Zusammenarbeit mit geeigneten Business Partnern und innovativen Unternehmen, aber auch im fakultätsübergreifenden Know-How Transfer. Während die Projektmitglieder aus der Fakultät für Informatik, Kommunikation und Medien (Hagenberg) den aktuellen Stand der Technik beherrschen und aktiv weiterentwickelt, ergänzen die Projektmitglieder der Fakultät für Management (Steyr) das Projekt um Wirtschafts- und Methodenkompetenz. Nur eine Kombination der Kompetenzen erlaubt die Entwicklung und Bewertung der unten vorgestellten Prototypen für eine multidimensionale und interaktive Datenauswertung im Unternehmenskontext. Nur so können den Anforderungen der User entsprechende, und voll funktionsfähige Prototypen mit hoher Usability entwickelt werden.

Das Problem:

Fakten (oftmals auch Attribute genannt) anhand mehrere Dimensionen auszuwerten ist nicht neu, sondern ein fundamentaler Bestandteil der Berichtslogik. Unter Fakten werden dabei Umsätze, Deckungsbeiträge, Stück etc., verstanden, also numerische Werte zur Beschreibung der Performance eines Unternehmens, während bei Dimensionen von Kunden, Produktgruppen, Absatzmärkten etc., also String-Werte zur genaueren Beschreibung der Herkunft von Fakten, gesprochen wird. Im Unternehmenskontext werden diese Fakten und Dimensionen definiert, in Datenbanken abgelegt und über Standardberichte oder dynamische Online-Abfragen für den User aufbereitet und zugänglich gemacht. Durch steigende Dynamik in den Märkten und einem erhöhten subjektiven und objektiven Informationsbedarf der User, geraten Standardlösungen der Unternehmen allerdings zunehmend an ihre Grenzen. Probleme entstehen vor allem bei der Verwendung mehrerer Dimensionen bzw. Fakten sowie bei dem Wunsch nach einer User-spezifischen Anpassung je nach Interessensschwerpunkt.

Lösungsansatz Visualisierung:

Neuartige Visualisierungsformen basierend auf JavaScript, welche speziell für den Kontext Big Data entwickelt wurden, sollen diesen Problemen Abhilfe schaffen. Speziell das Verwenden mehrerer Dimensionen bzw. Fakten soll dadurch ermöglicht und durch die visuelle Komponente leicht verständlich übermittelt werden. In diesem Zusammenhang gibt es Lösungsansätze für multidimensionale Daten zur Darstellung von hierarchischen Abhängigkeiten (mehrere Dimensionen) und Lösungsansätze zum Darstellen mehrerer Fakten. Auf frei zugänglichen Bibliotheken (z.B. D3js) stehen dazu Codes bzw. Code-Teile zur Verfügung. Diese wurden auch für die untenstehenden Prototypen herangezogen, allerdings deutlich überarbeitet um den Anforderungen der Benutzerzentrierung in Design und Interaktion gerecht zu werden.

In diesem Beitrag, werden die am häufigsten eingesetzten Vertreter jeder Art vorgestellt und um Ergebnisse eines Usability Tests ergänzt. Als Vertreter zur dynamischen Auswertung von mehreren Dimensionen werden das Sankey-Chart und das Sunburst-Chart, und für das gleichzeitige Auswerten mehrerer Fakten das Parallel Coordinates- und der Polar Coordinates-Chart vorgestellt. Ganz besonders ist darauf hinzuweisen, dass die vorgestellten Visualisierungen nur im Zusammenhang mit Interaktion eine hohe Benutzerfreundlichkeit aufweisen. Nur durch Interaktion kann dem gewünschten Effekt der Auswertung nach mehreren Dimensionen oder Fakten Rechnung getragen werden.

Der Testdatensatz:

Zum besseren Verständnis der Prototypen, wurde für alle Visualisierungen derselbe Datensatz herangezogen. Es handelt sich um ein fiktives Unternehmen, welches mit Wein handelt. Der Datenbestand enthält 14 Dimensionen (z.B. Händlername, Bestellnummer, Rebsorte, Winzer, Herkunftsland, Herkunftskontinent) und 12 Attribute (z.B. Brutto- und Nettoumsatz, Handelsspanne (% bzw. €), Kundenrabatt (% bzw. €), Rohgewinn (€), Versandkosten (€), Deckungsbeitrag (% bzw. €) und Weinqualität in Punkten). Insgesamt werden 9.961 Bestellungen abgebildet, wodurch der Datensatz 258.986 Datenwerte beinhaltet (9.961 Zeilen mal 26 Spalten).

Die funktionalen Prototypen:

Mehrere Dimensionen

Sankey-Chart

Interaktionsmöglichkeiten: mehrfach-Selektion (sowohl direkt bei Klick auf Achse als auch Checkboxes in Überschriften), Re-Arrange (Umordnen der Achsen), Tooltip

Sunburst-Chart

Interaktionsmöglichkeiten: mehrfach-Filter (Klick auf Feld, Rotate), Re-Arrange (Umordnen der Achsen), Tooltip

Typische Auswertungsfragen/Statements an die selbe Datenbasis:

  • Schenki1 ist der größte Händler für Rotwein.
  • Europa produziert mehr Rot- als Weißwein.

Sie wollen die Prototypen selbst ausprobieren:

Mehrere Fakten

Parallel Coordinates-Chart

Interaktionsmöglichkeiten: mehrfach-Filter (direkt bei Klick auf Achse inkl. Range-Slider), Re-Arrange (Umordnen der Achsen)

Polar Coordinates-Chart

Interaktionsmöglichkeiten: mehrfach-Filter (Checkboxes in Überschriften), Re-Arrange (Umordnen der Achsen)

Typische Auswertungsfragen/Statements an die selbe Datenbasis

  • Das Geschäft mit dem höchsten Umsatz, konnte gleichzeitig die höchste Contribution Margin vorweisen.
  • Eine höhere Contribution Margin korreliert mit einer höheren Qualität.

Sie wollen die Prototypen selbst ausprobieren

Ergebnisse des Usability-Tests:

Basierend auf ihrer fundamentalen Logik, zeigen die Visualisierungen in der rechten Spalte jeden einzelnen Datensatz, während jene in der linken Spalte immer Zusammenfassungen je Dimension ausweisen. Entsprechend sind Fragen zu spezifischen Werten und einzelnen Vorkommnissen leichter zu beantworten, wenn diese durch Visualisierungen in der rechten Spalte unterstützt werden. Hingegen grobe Einschätzung, Verhältnisse und Überblicksinformationen können vom User leichter identifiziert werden, wenn Visualisierungen der linken Spalte präsentiert werden. Vorsicht ist bei den Polar-Coordinates geboten: diese sind beim Usability-Test durchgefallen!

AutorInnen:
FH-Prof. Mag. DI Peter Hofer
Lisa Perkhofer BA MA