Big Data Wissen praxisorientiert

Vom Schlagwort zum gelebten Alltag

 

Die reine Übersetzung des Begriffs Big Data zu Großdaten ist wohl unzureichend.

Viel mehr beschreibt Big Data den effizienten Umgang mit allen strukturierten und unstrukturierten Unternehmensdaten in und für alle Unternehmensbereiche.

Die Grenzen der Datenhoheit verschwimmen, auch externe Daten gewinnen an Bedeutung. Grundsätzlich kann Big Data durch folgende fünf Dimensionen beschrieben werden:

  • Volume – Datenmenge
  • Velocity – Geschwindigkeit der Datenverarbeitung und Datenbereitstellung
  • Variety – Datenvielfalt der Quellen (strukturiert / unstrukturiert und intern / extern)
  • Value – Datenmehrwert für Unternehmen (Informationsgehalt)
  • Validity – Datenqualität (Sicherstellung des Informationsgehalts)

Big Data Analytics erweitert die Big Data Initiative und verleiht den beiden Dimensionen Value und Validity massiven Mehrwert. Wie unter Analytik beschrieben, erhöhen sich Informationsgehalt und Vertrauenswürdigkeit der Unternehmensdaten enorm und sichern dem Unternehmen zeitlich relevante Informationen zur verbesserten Entscheidungsfindung.

Praxisorientierte Beispiele

Ausgangssituation

  • Bankdaten funktional getrennt gespeichert und verarbeitet
  • Risikokalkulationen um rasch auf sich ändernde Situationen reagieren zu können (z.B. Kurswechsel)
  • Analyse von Einflussfaktoren für Kreditvermittlungen

Herausforderung

  • Prozessbrüche im Unternehmen durch dezentrales Datenmanagement
  • Keine zentrale Datenhaltung im Unternehmen (fehlender Single Point of Truth)
  • Einbinden unstrukturierter Daten (Börsenkurse, Kaufbewegungen…)
  • Mehrkosten durch redundante Datenhaltung (Anzahl Systeme, Wartung/ Betrieb)
  • Datenschutzrechtliche Bestimmungen


Lösungsansätze

  • Aufbau eines unternehmensweiten Data Warehouse (EDWH)
    • Standardisierung der DWH Entwicklung (ETL)
    • Automatisierung der ETL Entwicklung
    • Moderne State-of-the-Art DWH Methodik (z.B. Data Vault)
    • Integration von und Zusammenführung mit unstrukturierten Daten
    • Realtime Anforderungen
  • Zentrale Datenbeschreibung – Meta Data Management
    • Quelle
    • Fachlichkeit
    • Berechnungen / Kennzahlen
  • Einheitliches Reporting über ganzes Unternehmen hinweg
  • Individuelle anforderungsorientierte Analysemöglichkeit durch Data Analysten

Holen Sie sich das Wissen unserer ExpertInnen. Sie sind verwirrt durch die Begriffsvielfalt zu diesem Thema? Egal ob „Hadoop“, „Apache Spark“ , „Predictive Analytics“ oder „Visual Analytics“, wir helfen Ihnen mit der Informationsflut fertig zu werden.