Modellierung mit Data Vault

Bisher wurden für das Enterprise Data Warehouse (EDWH) klassische Modellierungsformen (ER, Normalisierung) verwendet, die ihren Ursprung in den operativen Systemen hatten. Im Hinblick auf die wachsenden Anforderungen an Data Warehouse Systeme kommen die Schwächen der bisherigen Modellierungsformen deutlich zu Tage (einfache Anpassbarkeit, Erweiterbarkeit, Performance, Beladungsintervalle).

Mit Data Vault wurde von Dan Linstedt eine neue Modellierungsform entwickelt, die diesen Anforderungen in konzeptioneller und methodischer Sicht gerecht wird. Ein neuer Ansatz, der für Datenmodellierung bei DWHs empfehlenswert ist.

Data Vault Modellierung ist ein detailorientierter, historisch aufgebauter und eindeutiger verbundener Satz von normalisierten Tabellen, die ein oder mehrere funktionelle Gebiete (Themen) des Geschäfts abdecken.

Es ist eine hybride Annäherung, welche die besten Eigenschaften der 3. Normalform und des Starschemas vereint. Das Design ist flexibel, skalierbar, konsistent und an die Bedürfnisse der Unternehmen anpassbar. Es ist ein Datenmodell, das spezifisch aufgebaut wird, um den Bedarf von heutigen Unternehmens-Data-Warehouse-Systemen zu decken.

Beispiel 1:

Ausgangslage: Ein großer Sozialversicherungsanbieter stellt sein führendes operatives System um. Das Data Warehouse muss deswegen neu konzipiert, entworfen und realisiert werden. Diverse Nachbarsysteme müssen integriert werden.

solvistas empfahl zur Modellierung des EDWHs Data Vault aus folgenden Gründen:

  • fachobjektgetriebenes Data Vault, optimiert für Data Integration
  • Gute Einarbeitung und Erweiterungsmöglichkeiten von Themenbereichen
  • Das EDWH kann mit minimalen Auswirkungen um weitere zukünftige Themen wachsen und angepasst werden.
  • Stabilität des Modells durch Verwendung von Business Keys
  • Ein durchgängiges Datenmodell für alle Themenbereiche
  • Ein Wachstum der Organisation stellt kein Problem für das EDWH dar.
  • Viele unterschiedliche Datenquellen können einfach in eine Enterprise-Sicht gebracht werden.

Beispiel 2:

Ausgangslage: Ein führendes Logistikunternehmen beginnt den Aufbau eines EDWHs. Als erstes sollen Offert-Daten abgebildet werden. Das EDWH soll in Zukunft um weitere Logistikthemen wachsen und diese im Datenmodell integrieren, um eine einheitliche Sicht der Daten zu gewährleisten.

Auch hier empfahl solvistas die Umsetzung mit der Data Vault Modellierung aus folgenden Gründen:

  • Das Datenmodell soll einfach erweiterbar sein. Bei Erweiterungen bleiben bestehende Teile des Modells stabil. Das Einbringen von verschiedensten Quellsystemen stellt kein Problem dar.
  • Daten können bis zur Quelle zurückverfolgt werden.
  • Eine hohe Beladungsfrequenz des EDWHs ist durch hohe Parallelisierung leicht realisierbar, Realtime ist machbar.
  • Die Architektur ist agil und anpassbar an zukünftige Aufgaben.

Fazit: Wenn ein flexibles, erweiterbares und für die Zukunft gerüstetes EDWH aufgebaut werden soll, bietet es sich an, die Datenmodellierung mit Data Vault zu machen.

Sollten Sie Bestrebungen in diese Richtung haben, beraten wir Sie gerne bei Ihrer zukunftsweisenden Entscheidung bzw. bei der Realisierung.