DWH/BI: Restructuring the Data Warehouse (Teil 1)

Bill Inmon hat es uns bei seinem solvistas Besuch im Herbst 2010 schon deutlich erklärt. Die Data Warehouses kommen in die Jahre und benötigen dringend einen "neuen" Farbanstrich. Aber ist dieser Farbanstrich auch ausreichend oder ist eine umfassende Überarbeitung nicht sinnvoller?

Auch die solvistInnen erkennen bei ihren Arbeiten für die Kunden den deutlichen Wunsch, über eine Überarbeitung der bestehenden DWH Architektur nachzudenken. Schließlich sind diese DWHs in den vielen Jahren gewachsen und die Anforderungen von einst sind schon lange nicht mehr die Anforderungen von heute. Während noch vor Jahren die IT- und Controlling-Abteilungen damit beschäftigt waren, das DWH im Unternehmen zu etablieren, so ist heute das DWH Zentrum für beinahe alle Unternehmensentscheidungen. Viele Architekturen haben aber nicht den "Single Point of Truth" bedacht.

Eine einfache Variante einen "Singe Point of Truth" zu schaffen ist, eine integrierte Datenschicht einzuführen. Diese Datenschicht wird zwischen der Ladeschicht und den Data Marts positioniert. Ein neuer aber bereits anerkannter Modellierungsansatz ist die Data Vault Modellierung nach Linstedt.  

Data Vault Modeling ist ein detailorientierter, historisch aufgebauter und eindeutig verbundener Satz von normalisierten Tabellen, die ein oder mehrere funktionelle Gebiete (Themen) des Geschäfts abdecken.

Es ist eine hybride Annäherung, die die besten Eigenschaften der 3. Normalform und des Sterndiagramms vereint. Das Design ist flexibel, skalierbar, konsistent und an die Bedürfnisse der Unternehmen anpassbar. Es ist ein Datenmodell, das spezifisch aufgebaut wird, um den Bedarf von heutigen Unternehmens-Data-Warehouses zu decken.

Damit können die Probleme der 3. Normalform im Umgang mit Historien und Snapshots und der Star Modellierung mit fehlendem Single Point of Truth behoben werden.

Nachdem die Data Vault Modellierung sehr einfach in Aufbau und Gestaltung ist, unterstützt sie auch eine für DWHs sinnvolle Vorgehensweise. Diese ist getrieben durch ständige Anforderungen aus der Fachabteilung, schrittweise die bestehende DWH Architektur zu erweitern. Das Ergebnis ist Ihr zukunftsträchtiges unternehmensweites Datawarehouse (UDW / EDWH).

Der erste Teil für die Modernisierung Ihres Datawarehouses ist damit vollendet.

Lesen Sie den 2. Teil: Chaos ETL "versus" Big Picture