Data Warehouse Architektur – ein Paradigmenwechsel von klassisch zu Cloud?

Im Interview mit Senior Data Architect Verónica Carbelo und Geschäftsführer Konrad Linner

Die Digitalisierung in Unternehmen ist in vollem Gange und verändert Strukturen, Denk- und Sichtweisen. Einer der wesentlichen Vorteile der Digitalisierung besteht darin, dass aus den verschiedensten Teilbereichen des Unternehmens Informationen in Form von Daten generiert werden können. Die Herausforderung für alle Unternehmen ist nun, diese Daten auswertbar zu machen. Die Tatsache, dass man diese Daten so schnell als möglich auswertbar machen möchte, erhöht die Herausforderung.

Wie sollen sich Unternehmen in Zukunft verhalten? Sollen Sie in ein bestehendes Data Warehouse (auf eigener Infrastruktur) investieren oder sollen Sie auf den weiteren zukünftigen Trend in Form einer Cloud-Lösung setzen?

Ist für die Analyse ein cloud-basiertes Data Warehouse in Zukunft zu bevorzugen?

Die Antwort ist ganz klar „ja“, denn die aktuelle Technologie, die Data Warehouse-basiert ist, hat Grenzen bezüglich der Datenmenge und Funktionalitäten.

Die neuen Cloud-Lösungen ermöglichen es, dass die Skalierbarkeit in Bezug auf die Datenmenge und die Performance einfach zu leisten sind. Sowohl der Kostenstandpunkt als auch die Infrastruktur sind attraktiver, denn bei den neuen Cloud-Lösungen bezahlt man das, was man nutzt und was man benötigt. Weiters bietet die neue Cloud-Technologie neue Funktionalitäten, die bereits integriert sind. Ich denke da zum Beispiel an Künstliche Intelligenz. Beim traditionellen Data Warehouse müssen hierfür Schnittstellen berücksichtigt werden, wodurch der Aufwand steigt.

Wir konzentrieren uns endlich nicht mehr auf die Hersteller der Datenbanken, auf die Datenbanken selbst und auf Software-Ansätze, sondern auf den Inhalt der Daten und die Möglichkeiten der Analyse – also auf den Mehrwert für den Kunden. Dieser Mehrwert liegt in den Daten!

Wann sollte ein Unternehmen eine traditionelle und wann eine cloud-basierte DWH-Lösung in Betracht ziehen?

Es gibt keinen Grund mehr, überhaupt auf ein klassisches DWH-Konzept zu setzen. Eine Ausnahme sind Datenschutzgründe, wenn man wirklich extrem sensible Daten hat. Doch selbst da gibt es die Möglichkeit einer lokalen Cloud. Nachteil der lokalen Cloud Variante ist jedoch, dass man die Vorteile eines cloud-basierten Data Warehouse verliert.

Ein Hauptvorteil ist unter anderem, dass Updates automatisch passieren. Wird beispielsweise der Server zu klein, so wird dieser gewechselt, ohne dass ich das merke oder mich darum kümmern muss. Es wird keine Zeit mehr mit der Schaffung von Rahmenbedingungen vergeudet, beispielsweise welche Datenbanken oder welches „Sizing“ benötigt wird.

Die klare Fokussierung liegt auf der Analyse der Daten. Die Rahmenbedingungen sind vorgegeben und man muss sich darüber keine Gedanken mehr machen. So erspart man sich Personal, Zeit, Raum und Kapital.

Wer ein traditionelles Data Warehouse verwendet, löst keines der tatsächlichen Probleme. Am Ende hat man dieselben Begrenzungen wie zuvor - „Cloud DWH = DWH without limits“

Was wird in Zukunft die größte Herausforderung bei der Datenanalyse sein?

Die Fachlichkeit und Datenqualität. Einerseits das zur Verfügung zu stellen, was der/die AnwenderIn möchte, andererseits es richtig zur Verfügung zu stellen…das betrifft die Fachlichkeit der Daten und die Datenqualität, die sich so nicht geändert haben. Der Vorteil ist jetzt, dass wir den Fokus nun zu 100% auf die Datenanalyse legen können. Wir sind ein Data Science Unternehmen und unser Hauptfokus liegt auf der Analyse und Visualisierung der Daten und nicht auf der Notwendigkeit der Hardware-Hersteller und Systemtechniker.

Was sind Ihre Top-3-Tipps für ein erfolgreiches DWH-Projekt?

  1. Klein anzufangen, groß aufzuhören…im Sinne von „think big, act small“. Das heißt, mit überschaubaren Themen im Datenbereich zu beginnen, eine erste analytische Lösung zu schaffen und agil zu agieren.
  2. Die Schnellen fressen die Langsamen, daher unser Tipp: keinen Fokus auf Hardware und Systemtechnik setzen. Herstellerunabhängigkeit oder -abhängigkeit hat keine Bedeutung mehr.
  3. Wichtigste Herausforderung sind Performance und Fachlichkeit der Daten.

Interview von Kerstin Hemelik-Haindl, solvistas Marketing mit Senior Data Architect/Scientist Verónica Carbelo und Geschäftsführer Konrad Linner