Weltweit schnellste analytische In-Memory-Datenbank

Analyse Power „Made in Germany“

Daten sind das neue Gold. Doch erst durch die Auswertung dieser kann ein Vorteil gegenüber den Mitbewerbern erzielt werden. Dabei spielt die schnelle und effiziente Datenanalyse die Hauptrolle. So werden aus dem Gold wertvolle Informationen gewonnen, die Umsatz und Gewinn steigern. Entsprechend gefragt sind Analysetools, die Big Data Analysen in Echtzeit ermöglichen, wie jene der Exasol AG.

Die EXASOL AG, welche im Jahr 2000 gegründet wurde und ihren Sitz in Nürnberg hat, ist einer der führenden Hersteller von analytischen In-Memory-Datenbanksystemen. Die Firma konnte sich bereits fünf Jahre hintereinander Top-Platzierungen im Magic Quadrant von Gartner sichern und wurde im Report von 2016 vor allem hinsichtlich Vision und Umsetzungsfähigkeit als beispielhaft bewertet. Zu den Kunden gehören beispielsweise die Adidas Group, Blue Yonder oder IMS Health, Olympus, Zalando, XING, OTTO und Sony Music. 

EXASolution – Das Produkt hinter dem Erfolg

Die spaltenorientierte In-Memory-Datenbank EXASolution entstand aus Forschungsprojekten der Universitäten Jena und Erlangen und führt seit 2008 den TPC-H-Benchmark für Data Warehouses und analytische Szenarien in allen Datengrößen von 100 GB bis 100 TB an. Gemeinsam mit Dell war EXASolution im Leistungsvergleich bis zu 100 Mal schneller als die Wettbewerber. Die Benchmark verdeutlicht auch, dass Echtzeit-Analysen für extrem große Datenmengen auch zu geringen Betriebskosten realisierbar sind und eine günstige und lineare Skalierbarkeit möglich ist. Ein größeres Datenvolumen oder eine erhöhte Anzahl von parallelen Usern im Unternehmen kann durch die Erweiterung des Hauptspeichers erfolgreich gemeistert werden. Denn genau hier werden die Daten In-Memory spaltenorientiert und verteilt über die Knoten eines Clusters gehalten.

©Exasol

EXASolution übernimmt dabei die Funktionen eines Betriebssystems, einer relationalen Datenbank und einer analytischen Datenbank. Das System kann dabei mit strukturierten (ERP, Datenbank, File-System …) und unstrukturierten Daten (Hadoop) umgehen. Als Basis dient der Red Hat Kernel.

Neben der angesprochenen Performance, aufgrund der parallelen Datenverarbeitung und der Skalierbarkeit, verspricht EXASOL auch eine Tuningfreiheit, denn manuelle Optimierungsmaßnahmen sind aufgrund von automatisierten integrierten Prozessen nicht mehr notwendig. Generell ist auch der Administrations- und Schulungsaufwand geringer als bei der Konkurrenz. Für die Transfer- und Ausfallsicherheit wird nach dem Active-Active-Prinzip gearbeitet, daher übernimmt bei dem Ausfall eines Rechners ein Standby-Server.

Data Science auf einem neuen Level

Autor: Rico Pommerenke

Zusätzlich zum Aufkommen riesiger Datenbeständen wurde durch Big Data auch die Rolle von Daten im Geschäftsleben grundlegend neu definiert. Data Science hat sich als anerkannter Themen-Bereich etabliert und bietet oft den entscheidenden Wettbewerbsvorteil – das hat auch EXASOL erkannt.

Die optimale Integration von Hadoop in EXASOL bietet hierfür eine extrem schnelle Verknüpfung von Data Warehouse-Daten mit Hadoop-Daten und eine native Verzahnung mit SQL. Daher können die unstrukturierten Daten auf dem Server-Cluster mittels Map- und Reduce-Verfahren herangezogen und mit den strukturierten Daten aus der EXASolution durch eine parallele SQL-Verarbeitung kombiniert werden. Das ist einmalig auf dem Markt. Ziel ist es, die Analysen von externen Systemen direkt auf die EXASolution-Datenbank zu verlagern, um Replikationen der Daten zu vermeiden und die ganze Leistungsfähigkeit des Clusters auszuschöpfen. Der sonst notwendige Datentransfer in ein Analysesystem entfällt.

EXASOL bietet hierfür die Möglichkeit, vordefinierte- oder benutzerdefinierte analytische Funktionen (UDFs) für diese anspruchsvollen Analysen direkt in der Datenbank zu nutzen. Unterstützt werden die gängigen Programmiersprachen R, JAVA, Python und LUA. Bald sollen auch weitere Sprachen wie Scala, Julia und C++, unterstützt werden.

Anhand dieser Features lässt sich auch die aktuelle Attraktivität von EXASOL für die Unternehmen erklären: Es ist die Kombination aus Performance, Skalierbarkeit und den vielfältigen Möglichkeiten der Analyse-Funktionen.