Crate

Sieht so die Datenbank der Zukunft aus?

Haben Sie schon einmal von Crate gehört? Wir stellen Ihnen heute diesen jungen Vertreter von SQL-Datenbanken vor, wie er entstand und wo seine Stärken sind.

Hinter dem Produkt Crate verbirgt sich eine horizontal skalierbare, verteilte SQL-Datenbank. Gegründet wurde das zugehörige Unternehmen, Crate.IO, 2013 von Jodok Batlogg, Christian Lutz und Bernd Dorn. Während der Arbeit mit Elasticsearch kam die Idee, eine verteilte Datenbank für komplexe Anforderungen zu entwickeln, welche selbst einfach zu verwenden ist.

Ziel war es, SQL mit der Performance und Skalierbarkeit von Elasticsearch zu verbinden. Der Vorteil gegenüber NoSQL-Datenbanken besteht darin, dass es nicht nur ein Key-Value Store (wie z. B. Redis) ist, sondern dass mit relationalen Daten, die via (ANSI) SQL abgefragt, aggregiert, zusammengeführt und gefiltert werden können, gearbeitet wird. Obwohl noch nicht alle SQL-Funktionalitäten verfügbar sind, ermöglicht Crate eine schnelle Analyse der Daten. Im Vergleich dazu muss z. B. bei MongoDB die Abfrage mittels Javascript Funktionen nach Map/Reduce Prinzipien erfolgen.

Eingesetzt wird die Datenbank bereits von Unternehmen wie Skyhigh Networks, einem Startup aus dem Silicon Valley mit über 500 Enterprise Kunden, welche ein Cluster mit 60 Nodes im Einsatz hat. Weitere Kunden sind Kapsch AG, ein Telekommunikations- und Verkehrstelematikkonzern, Avuxi, ein Startup aus Barcelona, welches sich mit Social Media Analysen beschäftigt und Space-Time Insights.

Interessant wird Crate, sobald mit großen Datenmengen gearbeitet wird. Es gibt zwar Produkte wie Oracle Cluster, MySQL Cluster oder Microsoft SQL Cluster, diese sind jedoch teuer, komplex in der Wartung und stoßen irgendwann an ihre Grenzen. NoSQL-Datenbanken wie z.B.: MongoDB bieten hingegen keine Möglichkeit, SQL zu verwenden. Crate ist auch als analytische Datenbank bzw. Data Warehouse optimal geeignet, weil Tabellen mit viele Attributen angelegt werden können und hier weder eine Einschränkung beim Datenbankdesign noch bei der Performance besteht und auch ad-hoc Abfragen via SQL getätigt werden können.

Fazit

Abschließend kann man sagen, dass neue Datenbanken wie Crate in Zukunft immer wichtiger werden, vor allem im analytischen Sektor, um die Herausforderung von immer größeren Datenmengen zu bewältigen. Mit dieser Idee einer hoch skalierbaren, verteilten Datenbank (wie es bereits der Ansatz von NoSQL-Datenbanken ist) in Kombination mit der standardisierten SQL-Abfragesprache liefert Crate.IO ein Werkzeug, das die Anforderungen im DWH/BI-Bereich deckt und auch in bestehenden Projekten Anwendung finden kann.

Autorin

Katharina Helm, MSc