Zeitreihen – Prognosemodelle für Manager

Zeitreihenanalyse und Forecasting

In regelmäßigen Zeitabständen beobachtete Datenpunkte bezeichnet man als Zeitreihe. Besonders in Betrieben werden viele Daten in dieser Form erhoben, zum Beispiel wöchentliche Umsätze eines Unternehmens, tägliche Börsenkurse und monatliche Preisindizes. Auch in der Meteorologie und Biologie werden viele Daten in dieser Form beobachtet.  

Generell beschäftigt man sich bei der Zeitreihenanalyse vor allem mit den folgenden zwei Aspekten:  

  • Dem Verständnis des zugrundeliegenden datengenerierenden Prozesses; das umfasst auch das Erkennen von Trends und Saisonalitäten
  • Der Prognose zukünftiger Werte auf Basis beobachteter Werte oder verwandter beobachteter Werten

Die Werte einer Zeitreihe setzen sich aus verschiedenen Komponenten zusammen: Dem generellen Trend, der Saisonalität, also saisonalen oder zyklischen Schwankungen, und irregulären Schwankungen, die auch als Störterm oder Noise bezeichnet werden. Diese Komponenten können dann in einem additiven oder multiplikativen Modell zusammengefasst werden. Wichtig ist es nun im Bereich Big Data, den Noise von Information zu trennen. Die große Fülle an (oftmals sogar real- time) Daten muss gebündelt, gefiltert und aggregiert werden, damit das Unternehmen wichtige Schlüsse daraus ziehen kann.

Der klassische Ansatz zur Modellfindung von Box-Jenkins sind sogenannte ARMA-Modell, (deutsch: autoregressiver gleitender Durchschnitt) und deren Erweiterungen ARIMA (für nicht-stationäre Daten und ARMAX-Modelle), die auch exogene Variablen miteinbeziehen. Wie werden aber multivariate Zeitreihen behandelt?

Zeitreihen-Daten und Modelle eignen sich also dazu, Veränderungen in einem System, Prozess oder Verhalten im Zeitverlauf darzustellen und zu verstehen. Heutzutage kann man die meisten Daten als Zeitreihen-Daten auffassen, da (fast) alle Datenbanken Logs haben. Die neuen Daten werden also zusätzlich gespeichert, ohne den Verlauf zu löschen. Auch im Internet of Things werden von Sensoren laufend derartige Daten generiert, zum Beispiel von Smart Meters, die den Stromverbrauch erfassen, oder diversen Wearables, die Daten wie Herzfrequenz und Aktivität des Benutzers aufzeichnen.

Abbildung 1: Erstellt mit SAS Visual Analytics

Wenn Daten mit Zeitstempel gesammelt werden, entstehen sehr schnell große Datenmengen. Dabei entstehen eher Probleme bei der effizienten Abfrage als bei der Speicherung. Die Lösung dieses Problems sind spezialisierte Zeitreihen-Datenbanken. Diese Datenbanken sind der am schnellsten wachsende Datenbanken-Typ, ihre Popularität verzeichnet den stärksten Anstieg. Ein Beispiel einer solchen Datenbank, die auf SQL basiert, ist eXtremeDB. Zusätzlich zu dieser gibt es noch weitere kommerzielle Datenbanken, aber auch andere lizensierte Datenbanken (Apache, GPL). Sie ermöglichen Benutzern das Speichern, Updaten und Organisieren von Zeitreihen, schnelle Aggregation und einfache Analyse der Daten und Zusammenfassen mehrerer Zeitreihen zu einer multivariaten Zeitreihe. Außerdem kann nach verschiedensten Eigenschaften wie Zeiträumen, hohen und niedrigen Werten oder sogar Werten einer anderen Zeitreihe gefiltert werden.

Bei diesen sehr großen Datenmengen ist die klassische statistische Modellfindung oft ungeeignet. Stattdessen werden Techniken aus dem Machine Learning oder Data Mining verwendet, um die Daten zu klassifizieren, Anomalien und Modelle zu finden und somit wieder eine Prognose zu ermöglichen. Die momentane Entwicklung geht in Richtung von Real Time Applications, bei denen die Daten innerhalb weniger Sekunden verarbeitet werden.

Abbildung 2: Erstellt mit TM1

Insgesamt bieten Zeitreihen also Möglichkeiten, aus vergangenen Daten Schlüsse zu ziehen und somit datenbasierte Entscheidungen zu treffen. Die klassischen mathematischen Modelle sind in Standard-Software integriert, wodurch Prognosen einfach und schnell durchführbar sind. Für komplexere Analysen können Sie sich gerne an uns wenden. So können Planungs- und Steuerungsprozesse auf einem hohen Niveau erfolgen.

Autorinnen: Klara Hultsch, Melissa Schmidt