Was ist Zeitreihenanalyse?

Die Zeitreihenanalyse ist eine Technik in der Statistik, die sich mit Zeitreihendaten und Trendanalysen befasst. Zeitreihendaten folgen periodischen Zeitintervallen, die in regelmäßigen Zeitintervallen gemessen oder in bestimmten Zeitintervallen erfasst wurden. Anders ausgedrückt: Eine Zeitreihe ist einfach eine Reihe von Datenpunkten in einer zeitlichen Anordnung, und die Zeitreihenanalyse ist der Prozess, mit dem diese Daten sinnvoll werden.

Beispiel zur Zeitreihenanalyse

In einem Geschäftskontext umfassen Beispiele für Zeitreihendaten alle Trends, die über einen bestimmten Zeitraum erfasst werden müssen. Ein Google-Trendbericht ist eine Art von Zeitreihendaten, die analysiert werden können. Es gibt auch weitaus komplexere Anwendungen wie Nachfrage- und Angebotsprognosen, die auf früheren Trends basieren.

Zeitreihenanalyse mit TIBCO
Testen Sie TIBCO Spotfire - Kostenlose Testversion
Mit TIBCO Spotfire, der umfassendsten Analyse-Lösung auf dem Markt, können Sie ganz einfach neue Erkenntnisse aus Ihren Daten gewinnen.

Beispiele für Zeitreihendaten

In der Wirtschaft könnten Zeitreihendaten das Bruttoinlandsprodukt (BIP), der Verbraucherpreisindex, der S&P-500-Index und die Arbeitslosenquoten sein. Der Datensatz könnte das Bruttoinlandsprodukt eines Landes aus den Wirtschaftsdaten der Federal Reserve sein.

Aus sozialwissenschaftlicher Sicht könnten Zeitreihendaten Geburtenrate, Migrationsdaten, Bevölkerungswachstum und politische Faktoren abbilden.

Die statistischen Eigenschaften von Zeitreihendaten passen nicht immer zu herkömmlichen statistischen Methoden. Daher erfordert die genaue Analyse von Zeitreihendaten einen einzigartigen Satz von Tools und Methoden, die zusammen als Zeitreihenanalyse bezeichnet werden.

Bestimmte Aspekte sind ein wesentlicher Bestandteil des Zeitreihenanalyseprozesses. Der Datenspezialist sollte in der Lage sein zu erkennen, dass die Daten Folgendes sind:

  • Stationarität ist ein entscheidender Aspekt einer Zeitreihe. Eine Zeitreihe wird als stationär festgelegt, wenn sich ihre statistischen Eigenschaften wie der Durchschnitt (Mittelwert) und die Varianz im Laufe der Zeit nicht ändern. Sie hat eine konstante Varianz und einen Mittelwert, und die Kovarianz ist von der Zeit getrennt.
  • Saisonalität bezieht sich auf periodische Schwankungen. Wenn Sie beispielsweise den Stromverbrauch berücksichtigen, ist dieser normalerweise tagsüber hoch und in der Nacht niedriger. Bei Einkaufsmustern steigen die Online-Verkäufe in den Ferien, bevor sie sich verlangsamen und zurückgehen.
  • Autokorrelation ist die Ähnlichkeit zwischen Beobachtungen als Funktion der Zeitverzögerung zwischen ihnen. Die Aufzeichnung von autokorrelierten Daten ergibt ein Diagramm, das einer Sinusfunktion ähnelt.

Daten: Typen, Begriffe und Konzepte

Daten werden im Allgemeinen als einer dieser drei Typen angesehen:

  1. Zeitreihendaten: Eine Reihe von Beobachtungen zu den Werten, die eine Variable zu verschiedenen Zeitpunkten annimmt.
  2. Querschnittsdaten: Daten einer oder mehrerer Variablen, die an demselben Zeitpunkt gesammelt wurden.
  3. Zusammengefasste Daten: Eine Kombination aus Zeitreihendaten und Querschnittsdaten.

Dies sind einige der Begriffe und Konzepte, die mit der Zeitreihendatenanalyse verbunden sind:

  • Abhängigkeit: Abhängigkeit bezieht sich auf die Assoziation zweier Beobachtungen mit derselben Variablen zu früheren Zeitpunkten.
  • Stationarität: Dieser Parameter misst den Mittelwert oder Durchschnittswert der Reihe. Wenn ein Wert über den angegebenen Zeitraum konstant bleibt, wenn es in den Daten Spitzen gibt oder wenn diese Werte zur Unendlichkeit neigen, gibt es keine Stationarität.
  • Differenzierung: Die Differenzierung ist eine Technik, um die Zeitreihen stationär zu machen und die automatisch auftretenden Korrelationen zu kontrollieren. Allerdings müssen nicht alle Zeitreihenanalysen differenziert werden, was zu ungenauen Schätzungen führen kann.
  • Kurvenanpassung: Die Kurvenanpassung als Regressionsmethode ist nützlich für Daten, die sich nicht in einer linearen Beziehung befinden. In solchen Fällen stellt die mathematische Gleichung für die Kurvenanpassung sicher, dass Daten, die nicht bedeutend genug sind, um einen echten Einfluss zu haben, auf eine Kurve mit einer eindeutigen Formel „zurückentwickelt“ werden, die Systeme verwenden und interpretieren können.

Identifizierung von Querschnittsdaten im Vergleich zu Zeitreihendaten

Das Gegenteil von Zeitreihendaten sind Querschnittsdaten. In diesem Fall werden verschiedene Entitäten wie Einzelpersonen und Organisationen zu einem einzigen Zeitpunkt beobachtet, um Rückschlüsse zu ziehen. Beide Formen der Datenanalyse haben ihren eigenen Wert, und manchmal verwenden Unternehmen beide Analyseformen, um bessere Schlussfolgerungen zu ziehen.

Zeitreihendaten finden sich in nahezu allen geschäftlichen und organisatorischen Anwendungsbereichen, die von der Vergangenheit betroffen sind. Dies reicht von Wirtschaftswissenschaften, Sozialwissenschaften und Anthropologie bis hin zu Klimawandel, Wirtschaft, Finanzen, Betrieb und sogar Epidemiologie. In einer Zeitreihe ist Zeit oft die unabhängige Variable, und das Ziel besteht darin, eine Prognose für die Zukunft zu erstellen.

Der wichtigste Vorteil der Zeitreihenanalyse besteht darin, dass Datenpunkte in einer Zeitreihe linear zu benachbarten Zeiträumen erfasst werden — da möglicherweise Korrelationen zwischen Beobachtungen hergestellt werden können. Diese Funktion unterscheidet Zeitreihendaten von Querschnittsdaten.

Techniken zur Zeitreihenanalyse

Wie wir oben gesehen haben, kann die Zeitreihenanalyse ein ehrgeiziges Ziel für Unternehmen sein. Um genaue Ergebnisse bei der Modellanpassung zu erhalten, kann eines von mehreren mathematischen Modellen in der Zeitreihenanalyse verwendet werden, wie zum Beispiel:

  • Box-Jenkins-Modelle für den autoregressiven integrierten gleitenden Durchschnitt (ARIMA)
  • Multivariate Box-Jenkins-Modelle
  • Exponentielle Holt-Winters-Glättung

Die genauen mathematischen Modelle sprengen den Rahmen dieses Artikels. Einige spezifische Anwendungen dieser Modelle sollen jedoch hier diskutiert werden.

Die Box-Jenkins-Modelle der ARIMA- und der multivariaten Sorte verwenden das bisherige Verhalten einer Variable, um zu entscheiden, welches Modell am besten analysiert werden kann. Es wird davon ausgegangen, dass Zeitreihendaten für die Analyse durch eine lineare Funktion ihrer vergangenen Werte, vergangenen Fehler oder beiden davon charakterisiert werden können. Als das Modell zum ersten Mal entwickelt wurde, stammten die verwendeten Daten von einem Gasofen und seinem variablen Verhalten im Laufe der Zeit.

Im Gegensatz dazu eignet sich die exponentielle Holt-Winters-Glättung am besten zur Analyse von Zeitreihendaten, die einen definierenden Trend darstellen und je nach Jahreszeit variieren.

Solche mathematischen Modelle sind eine Kombination mehrerer Messmethoden. Die Holt-Winters-Methode verwendet gewichtete Durchschnittswerte, die einfach genug erscheinen können, aber diese Werte sind auf die Gleichungen geschichtet, um eine exponentielle Glättung zu erzielen.

Anwendungen der Zeitreihenanalyse

Zeitreihenanalyse-Modelle erzielen zwei Ergebnisse:

  • Verschaffen Sie sich ein Verständnis der zugrundeliegenden Kräfte und Strukturen, die die beobachteten Datenmuster hervorgebracht haben. Komplexe, reale Szenarien fallen sehr selten in festgelegte Muster, und die Zeitreihenanalyse ermöglicht ihre Untersuchung – zusammen mit all ihren Variablen, die im Laufe der Zeit beobachtet wurden. Diese Anwendung soll normalerweise Prozesse verstehen, die schrittweise und über einen bestimmten Zeitraum ablaufen, z. B. die Auswirkungen des Klimawandels auf den Anstieg der Infektionsraten.
  • Passen Sie ein mathematisches Modell so genau wie möglich an, damit der Prozess in Prognosen, Überwachung oder sogar bestimmte Feedbackschleifen übergehen kann. Dies ist ein Anwendungsfall für Unternehmen, die in großem Maßstab die Betriebstätigkeiten ausüben möchten und alle möglichen Inputs benötigen, um erfolgreich zu sein.

Daten sind numerisch, der Analyseprozess erscheint mathematisch, eine Zeitreihenanalyse scheint hingegen fast schon abstrakt zu sein. Jede Organisation kann jedoch eine Reihe heutiger Anwendungen solcher Methoden realisieren. Es ist zum Beispiel interessant, sich vorzustellen, dass große, globale Lieferketten wie die von Amazon nur aufgrund der Interpretation solch komplexer Daten über verschiedene Zeiträume hinweg aufrecht erhalten werden. Selbst während der COVID-19-Pandemie, die sich äußerst negativ auf die Lieferketten ausgewirkt hat, konnten sie sich dank dieser Zahlen und des nicht von der Pandemie beeinflussten Verständnisses dieser Zahlen schneller erholen.

Die Zeitreihenanalyse wird verwendet, um das beste Modell zu ermitteln, das zur Prognose von Geschäftsmetriken verwendet werden kann. Zum Beispiel Börsenkursschwankungen, Verkäufe, Umsatz und alle anderen Prozesse, die Zeitreihendaten verwenden können, um Vorhersagen über die Zukunft zu treffen. Sie ermöglicht dem Management, zeitabhängige Muster in Daten zu verstehen und Trends bei Geschäftskennzahlen zu analysieren.

Aus praktischer Sicht werden Zeitreihenanalysen in Organisationen hauptsächlich für Folgendes verwendet:

  • Wirtschaftsprognosen
  • Umsatzprognose
  • Studien zum Nutzwert
  • Haushaltsanalyse
  • Analyse der Aktienmärkte
  • Erträge-Prognosen
  • Volkszählungsanalyse
  • Prozess- und Qualitätskontrolle
  • Bestandsstudien
  • Workload-Prognosen

Vorteile der Zeitreihenanalyse

Datenanalysten können von der Zeitreihenanalyse viel profitieren. Von der Bereinigung von Rohdaten über ihre sinnvolle Nutzung und das Aufdecken von Mustern bis hin zur Unterstützung bei Projektionen kann durch die Anwendung verschiedener Zeitreihenmodelle viel erreicht werden.

Hier sind ein paar Vorteile der Zeitreihenanalyse:

Sie bereinigt Daten und beseitigt Störfaktoren

Durch die Datenbereinigung kann man sich auf das Wesentliche konzentrieren, sie entfernt Ausreißer oder wendet verschiedene Durchschnittswerte an, um eine bessere Gesamtperspektive der Daten zu erhalten. Das bedeutet, das Signal in Bereiche zu unterteilen, indem man sich auf das Wesentliche konzentriert. Der Prozess der Zeitreihenanalyse beseitigt das Rauschen und ermöglicht Unternehmen, sich ein klareres Bild von den täglichen Ereignissen zu machen.

Daten werden verständlicher

Die in der Zeitreihenanalyse verwendeten Modelle helfen dabei, die wahre Bedeutung der Daten in einem Datensatz zu interpretieren und erleichtern Datenanalysten die Interpretation. Autokorrelationsmuster und saisonale Messgrößen können angewendet werden, um vorherzusagen, wann ein bestimmter Datenpunkt erwartet werden kann. Darüber hinaus kann der Wert des Datenpunkts mit Stationaritätsmaßen geschätzt werden.

Das bedeutet, dass Unternehmen Daten betrachten und Muster über Zeit und Raum hinweg erkennen können, anstatt mit einer Masse von Zahlen konfrontiert zu werden, die für die Kernfunktion des Unternehmens nicht von Bedeutung sind.

Prognosedaten

Die Zeitreihenanalyse kann die Grundlage für Prognosedaten bilden. Die Zeitreihenanalyse ist prinzipiell so ausgestattet, dass die Muster in Daten erkennt, die die Grundlage für die Vorhersage zukünftiger Datenpunkte bilden. Es ist dieser Prognoseaspekt der Zeitreihenanalyse, der sie im Geschäftsbereich äußerst beliebt macht. Während die meisten Datenanalysen frühere Daten verwenden, um nachträglich Erkenntnisse zu gewinnen, hilft die Zeitreihenanalyse dabei, die Zukunft vorherzusagen. Genau dieser Vorteil unterstützt das Management bei besseren Geschäftsentscheidungen.

Nachteile der Zeitreihenanalyse

Die Zeitreihenanalyse ist nicht perfekt. Sie kann unter einer Verallgemeinerung aus einer einzigen Studie leiden, in der mehr Datenpunkte und Modelle gerechtfertigt waren. Menschliches Versagen könnte das richtige Datenmodell falsch identifizieren, was sich auf die Ausgabe auswirken kann.

Es könnte auch schwierig sein, die entsprechenden Datenpunkte zu erhalten. Ein wesentlicher Unterschied zwischen der Zeitreihenanalyse und den meisten anderen statistischen Problemen besteht darin, dass die Beobachtungen in einer Zeitreihe nicht immer unabhängig sind.

Beispielsweise kann sich ein Ereignis mit einer einzigen Chance auf alle späteren Datenpunkte auswirken, und es ist Sache jedes Data Scientist, genau einzuschätzen, welche dieser Ereignisse Auswirkungen auf die jeweilige Analyse haben können. Gibt es Ähnlichkeiten bei Vorhersagen, die historische Daten nützlich machen können?

Ressource zur Zeitreihenanalyse
Kostenloses E-Book: Welche Art von Analytik ist die richtige für Sie? Berichte, Prädiktive Analytik und alles dazwischen.
Welche Art von Analytik ist für Sie die richtige? Finden Sie die beste Lösung für Ihre Geschäftsbedürfnisse.

Analyse der Zukunft der Zeitreihen

Die Zeitreihenanalyse stellt einen hochentwickelten Bereich der Datenanalyse dar. Sie konzentriert sich auf die Beschreibung, Verarbeitung und Prognose von Zeitreihen. Zeitreihen sind nach Zeit geordnete Datensätze. Bei der Interpretation einer Zeitreihe müssen Autokorrelationsmuster, Saisonalität und Stationarität berücksichtigt werden, bevor das richtige Modell für die Analyse ausgewählt wird. Es gibt verschiedene Zeitreihenanalyse-Modelle, die von einfachen über fein abgestimmte bis hin zu fortgeschrittenen Modellen reichen. Fortschrittliche Modelle helfen Datenanalysten dabei, das Verhalten von Zeitreihen mit viel größerer Genauigkeit vorherzusagen.

Mit dem Aufkommen von Automatisierungstechniken und Techniken des maschinellen Lernens ist es nicht mehr so schwierig, diese Informationen zu verstehen und komplexe Berechnungen durchzuführen, womit der Weg für ein besseres Verständnis unserer Vergangenheit und unserer Zukunft geebnet ist.