Einführung von Zeitreihenmodellen in SAP Analytics Cloud Smart Predict

Objective

After completing this lesson, you will be able to erläutern Sie die Zeitreihenanalyse in Smart Predict.

Anwendungsfälle für Zeitreihenmodelle

Erweiterte Analysen zur Steuerung von Reisen und Spesen verwenden

Die Zeitreihenprognose ist nützlich, um zukünftige Werte einer Kennzahl zu schätzen, für die eine Zeitdimension verfügbar ist, um Sie bei der Identifizierung eines Trends zu unterstützen.

In der Fallstudie führen wir Sie durch ein Szenario für die Verwendung von Zeitreihenmodellen zur Steuerung von Ausgaben.

Welche Themen können wir mit einem Zeitreihenmodell untersuchen?

Sie können beispielsweise folgende Fragen beantworten:

  • Wie wird sich der Umsatz eines Shops im nächsten Monat entwickeln?
  • Wie hoch ist der erwartete Umsatz nach Produkt pro Region für die nächsten Wochen?
  • Wie variiert der Bestand an Produkten in einem Lager in den folgenden Wochen?
  • Wie wird sich der Cashflow im nächsten Quartal weiterentwickeln?

Zeitreihenanalyse in Smart Predict

Was ist eine Zeitreihe?

Eine Zeitreihe ist eine Reihe von Messpunkten, die in zeitlicher Reihenfolge indiziert werden. Normalerweise ist eine Zeitreihe eine Sequenz, die zu aufeinanderfolgenden gleichmäßig beabstandeten Zeitpunkten verwendet wird. Eine Zeitreihe kann beispielsweise die Bewegung von Erlösen oder Kosten über einen bestimmten Zeitraum verfolgen, wobei Datenpunkte in regelmäßigen Abständen erfasst werden. Zum Beispiel wöchentlich, monatlich, vierteljährlich oder jährlich.

Zeitreihenmodell, das Kosten im Zeitverlauf anzeigt.

Signale

Historische Werte der Zielvariablen und die entsprechenden Termine werden beim Erstellen und Trainieren eines Zeitreihenmodells benötigt. Diese Daten „Paar" von Datum und Zielwert werden als Signal bezeichnet. Das Zeitreihen-Prognosemodell in Smart Predict analysiert das Signal. Werte anderer Variablen, die am selben Datum (in der Vergangenheit und Zukunft) verwendet werden, können als beeinflussende Variablen für das Modell eingeschlossen werden. Die Variablen werden verwendet, um die Analyse des Signals zu verfeinern.

Das Signal ist die Zielvariable, für die Sie die Werte erklären oder prognostizieren möchten, und besteht aus mehreren Komponenten. Wenn Sie beispielsweise die Produktverkäufe für die nächsten sechs Monate prognostizieren möchten, ist der Produktumsatz Ihre Signalvariable. Zu den Komponenten gehören:

  1. Der Trend gibt an, wohin die Zeitreihe geleitet wird und in welche Richtung sie im Allgemeinen geht. Er kann abnehmen, zunehmen oder flach sein.
  2. Periodisch sind die Saisonalitäts- und Periodenmuster, die im Laufe der Zeit regelmäßig reproduziert werden.
  3. Die Schwankung spiegelt die Abhängigkeiten des Werts des Signals zum Zeitpunkt „t" von den vorherigen Werten „t-1"… „t-10"… „t-n" wider.
  4. Die Residuen sind das, was vom Signal übrig bleibt, wenn Trends, Perioden und Schwankungen entfernt wurden. Rückstände gelten als weißes Rauschen - ein rein zufälliger Effekt.

Frage: Wie lautet der Name der regulären Gipfel und Mulden, die durch die orangefarbene Linie im Diagramm unten dargestellt sind?

Ein Diagramm, das ein Beispiel für ein Signaldiagramm zeigt.

Antwort: Wenn Sie Periodisch gesagt haben, sind Sie richtig! Die im obigen Diagramm dargestellten regulären Spitzen und Mulden sind ein Beispiel für ein periodisches Signal.

Notiz

Das Zeitreihenprognosemodell in SAP Analytics Cloud ist additiv. Die Prognosen werden berechnet, indem die für den Trend, die Zyklen und die Schwankungen berechneten Werte addiert werden.

Prognosehorizont

Der Horizont ist die Anzahl der Prognosen, die in der Zukunft geschätzt werden sollen. Diese Anzahl hängt direkt von der Größe der Vergangenheitsdaten ab.

5:1 ist ein gutes Verhältnis, um den Horizont zu schätzen und Prognosen mit relevanten Konfidenzintervallen zu erhalten. Das bedeutet, dass bei 100 historischen Fällen 20 Werte der Zielvariablen in der Zukunft vorhergesagt werden können. Um sechs Monate im Voraus vorherzusagen, müssen 30 Monate historische Daten bereitgestellt werden.

Best Practice:

  • Es wird generell empfohlen, die zu weit entfernte Historie zu verwerfen.
  • Obwohl 20 oder weniger Werte ausgewählt werden können, ist es besser, mehr historische Fälle zu sammeln, wenn mehr benötigt werden.
  • Mithilfe der Prognoseszenarioeinstellungen beim Erstellen Ihres Zeitreihenmodells können Sie das verwendete Zeitfenster definieren, indem Sie entweder alle verfügbaren Monate verwenden oder auf einen bestimmten Zeitraum einschränken.
Historische Daten und der Horizont.

In SAP Analytics Cloud werden die historischen Daten automatisch chronologisch sortiert und in zwei Sätze aufgeteilt:

  1. Die ersten 75 % der Daten werden zum Trainieren des Zeitreihen-Prognosemodells verwendet.
  2. Die restlichen 25 % werden verwendet, um das beste Kandidatenmodell auszuwählen. 

Wie werden die Daten intern partitioniert, um das Prognosemodell zu optimieren?

Smart Predict verwendet die Trainings- und Validierungsdatensätze und führt beim Anlegen eines Zeitreihenmodells die folgenden Schritte aus:

  1. Aus dem Trainingsdatenset werden mehrere Testversionen des Zeitreihenmodells trainiert.
  2. Die beste Testversion des Zeitreihenmodells wird ausgewählt.
  3. Die Testversion wird über das Validierungsset ausgewertet.
  4. Das endgültige Prognose-Zeitreihenmodell wird angelegt.
Der vierstufige Prozess zum Anlegen eines Zeitreihenmodells mithilfe von Trainings- und Validierungsdatensets.

Überlegungen beim Anlegen eines Zeitreihenprognosemodells

Beim Anlegen Ihres Zeitreihenprognosemodells sind einige Überlegungen zu beachten:

  1. Skala der Prognosen: Berücksichtigen Sie die Skala der Prognosen. Wenn beispielsweise historische Daten pro Monat, Woche, Tag, Stunde oder Minute erfasst werden, werden die Prognosen in derselben Zeiteinheit erstellt. Wenn Datenwerte jeden Monat aufgezeichnet werden, ist es daher nicht sinnvoll, Vorhersagen für die nächsten Tage anzufordern. Wenn Daten jede Minute von Sensoren aufgezeichnet werden, die Minute jedoch für den Anwendungsfall nicht relevant ist, sollte eine höhere Zeiteinheit wie Stunde verwendet werden.
  2. Aggregation: Berücksichtigen Sie die Aggregation von Daten in der benötigten Zeiteinheit und definieren Sie eine Aggregationsfunktion.
    • Eine Aggregationsfunktion könnte beispielsweise aus den 60 gemessenen Werten für jede der 60 Minuten dieser Stunde einen Wert für die Stunde berechnen. Dabei kann es sich um den ersten Wert, den letzten Wert, den mittleren Wert oder einen berechneten Wert handeln. Zum Beispiel der Durchschnitt oder eine komplexere Formel.
    • Ein wichtiger Punkt, den Sie beachten müssen, ist die Größe der Aggregation. Eine große Aggregation kann Informationen ausblenden und die Qualität der Vorhersagen verringern. Eine entsprechende Aggregation glättet das Signal jedoch, wenn es viel Rauschen gibt. Testen und experimentieren Sie, um die beste Aggregationsfunktion zu wählen.
  3. Sortierung der Daten: Der historische Datensatz muss so bereinigt werden, dass jede Zeiteinheit nur einem Wert der Zielvariablen entspricht. Smart Predict sortiert die Daten automatisch.