Introduction de modèles de série temporelle dans SAP Analytics Cloud Smart Predict

Objective

After completing this lesson, you will be able to expliquez l'analyse des séries temporelles dans Smart Predict.

Cas d'utilisation des modèles de série temporelle

Utilisation de l'analytique augmentée pour contrôler la gestion des déplacements professionnels

La prévision de série temporelle est utile pour estimer les valeurs futures d'une mesure pour laquelle vous disposez d'une dimension Période pour vous aider à identifier une tendance.

Dans l'étude de cas, nous vous présentons un scénario d'utilisation de modèles de série temporelle pour contrôler les dépenses.

Quels types de sujets pouvons-nous examiner avec un modèle de série temporelle ?

Vous pouvez répondre à des questions telles que :

  • Comment les revenus d'une boutique évolueront-ils au cours du mois prochain ?
  • Quelles sont les ventes attendues par produit et par région pour les prochaines semaines ?
  • En quoi le stock de produits variera-t-il dans un magasin au cours des semaines suivantes ?
  • Comment le flux de trésorerie évoluera-t-il au cours du prochain trimestre ?

Analyse de série temporelle dans Smart Predict

Qu'est-ce qu'une série chronologique ?

Une série chronologique est une série de points de données indexés dans l'ordre temporel. Normalement, une série chronologique est une séquence prise à des moments successifs également espacés dans le temps. Par exemple, une série chronologique peut suivre le mouvement des produits ou des coûts sur une période donnée, avec des points de données enregistrés à intervalles réguliers. Par exemple, hebdomadaire, mensuel, trimestriel ou annuel.

Modèle de série temporelle affichant les coûts au fil du temps.

Signaux

Les valeurs historiques de la variable cible et les dates correspondantes sont requises lors de la création et de l'entraînement d'un modèle de série temporelle. Ces données "couple" de date et de valeur cible sont appelées signal. Le modèle de prévision de série temporelle dans Smart Predict analyse le signal. Les valeurs d'autres variables prises aux mêmes dates (dans le passé et dans le futur) peuvent être incluses en tant que variables d'influenceur pour le modèle. Les variables sont utilisées pour affiner l'analyse du signal.

Le signal est la variable cible pour laquelle vous souhaitez expliquer ou prédire les valeurs et qui se compose de plusieurs composants. Si vous voulez prévoir les ventes de produits pour les six prochains mois, par exemple, Ventes de produits est votre variable de signal. Les composants sont les suivants :

  1. La Tendance identifie l'orientation de la série temporelle et la direction dans laquelle elle tend généralement à aller. Il peut être décroissant, croissant ou plat.
  2. Les Périodiques sont les modèles de saisonnalité et de période reproduits régulièrement au fil du temps.
  3. La Fluctuation reflète les dépendances de la valeur du signal à l'instant "t" sur les valeurs précédentes "t-1"… "t-10"… "t-n".
  4. Les Résidus sont ce qui reste du signal lorsque les tendances, les périodiques et les fluctuations ont été supprimés. Les résidus sont considérés comme du bruit blanc - un effet purement aléatoire.

Question: Quel est le nom des pics et des creux réguliers indiqués par la ligne orange dans le diagramme ci-dessous?

Diagramme montrant un exemple de diagramme de signaux.

Réponse : Si vous avez dit Périodique, vous avez raison ! Les pics et creux réguliers représentés sur le schéma ci-dessus sont un exemple de signal périodique.

Remarque

Le modèle de prévision de série temporelle dans SAP Analytics Cloud est additif. Les prévisions sont calculées en additionnant les valeurs calculées pour la tendance, les cycles et les fluctuations.

Horizon de prévision

L'horizon est le nombre de prévisions à estimer dans le futur. Ce nombre dépend directement de la taille des données historiques.

5:1 est un bon ratio pour estimer l'horizon et obtenir des prévisions avec des intervalles de confiance pertinents. Cela signifie que s'il existe 100 cas historiques, 20 valeurs de la variable cible peuvent être prédites dans le futur. Pour prévoir six mois à l'avance, 30 mois de données historiques doivent être fournis.

Meilleures pratiques :

  • Il est généralement recommandé de rejeter l'historique qui est trop loin dans le temps.
  • Bien que 20 valeurs ou moins puissent être choisies, s'il en faut plus, il est préférable de collecter plus de cas historiques.
  • À l'aide des options du scénario prédictif lors de la création de votre modèle de série temporelle, vous pouvez définir l'intervalle de temps utilisé, à l'aide de tous les mois disponibles ou d'une restriction à une période donnée.
Données historiques et horizon.

Dans SAP Analytics Cloud, les données historiques sont automatiquement triées chronologiquement et divisées en deux ensembles :

  1. Les 75 % premiers des données sont utilisés pour entraîner le modèle de prévision de série temporelle.
  2. Les 25 % restants sont utilisés pour sélectionner le meilleur modèle de candidat. 

Comment les données sont-elles partitionnées en interne pour optimiser le modèle prédictif ?

Smart Predict utilise les jeux de données d'entraînement et de validation et exécute les étapes suivantes lors de la création d'un modèle de série temporelle :

  1. À partir du jeu de données d'entraînement, plusieurs versions d'essai du modèle de série temporelle sont entraînées.
  2. La meilleure version d'essai du modèle de série temporelle est sélectionnée.
  3. La version d'essai est évaluée à l'aide du set de validation.
  4. Le modèle de série temporelle prédictif final est créé.
Processus en quatre étapes pour créer un modèle de série temporelle à l'aide de jeux de données d'entraînement et de validation.

Considérations à prendre en compte lors de la création d'un modèle de prévision de série temporelle

Il existe quelques considérations à prendre en compte lors de la création de votre modèle de prévision de série temporelle :

  1. Échelle des prédictions : tenez compte de l'échelle des prédictions. Par exemple, si les données historiques sont capturées chaque mois, semaine, jour, heure ou minute, les prévisions seront produites dans la même unité de temps. Par conséquent, si des valeurs de données sont enregistrées chaque mois, il n'est pas judicieux de demander des prévisions pour les prochains jours. Si les données sont enregistrées toutes les minutes par des capteurs, mais que la minute n'est pas pertinente pour le cas d'utilisation, une unité de temps plus élevée, telle que l'heure, doit être utilisée.
  2. Agrégation : prenez en compte l'agrégation des données dans l'unité de temps requise et définissez une fonction d'agrégation.
    • Par exemple, une fonction d'agrégation peut calculer une valeur pour l'heure à partir des 60 valeurs mesurées pour chacune des 60 minutes de cette heure. Il peut s'agir de la première valeur, de la dernière valeur, de la valeur moyenne ou d'une valeur calculée. Par exemple, la moyenne ou une formule plus complexe.
    • Un point important à garder à l'esprit est la taille de l'agrégation. Une agrégation importante peut masquer des informations et diminuer la qualité des prévisions. Cependant, une agrégation appropriée lisse le signal lorsqu'il y a beaucoup de bruit. Tester et expérimenter pour choisir la meilleure fonction d'agrégation.
  3. Trier les données : l'ensemble de données historiques doit être nettoyé pour que chaque unité de temps corresponde à une seule valeur de la variable cible. Smart Predict trie automatiquement les données.