Création d'un modèle de série temporelle à l'aide de SAP Analytics Cloud Smart Predict

Objective

After completing this lesson, you will be able to créez un modèle de série temporelle.

Ensembles de données pour un modèle de série temporelle

Récapitulatif de l'ensemble de données d'entrée pour la création de scénarios prédictifs de série temporelle

Le jeu de données d'entraînement contient les observations passées (l'historique) utilisées pour générer le modèle prédictif, ainsi que les données et l'heure auxquelles les observations ont été enregistrées.

  • Dans ce jeu de données, les valeurs de la variable de signal sont connues.
  • L'ensemble de données peut également contenir des variables d'influenceur.
  • Les valeurs passées et futures des variables d'influenceur doivent être connues (au moins pour l'horizon de prévision attendu).

En analysant le jeu de données d'entraînement, Smart Predict génère le modèle de série temporelle.

Modèle de série temporelle avec le volet des paramètres ouvert sur le côté droit.

Limitations

Le jeu de données d'entrée d'entraînement ou d'application ne doit pas contenir plus de 1 000 colonnes.

Lors de l'application du modèle prédictif à un jeu de données d'application, Smart Predict génère des colonnes supplémentaires et le processus d'application peut être bloqué si le jeu de données d'application risque déjà de dépasser la limite de 1 000 colonnes.

Créer et entraîner un modèle de série temporelle

Options pour les modèles de série temporelle

Comme pour les modèles de classification et de régression, vous devez sélectionner votre source de données et modifier les détails de votre colonne. Cependant, des options spécifiques sont utilisées lors de la création et de l'entraînement d'un modèle de série temporelle qui sont abordées dans ce sujet.

Objectif prédictif

Cible : la variable Cible est le signal pour lequel vous souhaitez prédire ou expliquer les valeurs.

Date : la variable Date est obligatoire pour les modèles de série temporelle.

Quelle que soit la granularité de la date sélectionnée dans les scénarios prédictifs de série temporelle avec un jeu de données comme source de données, chaque format de date doit inclure les années, les mois et les jours. Par conséquent, même si une prévision trimestrielle ou mensuelle est requise, le format de date dans l'ensemble de données doit toujours inclure les jours.

Par exemple, pour le format de date AAAA-MM-JJ, les scénarios prédictifs de série temporelle peuvent être créés dans lesquels la granularité de la date peut être :

  • Année, au format AAAA-01-01 où AAAA est variable (exercice glissant).
  • Trimestre ou Mois, au format AAAA-MM-01 où AAAA-MM est variable (mois glissant).
  • Données hebdomadaires au format de date AAAA-MM-JJ, par exemple le premier jour de la semaine comme caractères JJ (semaine glissante).
  • Jour (dates calendaires), au format AAAA-MM-JJ où AAAA-MM-JJ est variable (jour glissant).

Nombre de périodes de prévisions : nombre de prévisions à générer. Si le jeu de données d'entrée contient des valeurs futures pour les influenceurs, le nombre de prévisions doit être inférieur ou égal au nombre de valeurs futures dans l'ensemble de données. S'il existe des valeurs futures pour les six prochains mois, le nombre de prévisions demandées ne peut pas dépasser six.

Le nombre de prévisions fournies avec des intervalles de confiance est déterminé comme suit :

  • Si la taille du jeu de données d'entraînement est égale ou inférieure à 12 périodes, elle est traitée comme un petit jeu de données. Par défaut, le nombre de prévisions avec des intervalles de confiance est défini sur 1.
  • Dans d'autres cas, le nombre de prévisions avec des intervalles de confiance est défini sur 1/5 de la taille du jeu de données d'entraînement.
  • Si le jeu de données d'entraînement contient 1 000 lignes de données, Smart Predict peut fournir jusqu'à 200 prévisions avec des intervalles de confiance. Si plus de 200 prévisions sont requises, l'exactitude des prévisions à partir de la 201ème ne peut pas être évaluée.

Entité : l'entité est une variable facultative utilisée pour fractionner le modèle prédictif en segments, chacun produisant son propre modèle prédictif, avec des prévisions distinctes pour chaque segment.

Par exemple, il peut être plus pertinent d'avoir des KPI à la fois sur les points de vente et les produits. Si ce type de prévision est utile, cliquez sur la case et sélectionnez les colonnes pour les valeurs à utiliser pour la segmentation.

Modèle de série temporelle avec la section Source de données de série temporelle et objectifs prédictifs affichée.

Limitations pour les modèles de série temporelle : si le modèle prédictif est configuré pour certaines périodes de prévision et/ou entités au-delà des limites maximales recommandées, il est susceptible de créer des problèmes de performance qui peuvent avoir un impact sur d'autres utilisateurs sur le même locataire SAP Analytics Cloud.

  • Le nombre maximal d'entités est de 1 000.
  • Le nombre maximal de périodes de prévisions (indépendamment du nombre d'entités) est de 500.

Entraînement du modèle prédictif

Entraînement à l'aide de : sélectionnez les observations à utiliser lors de l'entraînement du jeu de données pour le modèle de série temporelle. Vous disposez de deux options :

  1. Toutes les observations : entraînez le modèle prédictif à l'aide de toutes les observations disponibles dans le jeu de données. Sélectionnez la date de la dernière observation ou définissez la dernière date.
  2. Fenêtre des observations : indiquez une période restreinte d'observations. Sélectionnez le nombre de jours, semaines, mois ou années à inclure dans la fenêtre d’observation. Sélectionnez la date de la dernière observation ou définissez la dernière date (cette date doit être disponible dans le jeu de données).

Jusqu'à : vous disposez de deux options :

  1. Dernière observation : Laisser l'application utiliser la dernière date de référence d'entraînement comme base.
  2. Date définie par l'utilisateur : sélectionnez une date spécifique (disponible dans l'ensemble de données).

Exclure en tant qu'influenceur : les valeurs passées et futures des variables d'influenceur doivent être connues (au moins pour l'horizon de prévision attendu). Sélectionnez les variables d'influenceur à exclure lorsque le modèle de prévision de série temporelle est entraîné.

Convertir les valeurs prévisionnelles négatives en zéro : convertir les prévisions négatives à zéro. Cela est utile lorsque les valeurs négatives ne sont pas pertinentes pour le scénario de gestion, par exemple, le nombre de naissances. Les valeurs négatives sont forcées de prendre une valeur nulle, ayant une influence sur le calcul de l'erreur et la sélection du meilleur modèle prédictif.

Modèle de série temporelle avec la section Entraînement du modèle prédictif affichée.

Création et entraînement d'un modèle de série temporelle

Scénario de gestion : vous travaillez pour une petite entreprise qui souhaite prévoir son flux de trésorerie quotidien au cours des 21 prochains jours ouvrés. Ils ont environ neuf mois de données historiques sur les flux de trésorerie des jours ouvrés et ont créé un certain nombre de variables d'influenceur pour essayer d'améliorer la précision du modèle.

Les données qui vous ont été fournies sont les suivantes :

Données fournies

VariableDescription
DateJour, mois et année des relevés.
EspècesFlux de trésorerie
BeforeLastMonday, LastMonday, BeforeLastTuesday, LastTuesday, BeforeLastWednesday, LastWednesday, BeforeLastJeudi, Lastjeudi, BeforeLastFriday, LastFridayVariables booléennes qui indiquent si les informations sont vraies ou fausses
Last5WDays, Last4WDaysVariables booléennes qui indiquent si la date se situe dans les 5 ou 4 derniers jours ouvrables du mois.
LastWMonth, BeforeLastWMonthVariables booléennes qui indiquent si les informations sont vraies ou fausses.
WorkingDaysIndices, ReverseWorkingDayIndicesIndices ou indices inverses des jours ouvrables.
LundiMonthInd, mardiMonthInd, mercreMonthInd, jeudiMonthInd, vendrediMonthInd,Indices des jours de la semaine dans le mois.
Last5WDaysInd, Last4WDAysIndIndices des cinq ou quatre derniers jours ouvrables du mois.

Flux de tâches : dans cet exercice pratique, vous allez :

  1. Créez un scénario prédictif de série temporelle.
  2. Sélectionnez la source de données pour le modèle de série temporelle.
  3. Modifiez les détails de la colonne de source de données de série chronologique.
  4. Définissez la cible de l'objectif prédictif, la date et les périodes.
  5. Entraînez le modèle.