Création d'un modèle de régression dans SAP Analytics Cloud Smart Predict

Objective

After completing this lesson, you will be able to créez un modèle de régression.

Ensembles de données pour un modèle de régression

Récapitulatif de l'ensemble de données d'entrée pour la création de scénarios de régression

La source de données d'entraînement contient les observations passées utilisées pour générer le modèle de régression. Dans cet ensemble de données, les valeurs de la variable cible, qui est la variable correspondant à votre problème de gestion, sont connues.

En analysant le jeu de données d'entraînement, Smart Predict génère un modèle de régression qui explique et prédit la variable cible, en fonction des variables identifiées comme influenceurs.

Une fois le modèle de régression entraîné, il peut être appliqué à un jeu de données d'application, en générant les valeurs prédites de la cible dans le jeu de données de sortie.

Un écran de modèle de régression avec le volet Paramètres ouvert à droite de l'écran. Paramètres clés : source de données d'entraînement, cible et exclure en tant qu'influenceurs.

Création et entraînement d'un modèle de régression

Scénario de gestion : Avant qu'une banque ne propose un prêt immobilier, il est essentiel de procéder à une évaluation à domicile. L'évaluation confirme la validité du prix de vente de la propriété pour la banque.

Il vous a été demandé de construire et d'entraîner un modèle de régression qui estime le prix d'une maison, en fonction de plusieurs facteurs, y compris: pieds carrés de la maison, pieds carrés de lot, nombre de chambres, nombre de salles de bains, emplacement, etc. Des données vous ont été fournies pour les variables suivantes :

Données variables

VariableDescription
IDID unique pour chaque client.
DateDate de vente de la succession. Cette variable doit être exclue pour ce modèle de régression.
PRIXLe prix de vente de la propriété en dollars. Le prix est la variable que vous essayez de prédire.
CHAMBRESNombre de chambres au-dessus du sous-sol.
CHAMBRES DE BAINSNombre de salles de bains au-dessus du sous-sol.
SQFT_LIVISurface habitable au-dessus du sol en pieds carrés.
SQFT_LOTMesure du pied carré pour tous les étages.
ÉTAGESNombre d'étages.
WATERFRONTY a-t-il un front de mer sur la propriété ? Oui = 1/Non = 0
ConditionNotation de la condition globale.
GRADENote globale.
YR_BUILTDate de construction de la propriété d'origine (année).
ZIPCODEEmplacement du domicile

Flux de tâches : dans cet exercice pratique, vous allez :

  1. Créez un modèle de régression.
  2. Entraînez le modèle de régression.
  3. Vérifiez la sortie du modèle de régression.