Configuration et exigences en matière de données

Objective

After completing this lesson, you will be able to expliquer les exigences en matière de données et la configuration

Configuration et exigences en matière de données

Introduction à la transformation des données.

Introduction à la transformation des données

La transformation de données est le processus de modification du format, de la structure ou des valeurs des données brutes des systèmes ERP afin de charger un fichier dans le système d'exploration de processus. Ce fichier final est appelé journal des événements et inclut tous les événements enregistrés avec leur horodatage affecté à certains ID de cas.

Cette transformation de données est généralement réalisée via :

  • Traduction et mappage
  • Filtrage, agrégation et compression
  • Enrichissement et imputation
  • Indexation et tri
  • Anonymisation et chiffrement
  • Modélisation, catégorisation, mise en forme et changement de nom

Actions dans le système Quitter une trace pour suivre

Chaque étape d'un système est enregistrée et laisse une trace. En examinant un exemple d'approvisionnement, certains objets de gestion du système sont utilisés dans les étapes suivantes :

  • Demande d'achat (PR)
  • Commande d'achat
  • Facturer

Toutes les modifications et transactions se référant à ces objets sont stockées dans une base de données. Désormais, avec Process Intelligence, ces détails peuvent être explorés. Elles sont extraites et transformées d'une manière qui permet le retour en arrière de toutes les étapes. Enfin, ces étapes recréées sont stockées dans un journal des événements

Diagramme représentant la transformation des données des tables de bases de données vers les résultats : liste des cas et des variantes.

Pourquoi les données doivent-elles être transformées ? 

Toutes les données de processus sont stockées dans des tables d'une base de données. À des fins d'analyse, il est important que les données soient uniformes et standardisées. Il peut y avoir des différences dans les données, en particulier si elles proviennent de différents systèmes source (par exemple, différents formats ou types de données). En règle générale, les données sont alignées sur un format cible spécifique.

Étapes pour la transformation des données.

  1. Définition du format cible
  2. Conversion des données extraites
  3. Sauvegarde des données converties dans un nouveau fichier
Diagramme représentant la transformation de données en tables.

Importance

Pourquoi la transformation des données est-elle nécessaire ? Parce que toutes les données sont stockées dans des tables différentes. Nous devons nous assurer que les données extraites sont liées à leurs cas spécifiques. Comment un système saura-t-il que l'ID de commande 123 dans la table de commande et l'ID de facture 456 dans la table de facture appartiennent au même cas ?

Quel est votre cas ?

La définition de l'identifiant de cas correct (ID) est l'un des points les plus importants de la transformation des données. L'identifiant de cas définit le périmètre du processus. Il détermine l'endroit où le processus commence et se termine. Dans un processus d'approvisionnement, si l'ID de cas est défini par l'ID du document d'achat, chaque demande sera considérée comme un nouveau cas. Peu importe que plusieurs demandes puissent être combinées en une seule commande.

Si l'ID de cas est défini par l'ID de commande, l'ensemble de données contiendra toutes les commandes en tant que cas, quelles que soient leurs demandes d'achat sous-jacentes. Une combinaison des deux entraînerait également des cas pour chaque demande d'achat. À la fin, la réponse dépend de l'objet de gestion ou du document à analyser en termes de cycle de vie.

Chargement des données

La dernière partie d'ETL est la phase de chargement des données. Cela couvre les tâches de chargement des données transformées dans le système Process Mining. Les points suivants doivent être traités pour votre chargement de données.

Sélectionnez chaque niveau dans la figure pour plus d'informations.

Chargement des données