
Introduction à ETL
Données et ETL
Il n'y a pas d'exploration de données sans données. Pour l'exploration de processus, nous analysons les données liées aux processus à l'aide d'un outil d'exploration spécialisé pour obtenir des informations sur les inefficacités et les améliorations des processus.
Les données de processus sont masquées dans les systèmes ERP qui capturent les données dans des tables. Il doit d'abord être extrait, puis transformé dans un format spécifique avant de pouvoir être analysé par un outil d'exploration de processus tel que SAP Signavio Process Intelligence.
Dans cette optique, ces sections suivantes vous présenteront le concept général sur la manière de préparer les données altérables pour l'exploration. Ce concept est appelé ETL et signifie :
- Extraction [Données]
- Transformation [Données]
- [Données] Charger
Extraction de données
Qu'est-ce que l'extraction de données ? En termes de processus de gestion, cela signifie la récupération de toutes les données de gestion dans le système utilisé pour l'exploration de processus.
La création d'un vidage de la mémoire est facile. Mais quelles sont les données requises et où sont-elles stockées ? Nous devons nous demander cela pour identifier les données pertinentes à extraire.
Demandez-vous
- De quel processus s'agit-il ?
- Quels systèmes informatiques sont utilisés ?
- Quelle est la période ?
- Quelles activités (événements) basées sur le système sont exécutées dans le processus ?
- Toutes les activités enregistrées ont-elles un horodatage ?
- Toutes les activités sont-elles suivies dans le système de données ?
- Quelles informations supplémentaires sont requises pour une analyse (par exemple, type de produit, valeur de commande, etc.) ?

Les exigences clés minimales incluent un cas valide avec un ID de cas, un identifiant de nom d'événement et un horodatage pour chaque événement. Idéalement, la période inclut TOUS les enregistrements, mais il peut s'agir d'un grand nombre de données. La plupart des sociétés définiront la période sur un paramètre plus petit, par exemple 1 an.
Chaque fois qu'un délai limité est pris en compte, il y aura des cas incomplets puisque certains peuvent avoir été entièrement exécutés dans ce délai. Maintenant, vous devez demander s'ils doivent être inclus à partir de l'extraction ? Vous devez répondre à ces questions avant l'extraction des données.
Exemple de processus
Voyons maintenant comment extraire nos données. Suivez ces 3 étapes pour vous assurer que les données correctes sont extraites.
Extraction de données
Extraction de données de plusieurs systèmes
Le processus peut également être pris en charge par plusieurs systèmes. Dans ce cas, il est recommandé de commencer petit en extrayant les données d'un système pour obtenir vos premiers résultats. D'autres données peuvent être incluses pour développer le processus dans l'itération suivante.
Si les données sont difficiles à extraire (dans le cas de systèmes externes) ou s'il n'existe pas d'identifiant unique pour suivre les cas dans le système, vous pouvez combiner deux valeurs, telles que la valeur de commande et le temps de commande. Vous pouvez également réduire la période du processus si l'ID ne peut pas être créé.