
Introducción a la transformación de datos
La transformación de datos es el proceso de modificar el formato, la estructura o los valores de los datos brutos de los sistemas ERP para cargar un archivo en el sistema de minería de procesos. Este archivo final se denomina registro de eventos e incluye todos los eventos registrados con su cronomarcador asignado a determinados ID de caso.
Esta transformación de datos normalmente se logra a través de:
- Traducción y asignación
- Filtrado, agregación e integración
- Enriquecimiento e imputación
- Indexación y ordenación
- Anonimización y cifrado
- Modelado, encasillado, formato y cambio de nombre
Acciones en el sistema Dejar un seguimiento a seguir
Cada paso de un sistema se registra y deja un trace. Si observamos un ejemplo del ciclo de aprovisionamiento, determinados business objects del sistema se utilizan a través de pasos:
- Solicitud de pedido (PR)
- Pedido (PO)
- Factura
Todas las modificaciones y transacciones que hacen referencia a estos objetos se almacenan en una base de datos. Ahora, con Process Intelligence, se pueden explorar esos detalles. Se extraen y se transforman de una manera que permite el backtracking de todos los pasos. Por último, estos pasos recreados se almacenan en un log de eventos.

¿Por qué se deben transformar los datos?
Todos los datos de proceso se almacenan en tablas de una base de datos. Para fines de análisis, es importante que los datos sean uniformes y estandarizados. Puede haber diferencias en los datos, especialmente si provienen de diferentes sistemas fuente (por ejemplo, diferentes formatos de datos o tipos de datos). Normalmente, los datos se alinean con un formato de destino específico.
Pasos para la transformación de datos.
- Definición del formato de destino
- Conversión de los datos extraídos
- Guardar los datos convertidos en un nuevo archivo

Importancia
¿Por qué es necesaria la transformación de datos? Porque todos los datos se almacenan en diferentes tablas. Debemos asegurarnos de que los datos extraídos estén vinculados a sus casos específicos. ¿Cómo sabrá un sistema que el ID de pedido 123 en la tabla de pedidos y el ID de factura 456 en la tabla de facturas pertenecen al mismo caso?
¿Cuál es tu caso?
La definición del identificador de caso correcto (ID) es uno de los puntos más importantes en la transformación de datos. El ID de caso define el alcance del proceso. Determina dónde comienza y finaliza el proceso. En un proceso de aprovisionamiento, si el ID de caso está definido por el ID de documento de compra, cada solicitud individual se considerará un caso nuevo; no importa si se pueden combinar varias solicitudes en un solo pedido.
Si el ID de caso está definido por el ID de pedido, el conjunto de datos contendrá todos los pedidos como casos, independientemente de sus solicitudes de compra subyacentes. Una combinación de ambos también daría lugar a casos para cada solicitud de compra. Al final, la respuesta depende de qué business object o documento se debe analizar en términos de su ciclo de vida.
Carga de datos
La última parte de ETL es la fase Carga de datos. Esto cubre las tareas para cargar los datos transformados en el sistema de minería de procesos. Los siguientes puntos deben abordarse para su carga de datos.
Seleccione cada nivel en la figura para obtener más información.