Introducción
El aprovisionamiento de datos es un término muy amplio y hace referencia a la adquisición de datos de un sistema fuente a un sistema de destino. Se prefiere la adquisición de palabras, y no la carga de datos porque los datos se pueden adquirir sin la necesidad de cargarlos físicamente en un sistema de destino. De hecho, con los avances tecnológicos, mover datos alrededor de una organización es cada vez menos común. A menudo es mucho más sencillo leer los datos de forma remota.
Hay muchos motivos por los que se necesita el aprovisionamiento de datos. Esto incluye:
- Extraer datos de aplicaciones empresariales y cargarlos en un almacén de datos central
- Brinde acceso en tiempo real a fuentes de datos para analíticas
- Distribuir datos de un sistema central a sistemas regionales
- Consolidar datos de múltiples sistemas en un sistema central
- Mantener los sistemas sincronizados
- Migrar datos de un sistema existente a un sistema nuevo
En los escenarios de aprovisionamiento de datos más simples, solo hay dos sistemas implicados: la fuente y el destino. Pero a menudo hay múltiples sistemas involucrados. Por ejemplo, es posible que desee combinar datos de varios sistemas fuente a un único sistema de destino. También podría ir por otro lado: un único sistema fuente que distribuya sus datos a varios sistemas de destino. Y, por último, incluso podemos tener una combinación de ambos: múltiples sistemas fuente que consolidan datos y los distribuyen a múltiples sistemas de destino.
Inicie el siguiente vídeo para obtener más información sobre los conceptos básicos detrás del aprovisionamiento de datos:
Aplicación o control de base de datos del aprovisionamiento de datos
El aprovisionamiento de datos se puede controlar mediante aplicaciones independientes y especializadas o utilizando las herramientas integradas de una base de datos. Consideremos cada enfoque.
El aprovisionamiento de datos controlado por la aplicación es cuando una aplicación dedicada controla el flujo de datos. Estas aplicaciones proporcionan herramientas para conectarse a fuentes de datos y destinos de datos y para definir reglas de flujo de datos que determinan cómo se mueven los datos entre sistemas. Entre los ejemplos de aplicaciones de aprovisionamiento de datos dedicadas se incluyen SAP Data Services, SAP Landscape Transformation y SAP Datasphere.
Con este enfoque controlado por la aplicación, la aplicación extrae datos de una base de datos fuente y los carga en una base de datos de destino. La aplicación gestiona las reglas de extracción, la lógica de proceso y los métodos de carga. Piense en la aplicación de aprovisionamiento de datos como el organizador del movimiento de datos entre sistemas. En algunos casos, la aplicación de aprovisionamiento de datos extrae los datos de origen y los almacena temporalmente antes de enviarlos al sistema de destino. Esto se suele encontrar en casos en los que se deben combinar varias fuentes de datos y se necesita un área de staging para sincronizar los datos, que pueden llegar en diferentes momentos.
Uno de los motivos clave para utilizar una aplicación de aprovisionamiento de datos dedicada es cuando trabaja con varias fuentes de datos que utilizan diferentes tecnologías o provienen de diferentes proveedores. Estas aplicaciones dedicadas normalmente pueden procesar datos de cualquier fuente, por ejemplo, bases de datos, archivos CSV, archivos JSON y servicios web. Algunos incluso pueden conectarse a aplicaciones empresariales directamente, por ejemplo, extractos de SAP BW/4HANA de SAP S/4HANA a nivel de aplicación y no de las tablas de base de datos. En este caso, la lógica de flujo de datos se crea en un nivel superior al de la tecnología de almacenamiento físico.

Ahora veamos el aprovisionamiento de datos controlados por la base de datos.
El requisito básico es que la base de datos proporcione las herramientas de aprovisionamiento de datos. El tipo más simple de herramienta de aprovisionamiento de datos podría ser una herramienta de exportación e importación para mover datos de una base de datos a otra. Pero algunas bases de datos, incluida SAP HANA, proporcionan herramientas sofisticadas para gestionar escenarios de aprovisionamiento de datos complejos, como los que requieren combinar datos, validar datos y enriquecer datos. Utilizar las herramientas integradas de una base de datos para gestionar el aprovisionamiento de datos significa que no tiene que implementar aplicaciones de aprovisionamiento de datos separadas, como hemos descrito anteriormente. Este enfoque admite una infraestructura más simple.
Trabajar con herramientas proporcionadas por la base de datos es lo que entendemos por aprovisionamiento de datos controlado por la base de datos. El flujo de datos se controla mediante herramientas que forman parte de la base de datos.

Este curso cubre las herramientas de aprovisionamiento de datos integradas de SAP HANA local y SAP HANA Cloud.



