Understanding the Replication Process

Objective

After completing this lesson, you will be able to describa los componentes y las tecnologías de replicación.

El proceso de replicación

La replicación normalmente significa copiar datos directamente de un sistema a otro en tiempo real. Por lo general, se realiza a nivel de tabla.

Hay algunos motivos por los que puede tener en cuenta la replicación, entre los que se incluyen:

  • Desea duplicar datos en otro sistema que tiene diferentes herramientas y opciones tecnológicas. Este sistema le permitirá crear una aplicación específica.

  • Desea distribuir datos a uno o más destinos en tiempo real para compartir información.

  • Desea migrar datos de un sistema antiguo a un sistema nuevo.

  • Ha accedido a los datos de forma remota (sin persistencia), pero el rendimiento se ha vuelto inaceptable, quizás debido al aumento del volumen de datos.

Para configurar la replicación de datos mediante SAP HANA, es importante comprender el proceso subyacente y los objetos de base de datos asociados a él.

Componentes de replicación

Para replicar una tabla de origen, es necesario configurar el acceso a esa tabla. Esto se realiza creando una fuente remota y una tabla virtual, como se describe en la unidad anterior.

Además, debe crear la tabla de destino para almacenar los datos replicados. La tabla de destino puede tener la misma estructura que la tabla de origen, ser un subconjunto de la tabla de origen con menos columnas o tener variaciones en las definiciones de columna, por ejemplo, para reducir cadenas largas donde no se necesitan todos los caracteres.

Una vez que haya creado la tabla virtual y la tabla de destino, puede definir la suscripción remota. A continuación, la tabla de destino se suscribe a las modificaciones realizadas en los datos a los que accede la tabla virtual.

Esta diapositiva muestra todos los componentes de replicación necesarios.

En función del método utilizado para implementar esta replicación, esos objetos (tabla virtual, tabla de destino, suscripción remota) se crean automáticamente o se deben crear manualmente.

Tecnologías de replicación

En función de su sistema SAP HANA: local o en la nube, y en función del tipo de fuente de datos desde el que desee replicar, hay diferentes tecnologías de replicación disponibles.

Las tecnologías de replicación más comunes son:

  • Replicación de tabla basada en log

    Utiliza el redo log de la base de datos para obtener los cambios en la tabla de origen y reproducirlos. No es intrusivo y se garantiza la integridad transaccional porque solo se replican las transacciones confirmadas.

  • Replicación de tabla basada en desencadenador

    Los desencadenadores se crean en la base de datos de origen para supervisar la tabla de origen y capturar todas las filas modificadas (actualizadas o eliminadas) y las nuevas. Los datos capturados se almacenan en una tabla muestra. También se crea una tabla de cola para registrar todas las modificaciones en la secuencia correcta. Esta tecnología es independiente de la versión de la base de datos fuente y puede ofrecer más funciones que la replicación basada en log, como la replicación de objetos grandes (LOB).

  • Replicación de archivo

    Esta es la tecnología implementada por el FileAdapter y se utiliza para replicar nuevas filas en un archivo. Solo se admite append.

¿Qué tecnología se utiliza?

En función del origen y el destino, y también del adaptador seleccionado, hay diferentes tecnologías disponibles como se muestra a continuación:

Esta diapositiva muestra las diferentes tecnologías que se pueden utilizar para la replicación.

No todos los adaptadores SDI admiten la replicación en tiempo real. La replicación en tiempo real a veces se denomina "captura de datos de modificaciones en tiempo real".

Algunos adaptadores utilizan la replicación basada en log. Suelen tener el sufijo Log.

Existen adaptadores que utilizan la replicación basada en desencadenador, como HANAAdapter.

Varios adaptadores utilizan tecnologías específicas, como FileAdapter.

Algunos adaptadores requieren una configuración específica en el sistema fuente para implementar funciones de replicación.

Nota

Encontrará una lista de adaptadores y sus capacidades en la documentación de ayuda: SAP HANA Smart Data Integration y SAP HANA Smart Data Quality - Guía de configuración para otros escenarios de SAP HANA

Si está replicando en una base de datos SAP HANA local, debe utilizar la integración de datos inteligentes (SDI) para conectarse a la fuente de datos. Pero con la base de datos de SAP HANA Cloud como destino para la replicación, también puede utilizar el acceso a datos inteligentes (SDA) para replicar datos de una base de datos de SAP HANA. La tecnología utilizada es una replicación optimizada basada en log. Este tipo de replicación se denomina replicación de tablas remotas (RTR).

Autorizaciones necesarias

Para implementar la replicación de tablas, se requieren algunas autorizaciones específicas:

  • Para el usuario especificado en la definición de fuente remota:

    Acceso completo al esquema de origen.

    Por ejemplo, si el origen es una base de datos de SAP HANA, el usuario debe tener la autorización CREAR CUALQUIERA en el esquema de origen.

  • Para el usuario que implementa la replicación en la base de datos SAP HANA de destino:
    • CREAR TABLA VIRTUAL y CREAR SUSCRIPCIÓN REMOTA en la fuente remota.
    • CREATE TABLE en el esquema de destino.

Pasos de implementación de replicación

Estos son los pasos básicos para implementar la replicación:

  1. Cree una fuente remota.
  2. Cree una tabla virtual basada en la fuente remota.
  3. Cree la tabla de destino: esto se podría hacer antes de los pasos 1 y 2.
  4. Defina la suscripción remota utilizando la tabla virtual como proveedor y la tabla de destino como receptor.
  5. Poner en cola la suscripción remota, que implica crear desencadenadores fuente, tablas muestra y tablas de cola para la replicación basada en desencadenador (solo aplicable a fuentes remotas SDI).
  6. Si utiliza fuentes remotas SDI, copie los datos fuente iniciales en el destino.
  7. Distribuir los datos, iniciando la captura de datos de modificaciones en tiempo real.

En las siguientes lecciones, aprenderá a implementar estos pasos utilizando las diferentes herramientas de SAP HANA.