Comprender el proceso de replicación

Objective

After completing this lesson, you will be able to describa los componentes y tecnologías de replicación.

El proceso de replicación

La replicación normalmente significa copiar datos directamente de un sistema a otro en tiempo real. Por lo general, se realiza a nivel de tabla.

Existen algunos motivos por los que puede tener en cuenta la replicación, entre los que se incluyen:

  • Desea duplicar datos en otro sistema que tiene diferentes herramientas y opciones tecnológicas. Este sistema le permitirá crear una aplicación específica.

  • Desea distribuir datos a uno o más destinos en tiempo real para compartir información.

  • Desea migrar datos de un sistema antiguo a un sistema nuevo.

  • Ha accedido a los datos de forma remota (sin persistencia), pero el rendimiento se ha vuelto inaceptable, tal vez debido al aumento de los volúmenes de datos.

Para configurar la replicación de datos mediante SAP HANA, es importante comprender el proceso subyacente y los objetos de base de datos asociados a él.

Componentes de replicación

Para replicar una tabla de origen, es necesario configurar el acceso a esa tabla. Esto se realiza creando una fuente remota y una tabla virtual, como se describe en la unidad anterior.

Además, debe crear la tabla de destino para almacenar los datos replicados. La tabla de destino puede tener la misma estructura que la tabla de origen, ser un subconjunto de la tabla de origen con menos columnas o tener variaciones en las definiciones de columna, por ejemplo, para reducir las cadenas largas en las que no se necesitan todos los caracteres.

Una vez que haya creado la tabla virtual y la tabla de destino, puede definir la suscripción remota. A continuación, la tabla de destino se suscribe a las modificaciones realizadas en los datos a los que accede la tabla virtual.

Esta diapositiva muestra todos los componentes de replicación necesarios.

En función del método utilizado para implementar esta replicación, esos objetos (tabla virtual, tabla de destino, suscripción remota) se crean automáticamente o deben crearse manualmente.

Tecnologías de replicación

En función de su sistema SAP HANA: local o en la nube, y en función del tipo de fuente de datos desde el que desee replicar, hay disponibles diferentes tecnologías de replicación.

Las tecnologías de replicación más comunes son:

  • Replicación de tabla basada en log

    Utiliza el redo log de la base de datos para obtener modificaciones en la tabla de origen y reproducirlas. No es intrusivo y la integridad transaccional está asegurada porque solo se replican las transacciones confirmadas.

  • Replicación de tabla basada en desencadenador

    Los desencadenadores se crean en la base de datos fuente para supervisar la tabla fuente y capturar todas las filas nuevas y modificadas (actualizadas o eliminadas). Los datos capturados se almacenan en una tabla muestra. También se crea una tabla de cola para registrar todas las modificaciones en la secuencia correcta. Esta tecnología es independiente de la versión de la base de datos fuente y puede ofrecer más funciones que la replicación basada en log, como la replicación de objetos grandes (LOB).

  • Replicación de archivos

    Esta es la tecnología implementada por FileAdapter y se utiliza para replicar nuevas filas en un archivo. Solo se admite el append.

¿Qué tecnología se utiliza?

En función de la fuente y el destino, y también del adaptador seleccionado, hay diferentes tecnologías disponibles como se muestra a continuación:

Esta diapositiva muestra las diferentes tecnologías que se pueden utilizar para la replicación.

No todos los adaptadores SDI admiten la replicación en tiempo real. La replicación en tiempo real a veces se denomina Captura de datos de modificaciones en tiempo real.

Algunos adaptadores utilizan la replicación basada en log. Normalmente tienen el sufijo Log.

Existen adaptadores que utilizan la replicación basada en desencadenador, como HANAAdapter.

Varios adaptadores utilizan tecnologías propias específicas, como FileAdapter.

Algunos adaptadores requieren una configuración específica en el sistema fuente para implementar funciones de replicación.

Si está replicando en una base de datos SAP HANA local, debe utilizar la integración de datos inteligentes (SDI) para conectarse a la fuente de datos. Pero con la base de datos de SAP HANA Cloud como destino de replicación, también puede utilizar el acceso a datos inteligentes (SDA) para replicar datos de una base de datos de SAP HANA. La tecnología utilizada es una replicación optimizada basada en log. Este tipo de replicación se denomina replicación de tablas remotas (RTR).

Autorizaciones necesarias

Para implementar la replicación de tablas, se requieren algunas autorizaciones específicas:

  • Para el usuario especificado en la definición de fuente remota:

    Acceso completo en el esquema de origen.

    Por ejemplo, si el origen es una base de datos de SAP HANA, el usuario debe tener el privilegio CREATE ANY en el esquema de origen.

  • Para el usuario que implementa la replicación en la base de datos de SAP HANA de destino:
    • CREATE VIRTUAL TABLE y CREATE REMOTE SUBSCRIPTION en la fuente remota.
    • CREATE TABLE en el esquema de destino.

Pasos de implementación de replicación

Estos son los pasos básicos para implementar la replicación:

  1. Crear una fuente remota.
  2. Cree una tabla virtual basada en la fuente remota.
  3. Cree la tabla de destino; esto podría hacerse antes de los pasos 1 y 2.
  4. Defina la suscripción remota utilizando la tabla virtual como proveedor y la tabla de destino como receptor.
  5. Poner en cola la suscripción remota, que implica crear desencadenadores fuente, tablas muestra y tablas de cola para la replicación basada en desencadenador (solo aplicable a fuentes remotas SDI).
  6. Si utiliza fuentes remotas SDI, copie los datos fuente iniciales en el destino.
  7. Distribuir los datos, iniciando la captura de datos de modificaciones en tiempo real.

En las siguientes lecciones, aprenderá a implementar estos pasos utilizando las diferentes herramientas de SAP HANA.