Depurar flujos de datos

Objectives

After completing this lesson, you will be able to:
  • Determinar el éxito de un job
  • Utilizar el depurador interactivo

La función Ver datos

Asegúrese de que su trabajo tenga éxito

La mejor medida del éxito de un trabajo es el estado de los datos de destino. Examine siempre los datos para asegurarse de que la operación de movimiento de datos produce los resultados esperados.

  • Los datos no deben convertirse en tipos incompatibles ni truncarse.
  • Los datos no deben estar duplicados en el destino.
  • Los datos no deben perderse entre actualizaciones del destino.
  • Las claves generadas deben haberse incrementado correctamente.
  • Los valores actualizados deben haberse tratado correctamente.

Uso de datos de vista con fuentes y destinos

Como se muestra en la siguiente figura, al utilizar la función Ver datos, es posible verificar el estado de los datos en cualquier momento después de importar los metadatos para una fuente de datos. Los datos se verifican antes o después de procesar los flujos de datos. Verifique los datos cuando se diseñen y prueben los jobs para asegurarse de que el diseño devuelve los resultados esperados.

Detalles de datos

Ver datos le permite ver los datos de origen antes de que se ejecute un job. Utilice los detalles de los datos para:

  • Crear diseños de trabajo de mayor calidad
  • Escanear y analizar datos de tablas y archivos importados desde la biblioteca de objetos local
  • Visualizar los datos para esos mismos objetos dentro de los jobs existentes
  • Consulte los datos de origen después de ejecutar un job

Los datos de vista también permiten verificar los datos de destino antes de que se ejecute un job. Una vez ejecutado el job, visualice los datos modificados. En un flujo de datos, es posible utilizar uno o más paneles Ver datos para comparar datos entre transformaciones y dentro de los objetos de origen y de destino.

Ver datos muestra datos en las filas y columnas de una cuadrícula de datos. La ruta del objeto seleccionado se muestra en la parte superior del panel.

Ver datos en una cuadrícula de datos

El número de filas visualizadas se determina mediante una combinación de varias condiciones:

  • Tamaño de muestra:

    El número de filas muestreadas en la memoria. El tamaño de muestra predeterminado es de 1000 filas para las fuentes, los destinos y las transformaciones importados.

  • Filtrado:

    Las opciones de filtrado que están seleccionadas. Si el conjunto de datos original es menor o si se utilizan filtros, el número de filas devueltas podría ser inferior al predeterminado.

Ver panel de datos

Para abrir un panel Ver datos en un área de trabajo de flujo de datos:

  1. En el área de trabajo de flujo de datos, seleccione el botón de lupa en un objeto de flujo de datos.

    Aparecerá un panel grande Ver datos debajo del área de trabajo actual.

  2. Para comparar datos, seleccione el botón de lupa para otro objeto.

    Aparece un segundo panel debajo del área del área de trabajo y el área del primer panel se contrae para acomodarla.

Solo es posible tener dos ventanas de datos de vista abiertas en cualquier momento. Cuando se selecciona una tercera ventana para abrir, aparece una petición y una de las ventanas se selecciona para cerrarse.

Tablas de origen y destino

Para utilizar Ver datos en tablas de origen y destino:

  • En la ficha Almacén de datos de la Biblioteca de objetos locales, haga clic con el botón derecho en una tabla y seleccione Ver datos en el menú.
  • Aparece la ventana de diálogo Ver datos.

Cuando se rellenan ambos paneles y se selecciona otro botón Ver datos, aparece un pequeño menú que contiene iconos de colocación de ventanas. El área negra de cada icono indica el panel que desea sustituir por un nuevo conjunto de datos. Cuando se selecciona una opción de menú, los datos del último objeto seleccionado sustituyen los datos en el panel correspondiente.

El depurador interactivo

El diseñador incluye un depurador interactivo que permite solucionar problemas de jobs colocando filtros y breakpoints en líneas en un diagrama de flujo de datos. El depurador interactivo permite examinar y modificar datos, fila por fila durante una ejecución de job de modo de depuración.

Ejecutar el job en modo de depuración y, a continuación, navegar al flujo de datos mientras permanece en modo de depuración, le permite explorar cada paso del flujo de datos y ver los datos.

Cuando se ejecuta un job en modo de depuración, Designer muestra varias ventanas adicionales que conforman el depurador interactivo: Llamar pila, trace, variables y ver paneles de datos, que se muestran en la siguiente figura.

Ver panel de datos

El panel izquierdo Ver datos muestra los datos en una tabla de origen, y el panel derecho muestra las filas que se han pasado a la consulta hasta el breakpoint.

Iniciar el depurador interactivo

  1. En el área del proyecto, haga clic con el botón derecho en el job y seleccione Iniciar depuración en el menú.

    Aparece el cuadro de diálogo Propiedades de depuración.

  2. Establezca las propiedades de la ejecución:

    Especifique muchas de las mismas propiedades al ejecutar un job sin debugging. Además, especifique el número de filas a muestrear en el campo Tasa de muestra de datos.

  3. Seleccione OK.

    Comienza el modo de depuración. En el modo de depuración, todas las demás funciones del diseñador están fijadas en solo lectura. Un icono Depurar es visible en la barra de tareas mientras la depuración está en curso.

  4. Si ha fijado breakpoints, en la barra de herramientas del depurador interactivo, seleccione Obtener siguiente fila para pasar al siguiente breakpoint.
  5. Para salir del modo de depuración, en el menú Depurar, seleccione Detener depuración.

Filtros y breakpoints

Es posible fijar filtros y breakpoints en líneas en un diagrama de flujo de datos antes de iniciar una sesión de depuración que permita examinar y modificar datos fila por fila durante una ejecución de job en modo de depuración. Esta acción se muestra en la siguiente figura.

Un filtro de depuración funciona igual que una transformación de consulta simple con una cláusula WHERE. Utilice un filtro al reducir un conjunto de datos en una ejecución de job de depuración. El filtro de depuración no admite expresiones complejas.

Un breakpoint es la ubicación en la que la ejecución de un job de depuración pausa y devuelve el control. Un breakpoint se puede basar en una condición o se puede fijar para que se rompa después de un número específico de filas.

Coloque un filtro o breakpoint en la línea entre una fuente y una transformación o dos transformaciones. Si un filtro y un breakpoint se fijan en la misma línea, Data Services aplica primero el filtro, lo que significa que el breakpoint solo se aplica a las filas filtradas.

Fijar filtros y breakpoints

  1. En el área de trabajo Flujo de datos, haga clic con el botón derecho en la línea que conecta dos objetos y seleccione Fijar filtro/breakpoint en el menú.
  2. En la ventana Breakpoint de la lista desplegable Columna, seleccione la columna a la que se aplica el filtro o breakpoint.
  3. En la lista desplegable Operador, seleccione el operador para la expresión.
  4. En el campo Valor, introduzca el valor para completar la expresión.

    La condición para filtros/breakpoints no utiliza un delimitador para cadenas.

  5. Si utiliza varias condiciones, repita los pasos 3 a 5 para todas las condiciones y seleccione el operador adecuado de Concatenar todas las condiciones mediante la lista desplegable.
  6. Seleccione OK.

Intentémoslo

Le guiaré a través del uso de los filtros de depurador y los breakpoints: