Operative Flussdiagramme

Objective

After completing this lesson, you will be able to flowgraphs debuggen und einplanen.

Flowgraph debuggen

Angenommen, Sie haben einen Flowgraph angelegt und möchten prüfen, ob die Zwischenknoten wie vorgesehen funktionieren.

Starten Sie das folgende Video, um zu erfahren, wie Sie Knoten eines Flowgraphs debuggen können.

Debugging kann während der Entwicklung nützlich sein, um sicherzustellen, dass die Ergebnisse in jeder Knotenstufe des Flowgraphs wie erwartet angezeigt werden. Sie sollten verschiedene Datensätze ausprobieren, sogar fehlerhafte Daten, und prüfen, wie die einzelnen Knoten reagieren.

Debugging ist auch nützlich, wenn der Flowgraph als Werkzeug zur Identifizierung operativer Probleme in die Produktion verschoben wurde.

Einplanen eines Flussdiagramms

Sie haben einen Flowgraph angelegt und bereits getestet. Es funktioniert problemlos, und jetzt möchten Sie es regelmäßig laufen lassen.

Stellen Sie sicher, dass das Flowgraph als Prozedur deployt wurde.

Legen Sie in Ihrem Projekt eine Quelldatei mit der Erweiterung .hdbschedulerjob an, z.B. UPDATE_JOB.hdbschedulerjob .

Die Datei sollte den SQL-Befehl CREATE SCHEDULER JOB enthalten, aber ohne das führende CREATE schreiben. Möglicherweise kennen Sie dieses Konzept bereits, indem Sie den SQL-Befehl CREATE TABLE ohne das führende CREATE in eine Tabellendefinitionsdatei (.hdbtable) schreiben.

Abhängig vom Flowgraph-Design müssen Sie verschiedene Parameter in der .hdbschedulerjob-Datei angeben. Angenommen, Sie haben einen Flowgraph und die zugehörige Prozedur mit dem Namen People_Fullname2 mit dem Parameter P_COUNTRY angelegt und deployt. Der Parameterwert sollte "USA" lauten. Der Job sollte von Montag bis Freitag um 01:00 Uhr in 2024 und 2025 ausgeführt werden.

Sie würden die Anweisung wie folgt definieren:

Code Snippet
1234
SCHEDULER JOB UPDATE_JOB CRON '2024,2025 * * mon,tue,wed,thu,fri 1 00 00' ENABLE PROCEDURE "People_fullname2" PARAMETERS P_COUNTRY = 'USA'

Nach CRON wird ein Cron-Ausdruck (eine Zeichenfolge im Format '<Jahre> <Monate> <Datumsangaben> <Wochentage> <Stunden> <Minuten> <Sekunden>') erwartet. Dieser Ausdruck definiert die Wiederholung.

Um den Job zu löschen, löschen Sie die Datei, und deployen Sie den Ordner src erneut.

Echtzeitverarbeitung

Es gibt zwei Möglichkeiten der Verarbeitung: Batch und Echtzeit.

Echtzeit bedeutet, dass Datensätze sofort zeilenweise verarbeitet werden. Bei der Batch-Verarbeitung werden die Daten in Paketen selektiert. Dies bedeutet, dass eine Partitionierung möglich ist. Knoten, die zeilenweise verarbeitet werden können, ohne das Ergebnis zu ändern, können für die Echtzeitverarbeitung verwendet werden. Knoten, die den gesamten Datensatz auf einmal verarbeiten müssen, können nicht für die Echtzeitverarbeitung verwendet werden. Prüfen Sie im Zweifelsfall die folgende Tabelle.

Gültig für EchtzeitverarbeitungNicht gültig für Echtzeitverarbeitung
  • Aggregation
  • Fall
  • Bereinigung
  • Datenmaske
  • Geocode
  • Historisierung
  • Lookup
  • Vorgang zuordnen
  • Tabellenvergleich
  • Union
  • Datumsgenerierung
  • Join
  • Abgleichen (Match)
  • Pivot
  • Vorgehensweise
  • Projection
  • Zeilengenerierung
  • Entpivotieren

Referenzen

Sehen Sie sich die folgenden Referenzen an: