Datenquellen und Datenziele definieren

Objective

After completing this lesson, you will be able to konfigurieren Sie eine Datenquelle und ein Datenziel in einem Flowgraph.

Datenquellen

Sehen wir uns die Quellen und Ziele genauer an.

Jeder Datenquellenknoten verbindet den Flowgraph mit einer Datenquelle, in der Regel mit einem vorhandenen SAP-HANA-Objekt. Es muss sich nicht um eine physische Tabelle handeln, sondern kann ein beliebiges Objekt Ihres HDI-Containers sein, das ein Datenset bereitstellt, auch ein Tabellentyp. (Ein Tabellentyp ist eine Definition einer Tabellenstruktur und muss zur Laufzeit instanziiert werden.)

Die Abbildung zeigt eine Bildschirmaufnahme eines Datenquellenknotens und Datenquellenoptionen: virtuelle Tabelle, Tabelle, View, Calculation View, Synonym oder Tabellentyp.

Ein Flowgraph muss nicht mit einem Datenquellenknoten beginnen. Es ist möglich, neue Daten über zwei spezielle Knoten zu generieren:

  • Der Zeilengenerator erstellt eine Spalte, die Zeilen-IDs enthält.
  • Der Datumserzeuger erstellt eine Spalte, die generierte Datumswerte enthält.

In beiden Fällen können Sie einen Start- und einen Endwert angeben. Der Zeilengenerator generiert eine Folge von ganzen Zahlen.

Für den Knoten Datumsgenerator stehen die folgenden Schrittoptionen zur Schrittweite zur Verfügung:

  • TAG
  • WOCHENLICH
  • MONATLICH
Die Abbildung zeigt Zeilengenerator- und Datumsgeneratorknoten: Mit dem Zeilengeneratorknoten würden Sie eine Spalte mit den Zeilen 1,2, 3 usw. generieren. Mit dem Datengenerator und der Inkrementeinstellung WEEKY würden Sie eine Spalte mit dem 07.01.2024, dem 14.01.2024, dem 21.01.2024 usw. generieren.

Angenommen, Sie möchten eine Spalte generieren, die die Termine für alle Sonntage 2024 enthält. Sie definieren einen Beginn am 7. Januar 2024 (der erste Sonntag), ein Ende mit dem 31. Dezember 2024 und definieren eine Datumsinkrementierung von WEEKLY.

Datenziele

Ein Datenzielknoten sitzt am Ende des Flowgraphs und wird verwendet, um das Ziel des Datenflusses zu definieren.

Hinweis

Was können Sie tun, wenn Sie noch keine vorhandene Tabelle mit geeigneten Datentypen haben?

Sie können das Ziel als Vorlagentabelle definieren. Wenn Sie eine Vorlagentabelle auswählen, wird automatisch eine neue Tabelle basierend auf der Ausgabestruktur des Vorgängerknotens vorgeschlagen.

Die Abbildung zeigt, wie eine Zieltabelle verwendet wird: Beim ersten Deployment eines Flowgraphs wird die Transformationsdefinition geprüft. 2. Wenn Sie einen Flowgraph ausführen, wird die Prozedur gestartet, die Transformation verarbeitet und die Zieltabelle gefüllt.

Sie können vorgeschlagene Spalten aus der Vorlagentabelle entfernen. Es empfiehlt sich jedoch, die Spalten früher im Ablauf zu entfernen, um die Laufzeitperformance zu verbessern. Die Tabelle wird während des Deployments des Flowgraphs angelegt. Wie jede andere Tabelle wird sie gefüllt, wenn der Flowgraph ausgeführt wird. Template-Tabellen sind während der Designphase sehr nützlich. Wenn Sie Spalten zum Vorgängerknoten hinzufügen oder daraus entfernen, müssen Sie diese Schritte für die Ausgabe nicht wiederholen.

Die Abbildung zeigt den Datenzielknoten und Optionen: Tabelle, Synonym oder Tabellentyp.

Wenn Sie in ein Datenziel laden, das bereits Daten enthält, müssen Sie angeben, wie die neuen und vorhandenen Datensätze behandelt werden. Dies gilt auch für leere Tabellen oder Template-Tabellen nach der ersten Ausführung.

Es gibt folgende Optionen:

  • Abschneiden: Löschen Sie alle vorhandenen Datensätze, und füllen Sie die Datensätze in die leere Tabelle.
  • Einfügen: Fügen Sie zusätzlich zu den vorhandenen Zeilen neue Zeilen hinzu. Definieren Sie für diese Option eine Sequenz als Schlüsselgenerator, die die nächste nicht verwendete Ganzzahl als Zeilennummer findet.
  • Aktualisieren: Vorhandene Datensätze mit zusätzlichen oder aktuelleren Informationen überschreiben. Diese Option erfordert, dass Sie eine Reihenfolge definieren und eine Tabelle mit einem Primärschlüssel verwenden oder die Schlüsselfelder des Vorlagenziels definieren.
  • Upsert: Fügen Sie die neuen Datensätze ein, oder aktualisieren Sie die geänderten Datensätze. Diese Option erfordert, dass Sie eine Reihenfolge definieren und eine Tabelle mit einem Primärschlüssel verwenden oder die Schlüsselfelder des Vorlagenziels definieren.