スタンドアロンコネクタ

スタンドアロンコネクタとは何ですか。
スタンドアロンコネクタは、ソースシステムと SAP Signavio Process Intelligence 間の通信を処理します。 このコネクタは、ソースシステムが SAP Signavio Process Intelligence (またはその他のサードパーティシステム) の標準コネクタの 1 つによってカバーされていない場合に使用できます。ソースシステムからデータが抽出され、イベントログ形式に変換されてから、分析対象の Process Intelligence にアップロードされます。
ただし、ETL スクリプトは外部で (SAP Signavio Process Intelligence の外部で) 実行する必要がありますが、API を使用してシステム内のプロセスにデータをプッシュします。
コネクタは、これを実現するために連携する複数のコンポーネントで構成されています。これには、以下が含まれます。
- 抽出および変換 SQL スクリプトのコレクション
- YAML 形式の設定ファイル
- 定期的なロードの場合に毎回正しいデータがロードされるようにするための SQLite データベース
- 実際の抽出、変換、およびロードをトリガする Java アプリケーション
以下のレッスンでは、これらのコンポーネントがどのように連携し、Process Intelligence に必要なデータを提供するためにデプロイできるかについて説明します。
この機能の詳細については、SAP の例で引き続き学習しましょう。

コネクタでは、SAP テクニカル (サービス) ユーザを使用して、ソースシステムからデータを取得し、S3 バケットに保存します。

コネクタでは、Athena を使用して、変換された S3 データからイベントログファイルを生成し、このファイルをダウンロードします。

コネクタは、イベントログファイルを Process Intelligence API にアップロードします。
スタンドアロンコネクタを使用した ETL 設定
自動化された ETL が機能するには、最初にコネクタがで実行される環境を設定する必要があります。これを行うには、仮想マシンを設定する必要があります。
設定の詳細については、以下の各ステップを選択してください。
仮想マシンの設定
ステージング環境設定
ソースシステムでデータ変換を実行できるかどうかに応じて、専用のステージング環境の設定が必要になる場合があります。ほとんどの場合、これはプロセスマイニングに非常に高速で適しています。これにより、複数のソースシステムを使用することもできます。
AWS の場合、変換スクリプトを実行するために、データストレージの S3 と Athena の両方を含むアカウントが必要です。
設定 - 接続
環境設定が終了したら、特定の使用ケースに合うようにコネクタを設定する必要があります。これは、SAP が提供する config.yaml ファイルで行います。コネクタおよび接続設定、テーブル抽出、およびイベントコレクタ設定に必要なアクションが定義されます。
このレッスンでは、これらのパラメータについて説明し、SAP システムからサンプルデータを抽出し、受注から入金分析の準備を行う簡単な例を示します。
最初に、各ステップを参照してコネクタの設定を開始します。
コネクタ設定
抽出設定
接続が確立されたら、次のステップとして抽出と必要なデータを定義します。デルタロードに必要なパラメータを見てみましょう。これは、tableSyncConfigurations で行うことができます。抽出する必要がある各テーブルの一般パラメータから開始します。テーブルの一般パラメータを設定するための各ステップについて説明します。
抽出設定
変換設定
ソースシステムと抽出情報の両方があるので、次のステップは、ソースデータをイベントログ形式に変換することです。このためには、eventCollectorConfigurations の下に 3 つの列 (ケース ID、イベント名、タイムスタンプ) が必要です。 各ステップの詳細については、変換設定を参照してください。
変換設定
実行
コネクタは、端末で以下の情報を実行することで、Java アプリケーションとして起動できます。最初に、コネクタのソースディレクトリに移動し、を実行して開始します。
ステップ
java -jar signavio-connector.jar <command>
コマンド:
- tableSyncConfiguration に基づいて、以下を実行します。
- extract => 定義された抽出スクリプトを使用してソースシステムからローテーブルデータを抽出し、ステージングエリアにアップロードします。ステージングエリアでは、ローテーブルとして保存されます。ステージングエリアのテーブル名は、tableSyncConfiguration で指定されたテーブル名に依存します。
- createschema => ローテーブルのスキーマを生成します。
- トランスフォーム => ローテーブルスキーマを最適化し、異なるデルタロード間で重複する行に変更がある場合に行の更新をマージします。以前のロードですでに抽出されたデータに対する更新は、keyColumn および mostRecentRowColumn パラメータに基づいて認識されます。
- eventCollectorConfiguration に基づく:
- eventlog => 変換スクリプトに基づいてステージングシステムからイベントログアウトを作成し、Process Intelligence にアップロードします。
