
データ変換の概要
データ変換とは、ERP システムからプロセスマイニングシステムにファイルをアップロードするために、ローデータの書式、構造、または値を変更するプロセスです。この最終ファイルはイベントログと呼ばれ、記録されたすべてのイベントが特定のケース ID に割り当てられたタイムスタンプとともに含まれます。
このデータ変換は、通常、以下によって実現されます。
- 翻訳およびマッピング
- フィルタリング、集計、集計
- エンリッチメントとインポーテーション
- インデックス処理と順序付け
- 匿名化と暗号化
- モデリング、タイプリキャスト、書式設定、および名称変更
システムでのアクションフォローするトレースを残す
システムのすべてのステップが記録され、トレースに残ります。調達から支払までの例を見ると、システム内の特定のビジネスオブジェクトが以下のステップで使用されます。
- 購買依頼 (PR)
- 購買発注 (PO)
- 請求書
これらのオブジェクトを参照するすべての変更とトランザクションは、データベースに格納されます。Process Intelligence では、これらの詳細を調べることができます。これらは、すべてのステップのバックトラッキングを可能にする方法で抽出および変換されます。最後に、再登録されたこれらのステップは、イベントログに保存されます。

データを変換する必要がある理由
すべてのプロセスデータは、データベース内のテーブルに保存されます。分析のためには、データが統一され、標準化されていることが重要です。特に、異なるソースシステム (異なるデータ書式やデータ型など) からのデータの場合は、データに差異がある可能性があります。通常、データは特定のターゲット形式に合わせて調整されます。
データ変換のステップを参照してください。
- ターゲット書式の定義
- 抽出データの変換
- 変換されたデータを新しいファイルに保存

重要度
データ変換が必要な理由 すべてのデータが異なるテーブルに保存されるためです。抽出されたデータが特定のケースにリンクされていることを確認する必要があります。システムでは、オーダーテーブルの [オーダー ID 123] と請求書テーブルの [請求書 ID] 456 が同じケースに属していることがどのように認識されますか。
ケースは何ですか?
正しいケース ID の定義は、データ変換の最も重要なポイントの 1 つです。ケース ID により、プロセスの範囲が定義されます。これにより、プロセスが開始および終了する場所が決定されます。調達プロセスでは、ケース ID が購買伝票 ID によって定義されている場合、すべての個別依頼が新規ケースとみなされます。複数の依頼を 1 つの指図に結合するかどうかは関係ありません。
ケース ID がオーダー ID によって定義されている場合、データセットには、基礎となる購入申請に関係なく、すべてのオーダーがケースとして含まれます。両方を組み合わせると、購買依頼ごとにケースが発生します。最後に、回答は、そのライフサイクルに関して分析する必要があるビジネスオブジェクトまたは文書によって異なります。
データロード
ETL の最後の部分は、データロードフェーズです。これは、変換されたデータをプロセスマイニングシステムにアップロードするタスクに対応しています。データロードでは、以下の点に対処する必要があります。
詳細については、図の各レベルを選択してください。