독립 실행형 커넥터

독립 실행형 커넥터란?
독립 실행형 커넥터는 소스 시스템과 SAP Signavio Process Intelligence 간의 통신을 처리합니다. 이 커넥터는 소스 시스템이 SAP Signavio Process Intelligence(또는 다른 타사 시스템)의 표준 커넥터 중 하나에 포함되지 않는 경우 사용할 수 있습니다. 소스 시스템에서 데이터를 추출하여 이벤트 로그 형식으로 변환한 다음 분석할 프로세스 인텔리전스에 업로드됩니다.
그러나 ETL 스크립트는 (SAP Signavio Process Intelligence 외부에서) 외부에서 실행해야 하지만 API를 사용하여 시스템 내의 프로세스에 데이터를 푸시합니다.
커넥터는 이를 위해 함께 작동하는 여러 구성요소로 구성됩니다. 여기에는 다음이 포함됩니다.
- 추출 및 변환 SQL 스크립트 컬렉션
- YAML 형식의 구성 파일
- 정기적 로드의 경우 매번 정확한 데이터가 로드되도록 하는 SQLite 데이터베이스
- 실제 추출, 변환 및 로딩을 트리거하기 위한 Java 어플리케이션
다음 소단원에서는 이러한 컴포넌트가 함께 작동하는 방식을 설명하고 Process Intelligence에 필요한 데이터를 제공하기 위해 배포할 수 있습니다.
SAP 예시의 기능에 대해 계속해서 알아보겠습니다.

커넥터는 SAP 기술(서비스) 사용자를 사용하여 소스 시스템에서 데이터를 가져와 S3 버킷에 저장합니다.

커넥터는 Athena를 사용하여 변환된 S3 데이터에서 이벤트 로그 파일을 생성하고 이 파일을 다운로드합니다.

커넥터가 프로세스 인텔리전스 API에 이벤트 로그 파일을 업로드합니다.
독립 실행형 커넥터를 사용하여 ETL 설정
자동 ETL이 작동하려면 먼저 커넥터가 에서 실행되도록 환경을 설정해야 합니다. 이를 위해 가상 머신을 설정해야 합니다.
이 설정에 대해 자세히 알아보려면 아래에서 각 단계를 선택하십시오.
가상 머신 설정
스테이징 환경 설정
소스 시스템에서 데이터 변환을 수행할 수 있는지 여부에 따라 전용 스테이징 환경을 설정해야 할 수도 있습니다. 대부분의 경우 이는 훨씬 더 빠르고 프로세스 마이닝에 더 적합합니다. 이를 통해 여러 소스 시스템을 사용할 수도 있습니다.
AWS의 경우 변환 스크립트를 실행하려면 S3(데이터 저장)과 Athena 둘 다에 계정이 필요합니다.
구성 - 연결
환경 설정이 완료되면 특정 사용 케이스에 맞게 커넥터를 구성해야 합니다. 이 작업은 SAP에서 제공하는 config.yaml 파일에서 수행됩니다. 커넥터와 연결 구성, 테이블 추출 및 이벤트 수집기 구성에 필요한 액션을 정의합니다.
이 소단원에서는 이러한 매개변수를 살펴보고 SAP 시스템에서 예제 데이터를 추출하고 주문-결제(Order-to-Cash) 분석 준비를 수행하는 간단한 예를 제공합니다.
먼저 각 단계에서 커넥터 구성을 시작하겠습니다.
커넥터 구성
추출 구성
이제 연결이 설정되었으므로 다음 단계는 추출 및 필요한 데이터를 정의하는 것입니다. 델타 로드에 필요한 매개변수를 살펴보겠습니다. 이 작업은 tableSyncConfigurations 에서 수행할 수 있습니다. 먼저 추출해야 하는 각 테이블의 일반 매개변수로 시작합니다. 테이블의 일반 매개변수를 설정하는 각 단계에 대해 자세히 알아보십시오.
추출 구성
변환 구성
소스 시스템과 추출 정보가 모두 있으므로 다음 단계는 소스 데이터를 이벤트 로그 형식으로 변환하는 것입니다. 이를 위해 eventCollectorConfigurations 에 3개의 열(케이스 ID, 이벤트 이름, 타임스탬프)이 필요합니다. 변환 구성 의 각 단계에 대해 자세히 알아봅니다.
변환 구성
실행(Execution)
커넥터는 터미널에서 아래 정보를 실행하여 Java 어플리케이션으로 시작할 수 있습니다. 먼저 커넥터의 소스 디렉토리로 이동한 다음 실행하여 시작합니다.
스텝
java -jar signavio-connector.jar <command>
명령어:
- tableSyncConfiguration 기반:
- extract => 정의된 추출 스크립트를 사용하여 소스 시스템에서 원시 테이블 데이터를 추출하고 원시 테이블로 저장할 스테이징 영역에 업로드합니다. 스테이징 영역의 테이블 이름은 tableSyncConfiguration에서 제공되는 이름에 따라 달라집니다.
- createschema => 원시 테이블의 스키마 생성
- transform => 서로 다른 델타 로드 간에 중복되는 행이 변경되면 원시 테이블 스키마를 최적화하고 행 업데이트를 병합합니다. 이전 로드에서 이미 추출된 데이터에 대한 업데이트는 keyColumn 및 mostRecentRowColumn 매개변수를 기준으로 인식됩니다.
- eventCollectorConfiguration 기준:
- eventlog => 변환 스크립트를 기반으로 스테이징 시스템에서 이벤트 로그아웃을 생성하고 이를 Process Intelligence에 업로드합니다.
