SAP Analytics Cloud 스마트 예측의 시계열 모델 소개

Objective

After completing this lesson, you will be able to 스마트 예측의 시계열 분석에 대해 설명하십시오.

시계열 모델의 사용 케이스

증강 분석을 사용하여 출장 및 비용 관리

시계열 예측은 추세를 식별하는 데 도움이 되는 시간 차원이 있는 계수의 미래 값을 추정하는 데 유용합니다.

케이스 스터디에서는 시계열 모델을 사용하여 비용을 제어하는 시나리오를 안내합니다.

시계열 모델을 사용하여 어떤 종류의 토픽을 조사할 수 있습니까?

다음과 같은 질문에 답변할 수 있습니다.

  • 다음 달에 걸쳐 매장의 수익은 어떻게 진화할 것인가?
  • 다음 주 동안 지역별 예상 제품 매출액은 얼마입니까?
  • 다음 몇 주 동안 창고에서 제품 재고는 어떻게 달라집니까?
  • 다음 분기 동안 현금 흐름은 어떻게 진화합니까?

스마트 예측의 시계열 분석

시계열이란 무엇입니까?

시계열은 시간 순서대로 인덱싱된 일련의 데이터 포인트입니다. 일반적으로, 시계열은 연속된 시간에서 연속적인 간격 지점에서 취하는 순서이다. 예를 들어, 시계열은 데이터 포인트가 정기적으로 기록되어 지정된 기간 동안 수익 또는 원가의 이동을 추적할 수 있습니다. 예: 주별, 월별, 분기별, 연도별

시간 경과에 따른 원가를 표시하는 시계열 모델입니다.

시그널

시계열 모델을 작성하고 훈련할 때 대상 변수의 과거 값과 해당 일자가 필요합니다. 이 데이터 'bouple'의 날짜와 목표 값을 시그널이라고 합니다. 스마트 예측 의 시계열 예측 모델은 시그널을 분석합니다. 같은 일자(과거 및 미래)에 가져온 다른 변수의 값은 모델의 영향력 행사자 변수로 포함될 수 있습니다. 변수는 시그널 분석을 구체화하는 데 사용됩니다.

시그널은 값을 설명하거나 예측하려는 대상 변수이며 여러 구성요소로 구성됩니다. 예를 들어, 향후 6개월 동안의 제품 판매를 예측하려는 경우 제품 판매 는 시그널 변수입니다. 구성요소는 다음과 같습니다.

  1. 추세 는 시계열이 향하는 위치와 일반적으로 가는 경향이 있는 방향을 식별합니다. 감소, 증가 또는 플랫이 될 수 있습니다.
  2. 정기 는 시간 경과에 따라 정기적으로 재현되는 계절적 변동과 기간 패턴입니다.
  3. 변동 은 이전 값 "t-1"… "t-10"… "t-n"에 대한 시간 "t"의 시그널 값의 종속성을 반영합니다.
  4. 잔차 는 추세, 주기 및 변동이 제거되었을 때 시그널이 남아 있는 것입니다. 잔차는 화이트 노이즈로 간주됩니다 - 순전히 무작위 효과.

질문: 아래 다이어그램에서 주황색 선으로 표시되는 일반 피크 및 가뭄의 이름은 무엇입니까?

시그널 차트의 예를 보여주는 다이어그램입니다.

답변: 주기적으로 말했다면 정답입니다! 위 다이어그램에 표시된 규칙적인 피크와 트라우스는 주기적인 신호의 예입니다.

노트

SAP Analytics Cloud의 시계열 예측 모델은 추가 모델입니다. 추세와 주기, 변동에 대해 계산된 값을 합산하여 예측이 계산됩니다.

예측 기간

기간은 미래에 추정할 예측 수입니다. 이 숫자는 과거 데이터의 크기에 따라 직접 결정됩니다.

5:1은 기간을 추정하고 관련 신뢰 구간으로 예측을 얻는 데 좋은 비율입니다. 즉, 과거 케이스가 100개인 경우 향후 20개의 대상 변수 값을 예측할 수 있습니다. 6개월 전에 예측하려면 30개월의 과거 데이터를 제공해야 합니다.

Best Practice:

  • 일반적으로 시간이 너무 먼 이력을 무시하는 것이 좋습니다.
  • 20개 이하의 값을 선택할 수 있지만 더 많은 값이 필요한 경우 더 많은 과거 케이스를 수집하는 것이 좋습니다.
  • 시계열 모델을 작성할 때 예측 시나리오 설정을 사용하여 사용 가능한 모든 월을 사용하거나 특정 기간으로 제한하는 데 사용되는 시간 범위를 정의할 수 있습니다.
과거 데이터 및 기간.

SAP Analytics Cloud에서 과거 데이터는 자동으로 시간순으로 정렬되고 두 개의 세트로 분할됩니다.​

  1. 데이터의 처음 75%가 시계열 예측 모델을 훈련하는 데 사용됩니다.
  2. 나머지 25%는 최적의 후보 모델을 선택하는 데 사용됩니다. 

예측 모델을 최적화하기 위해 데이터를 내부적으로 분할하는 방법은 무엇입니까?

스마트 예측 은 훈련 및 유효성 확인 데이터 세트를 사용하고 시계열 모델을 생성할 때 다음 단계를 수행합니다.

  1. 훈련 데이터 세트에서 시계열 모델의 여러 평가판 버전이 훈련됩니다.
  2. 시계열 모델의 최적 평가판이 선택됩니다.
  3. 평가판은 유효성 확인 세트를 사용하여 평가됩니다.
  4. 최종 예측 시계열 모델이 생성됩니다.
훈련 및 유효성 확인 데이터 세트를 사용하여 시계열 모델을 생성하기 위한 4단계 프로세스입니다.

시계열 예측 모델 생성 시 고려할 사항

시계열 예측 모델을 생성할 때 고려해야 할 몇 가지 고려사항이 있습니다.

  1. 예측의 스케일: 예측의 스케일을 고려합니다. 예를 들어, 과거 데이터가 매월, 매주, 매일, 매시간 또는 분마다 캡처되는 경우 동일한 시간 단위로 예측이 생성됩니다. 따라서 매월 데이터 값이 기록되는 경우 다음 며칠 동안의 예측을 요청하는 것은 의미가 없습니다. 데이터가 센서에 의해 매분 기록되지만 해당 분이 사용 케이스와 관련이 없는 경우 더 높은 시간 단위(예: 시간)를 사용해야 합니다.
  2. 집계: 필요한 시간 단위로 데이터를 집계하고 집계 함수를 정의합니다.
    • 예를 들어, 집계 함수는 이 시간의 60분마다 측정된 60개 값에서 한 시간의 값을 계산할 수 있습니다. 첫 번째 값, 마지막 값, 중간 값 또는 계산된 값이 될 수 있습니다. 예를 들어 평균 또는 더 복잡한 수식이 있습니다.
    • 기억해야 할 중요한 점은 집계의 크기입니다. 대규모 집계는 정보를 숨기고 예측 품질을 저하시킬 수 있습니다. 그러나 적절한 집계는 노이즈가 많을 때 시그널을 평활화합니다. 최상의 집계 함수를 선택하기 위해 테스트하고 실험합니다.
  3. 데이터 정렬: 각 시간 단위가 대상 변수의 하나의 값에만 해당되도록 과거 데이터 세트를 정리해야 합니다. 스마트 예측 은 자동으로 데이터를 정렬합니다.