SAP Analytics Cloud Smart Predict での時系列モデルの概要

Objective

After completing this lesson, you will be able to smart Predict での時系列分析について説明します。

時系列モデルのユースケース

拡張分析を使用した従業員経費管理

時系列予測は、トレンドの特定に役立つ時間ディメンションがある場合に、メジャーの将来の値を予測する場合に役立ちます。

ケーススタディでは、時系列モデルを使用して費用を管理するためのシナリオについて説明します。

時系列モデルを使用して調査できるトピックは、次のうちどれですか。

以下のような質問に回答することができます。

  • ショップの収益は翌月にどのように変化しますか。
  • 今後数週間の、地域ごとの製品別の見込売上はいくらですか。
  • 今後数週間で、倉庫内の製品の在庫はどのように変化しますか。
  • 次の四半期にキャッシュフローはどのように進化しますか。

スマート予測の時系列分析

時系列とは何ですか。

時系列は、時間順にインデックス付けされた一連のデータポイントです。通常、時系列は、連続する等間隔の時点で取得される順序です。たとえば、時系列では、データポイントが定期的に記録され、指定された期間における収益または原価の移動を追跡することができます。たとえば、週次、月次、四半期、年次などです。

時間の経過に伴うコストを示す時系列モデル。

シグナル

時系列モデルを構築およびトレーニングする際には、ターゲット変数の履歴値と対応する日付が必要です。このデータと目標値の '連結' をシグナルと呼びます。Smart Predict の時系列予測モデルによってシグナルが分析されます。同じ日付 (過去と将来) で取得された他の変数の値を、モデルのインフルエンサ変数として含めることができます。変数は、シグナルの分析を絞り込むために使用されます。

シグナルは、値を説明または予測するターゲット変数であり、複数のコンポーネントで構成されます。たとえば、今後 6 カ月間の製品売上を予測する場合は、シグナル変数として Product sales を使用します。コンポーネントには以下が含まれます。

  1. トレンドは、時系列がどこに向かっており、どの方向に進行傾向があるかを識別します。減少、増加、またはフラットにすることができます。
  2. 定期は、時間の経過とともに定期的に再現される季節性パターンと期間パターンです。
  3. 変動は、前の値 "t-1"... "t-10"... "t-n" に対する時刻 "t" のシグナル値の依存関係を反映します。
  4. 残差は、トレンド、周期、および変動が除去されたときのシグナルの残りです。残差はホワイトノイズ (純粋にランダムな効果) とみなされます。

質問: 下の図のオレンジ色の線で示されている通常のピークとツロの名前は何ですか。

シグナルチャートの例を示す図。

回答: 定期と言った場合は正解です。上の図に示した通常のピークと牽引は、周期信号の一例である。

注記

SAP Analytics Cloud の時系列予測モデルは追加モデルです。需要予測は、トレンド、周期、および変動に対して計算された値を合計することによって計算されます。

予測期間

ホライズンは、将来予測される予測の数です。この数は、履歴データのサイズに直接依存します。

5:1 はホライズンを見積もり、関連する信頼区間の予測を取得するのに適した比率です。つまり、100 個の履歴ケースがある場合、ターゲット変数の 20 個の値を将来予測できます。6 カ月先を予測するには、30 カ月の履歴データを提供する必要があります。

ベストプラクティス:

  • 通常は、遠すぎる履歴を破棄することをお奨めします。
  • 20 個以下の値を選択できますが、より多くのケースが必要な場合は、より多くの履歴ケースを収集することをお奨めします。
  • 時系列モデルの構築時に予測シナリオ設定を使用して、使用可能なすべての月を使用するか、特定の期間に制限して、使用される時間枠を定義することができます。
履歴データおよび期間。

SAP Analytics Cloud では、履歴データは時系列で自動的に並べ替えられ、以下の 2 つのセットに分割されます。

  1. データの最初の 75% は、時系列予測モデルのトレーニングに使用されます。
  2. 残りの 25% は、最適な候補モデルを選択するために使用されます。 

予測モデルを最適化するために、データはどのように内部的にパーティショニングされますか。

Smart Predict では、時系列モデルを作成するときに、学習用データセットと検証用データセットを使用し、以下のステップを実行します。

  1. 学習用データセットから、複数の時系列モデルのトライアルバージョンがトレーニングされます。
  2. 時系列モデルの最適なトライアルバージョンが選択されます。
  3. トライアルバージョンは、チェックセットを使用して評価されます。
  4. 最終予測時系列モデルが作成されます。
学習用データセットとチェックデータセットを使用して時系列モデルを作成する 4 つのステップのプロセス。

時系列予測モデルを作成する際の考慮事項

時系列予測モデルの作成時には、いくつかの考慮事項を考慮する必要があります。

  1. 予測のスケール: 予測のスケールを考慮します。たとえば、履歴データが月、週、日、時、または分ごとに取得される場合、予測は同じ時間単位で作成されます。そのため、データ値が毎月記録される場合、今後数日間の予測を要求しても意味がありません。データがセンサによって毎分記録されるものの、分が使用ケースに関連しない場合は、時間などのより高い時間単位を使用する必要があります。
  2. 集計: 必要な時間単位でのデータの集計を考慮し、集計関数を定義します。
    • たとえば、集計関数では、この時間の 60 分ごとに測定された 60 の値から時間に対して 1 つの値を計算することができます。これは、最初の値、最後の値、中間の値、または計算された値になります。たとえば、平均式やより複雑な式などです。
    • 注意すべき重要な点は、集約のサイズです。大規模な集計では、情報が非表示になり、予測の品質が低下する可能性があります。ただし、適切な集計により、ノイズが多い場合にシグナルが平準化されます。最適な集計関数を選択するためのテストと実験を行います。
  3. データのソート: 各時間単位がターゲット変数の 1 つの値のみに対応するように履歴データセットをクリーンアップする必要があります。Smart Predict では、データが自動的にソートされます。