SAP Analytics Cloud 智能预测中时间序列模型简介

Objective

After completing this lesson, you will be able to 介绍智能预测中的时间序列分析。

时间序列模型的用例

使用增强分析控制差旅和费用

时间序列预测可用于估算度量的未来值,其中有时间维可用于帮助识别趋势。

在案例研究中,我们将引导您了解使用时间序列模型控制费用的场景。

我们可以使用时间序列模型调查哪些类型的主题?

您可以回答问题,例如:

  • 下个月商店的收入将如何变化?
  • 未来几周每个地区的产品预期销售额是多少?
  • 在接下来的几周内,仓库中的产品库存将如何变化?
  • 现金流在下一季度将如何发展?

智能预测中的时间序列分析

什么是时间序列?

时间序列是一系列按时间顺序建立索引的数据点。通常,时间序列是在连续相等间隔点处采用的序列。例如,时间序列可以跟踪指定时间段内收入或成本的移动,并定期记录数据点。例如,每周、每月、每季度或每年。

显示随时间变化的成本的时间序列模型。

信号

构建和训练时间序列模型时,需要目标变量的历史值和相应日期。此数据将日期"对"和目标值称为信号 。智能预测 中的时间序列预测模型会分析信号。在相同日期(过去和未来)获取的其他变量的值可以作为模型的影响因素变量包括在内。这些变量用于细化信号的分析。

信号是要解释或预测值的目标变量,由多个组成部分组成。例如,如果要预测未来六个月的产品销售额,则 Product sales 是信号变量。这些组件包括:

  1. "趋势"标识时间序列的开始位置,以及通常趋向于哪个方向。可以是减少、增加或平面。
  2. 定期是随时间定期重现的季节性和期间模式。
  3. "波动"反映"t"时信号值对先前值"t-1"…"t-10"…"t-n"的相关性。
  4. 残差是移除趋势、周期和波动时信号中剩余的内容。残差被认为是白噪音 - 纯粹是随机效应。

弟子:下图中橙色线显示的常规峰和槽的名称是什么?

显示信号图示例的图表。

答:如果说定期,你是正确的!上图中显示的常规峰值和低谷是周期信号的一个示例。

注意

SAP Analytics Cloud 中的时间序列预测模型是附加的。通过将计算的趋势、周期和波动值相加来计算预测。

预测区间

区间是要在未来估算的预测数。此数字直接取决于历史数据的大小。

5:1 是估算区间并通过相关置信区间获取预测的良好比率。这意味着,如果存在 100 个历史情况,则可以在未来预测目标变量的 20 个值。要提前六个月预测,必须提供 30 个月的历史数据。

最佳实践:

  • 一般建议放弃时间太远的历史。
  • 虽然可以选择 20 个或更少的值,但如果还需要更多值,则最好收集更多历史案例。
  • 在构建时间序列模型时使用预测方案设置,可以使用所有可用月份或限制为特定时间段来定义使用的时间窗口。
历史数据和区间。

在 SAP Analytics Cloud 中,历史数据按时间顺序自动排序并拆分为两组:​

  1. 前 75% 的数据用于训练时间序列预测模型。
  2. 其余 25% 用于选择最佳候选模型。 

如何对数据进行内部分区以优化预测模型?

智能预测使用训练和验证数据集,并在创建时间序列模型时执行以下步骤:

  1. 根据训练数据集,对时间序列模型的多个试用版本进行训练。
  2. 选择时间序列模型的最佳试用版本。
  3. 使用验证集评估试用版本。
  4. 最终时间序列模型即已创建。
使用训练和验证数据集创建时间序列模型的四个步骤流程。

创建时间序列预测模型时的注意事项

创建时间序列预测模型时,需要考虑以下几个注意事项:

  1. 预测的数级:考虑预测的数级。例如,如果每月、每周、每天、每小时或每分钟捕获历史数据,则将以相同的时间单位生成预测。因此,如果每月记录数据值,则请求未来几天的预测没有意义。如果传感器每分钟记录一次数据,但分钟与用例无关,则应使用更高的时间单位,例如小时。
  2. 聚合:考虑以所需时间单位汇总数据并定义汇总函数。
    • 例如,聚合函数可以根据该小时 60 分钟中每测量的 60 个值计算出一个小时值。可以是第一个值、最后一个值、中间值或计算值。例如,平均值或更复杂的公式。
    • 需要牢记的一个重要点是聚合的大小。大型聚合可能会隐藏信息并降低预测的质量。但是,适当的聚合会在有大量噪声时使信号平滑。测试和尝试选择最佳集合函数。
  3. 对数据进行排序:必须清理历史数据集,以便每个时间单位仅与目标变量的一个值相对应。智能预测会自动对数据进行排序。