首頁 » 部落格 » 种强大的时间序列分析技术,助力获得更好的洞察

种强大的时间序列分析技术,助力获得更好的洞察

助力获得更好的洞察 时间序列数据无处不在——无论您的品牌是否具备处理能力。数据驱动型组织需要时间序列分析平台来充分利用其数据,但有些品牌可能没有意识到实现时间序列分析有不同的技术。问题不在于时间序列分析平台是否值得——它们值得——而是要知道哪种分析技术最适合您的品牌目标和需求。

 

在今天的博客中,我们将探讨三种常见的时间序列分析技术以及如何利用它们来解决跨行业的常见业务问题。

 

执行时间序列分析的 3 种常用方法

在时间序列分析中,数据点在设定的时 泰国数据 间段内以一致的间隔记录。这允许品牌将数据点与不同的变量和时间进行比较,从而更容易辨别趋势和异常值。

 

然而,没有通用的方法来执行时间序列分析,并且某些方法可能比其他方法更适合某些数据集。

 

1. 单变量 Box-Jenkins 模型

单变量 Box-Jenkins 模型,又称自回归综 助力获 提高收入利润率意味着增加收入并降低 得更好的洞察 合移动平均模型 (ARIMA),用于预测单个时间相关变量。Box-Jenkins 模型有两种形式:单变量和多变量。顾名思义,单变量模型预测单个变量,而多变量模型预测多个变量。

 

我们将在下一节中探讨多元模型,因此让我们快速分解单变量建模的机制。

 

首先,必须确定以下值:

 

(p) = 自回归项的数量

(d) = 使数据平稳所需的非季节性差异数。这意味着时间序列的属性是一致的,无论何时观察该序列。

(q) = 预测方程中滞后预测误差的数量。

一旦确定,这些值将被代入以下模型:

 

一般自回归模型 – AR(p):使用时间相关变量的先前值进行预测。

积分 I – (d):差值取 d 次,直到原 最新评论 始序列变为平稳序列。平稳时间序列是指其属性不依赖于观察序列的时间序列。

通用移动平均模型 – MA(q):使用序列平均值和先前的误差进行预测

通过结合先前的时间序列数据以及均值、误差和季节性,ARIMA 可以预测单个与时间相关的变量。

单变量 ARIMA 模型的优势

准确的短期预测:ARIMA 擅长短期预测。它们可以在 12 到 18 个月的时间内产生最准确的预测。

仅根据历史数据进行操作:由于 ARIMA 模型仅根据历史数据进行操作,因此它们需要较少的数据清理即可发挥作用,从而使您能够更快地进行建模。

概括非平稳数据:虽然使用平稳数据简化了 ARIMA 预测过程,但确定 (d) 相对简单。结果是平稳数据,可以轻松应用于其他更复杂的模型。
单变量 ARIMA 模型的挑战
长期预测能力较差:由于一般自回归模型是根据先前的值进行操作的,因此预测准确度在十八个月后可能会下降。

难以适应突然变化:ARIMA 模型是 助力获得更好的洞察 线性的,这意味着它们不能解释突然变化,即使考虑到季节性。

计算错误:ARIMA 的好坏取决于其数据。如果历史数据输入错误或差分值计算错误,ARIMA 模型实际上就毫无用处。

何时使用单变量 ARIMA 模型

单变量 ARIMA 模型最适合用于了解单个与时间相关的变量,例如随时间变化的温度或随时间变化的投资回报。

 

2020 年,美国国家医学图书馆发表了一项案例研究,介绍了如何使用 Box-Jenkins 模型预测受疫情严重影响国家的 COVID-19 病例激增情况。流行病学家利用世界卫生组织提供的时间序列数据,准确预测出西班牙和美国将出现 COVID-19 病例激增,而中国病例数将下降。这些信息帮助这些国家和其他国家调整了其 COVID-19 策略——这一切都归功于时间序列分析。

2. 多元 Box-Jenkins 模型

多元 Box-Jenkins 模型或自回归移动平均向量 (AMAV) 模型的功能与单变量模型类似,但有一个主要区别:它们可用于同时对多个变量进行建模。

 

许多不同的技术都属于多变量箱詹金斯范畴,但通常分为两大阵营:依赖技术和独立技术。

 

依赖技术:依赖建模技术检查数据点之间的因果关系。如果两个或多个数据点的值可用于解释、描述或预测另一个因变量的值,则它们被视为依赖。

多元回归:简单线性回归的扩展,用于根据两个或多个变量预测一个变量的值。

联合分析:一种基于调查的技术,将不同的用户价值(特性、功能、好处等)与最终用户决策关联起来。

多元判别分析:通过寻找线性组合

变量来确定数据集内的组。

线性概率模型:使用一个或多个解释变量预测二元结果变量(0 或 1,是或否)的回归模型。

典型相关分析:总结两组变量之间的线性关系。

结构方程分析:一种分析结构技术的广泛、多功能的框架。

独立技术:如果没有变量相互依赖,则可以使用独立建模技术来了解数据集内的结构组成和潜在模式。

因子分析:一种通过将多个变量凝聚在一起来为其他模型准备数据的预处理技术。

聚类分析:用于将数据点分类为相关组或“聚类”。

多维尺度:使用距离表显示数据点的相对距离。此表称为邻近矩阵,可能由多个维度组成。

对应分析:将数据的行和列可视化为地图上的点。
多元 AMAV 模型的优势
多元 AMAV 技术具有与 ARIMA 相同的优点,此外还具有以下优点:

 

跟踪数据点和变量之间的关系:

数据和变量之间的关系几乎不是线性的。多元 AMAV 技术考虑到了这一点,允许您调整变量以更好地理解它们之间的关系。

比单变量模型更准确:假设您的数据正确,多变量模型会更全面地描绘您的数据。通过考虑可能影响数据的所有变量,您不太可能错过某些内容或做出错误的假设。

返回頂端