什么是时序分析?

时序分析是一种用于处理时间序列数据和趋势分析的统计技术。时间序列数据遵循周期性时间间隔,按固定的时间间隔测量或在特定的时间间隔中收集。换句话说,时间序列就是按时间排序的一系列数据点,而时序分析就是理解这些数据的过程。

时序分析示例

在业务环境中,时间序列数据的示例包括需要在一段时间内捕获的任何趋势。Google 趋势报告是一种可以分析的时间序列数据。还有更为复杂的应用,例如基于过去趋势的需求和供应预测。

TIBCO 的时序分析
试试 TIBCO Spotfire-免费试用
借助市场上最完整的分析解决方案 TIBCO Spotfire,可以轻松发现您数据中的新见解。

时间序列数据示例

在经济学中,时间序列数据可以是国内生产总值 (GDP)、消费者物价指数、标普 500 指数和失业率。根据美联储的经济数据,该数据集可以是一个国家的国内生产总值。

从社会科学的角度来看,时间序列数据可以是出生率、移民数据、人口增长和政治因素。

时间序列数据的统计特征并不总是符合传统的统计方法。因此,准确分析时间序列数据需要一套独特的工具和方法,统称为时序分析。

某些方面是时序分析过程不可或缺的一部分。分析师应该能够确定数据是:

  • 平稳性是时间序列的关键方面。当时间序列的统计属性(例如平均值)和方差不随时间变化时,时间序列被确定为平稳。它具有恒定方差和平均值,并且协方差与时间是无关的。
  • 季节性是指周期性波动。例如,如果您考虑用电量,它通常在白天很高,而在夜间会降低。就购物模式而言,在线销售在假日期间激增,然后放缓和下降。
  • 自相关是观测值之间的相似性,是它们之间时间滞差的函数。绘制自相关数据会生成类似于正弦函数的图形。

数据:类型、术语和概念

通常,数据被认为是以下三种类型之一:

  1. 时间序列数据:对变量在不同时间点具有的值测定的一组观测值。
  2. 横截面数据:在同一时间点收集的一个或多个变量的数据。
  3. 汇集数据:时间序列数据和横截面数据的组合。

以下是一些与时间序列数据分析相关的术语和概念:

  • 依赖性:依赖性是指两个观测值与先前时间点相同变量的关联。
  • 平稳性:此参数测量序列的中值或平均值。如果某个值在给定时间段内保持不变、整个数据中存在峰值或者这些值趋向于无穷大,则它不具有平稳性。
  • 差异:差异是一种使时间序列静止并控制自动出现的相关性的技术。也就是说,并非所有时序分析都需要差异,这样做可能会产生不准确的估计。
  • 曲线拟合:曲线拟合作为一种回归方法对于非线性关系中的数据非常有用。在这种情况下,曲线拟合的数学方程式可确保那些落在边缘太多而无法产生任何实际影响的数据 “回归” 到具有明显公式的曲线上,以便系统使用和解释。

识别横截面数据与时间序列数据

与时间序列数据相反的是横截面数据。这是指在单个时间点观察个人和组织等各种实体以得出推论。两种形式的数据分析都有其自身的价值,有时企业会使用这两种形式的分析来得出更好的结论。

时序数据几乎可以在受过去影响的业务和组织应用程序的每个领域中找到。范围涵盖经济学、社会科学和人类学到气候变化、商业、金融、运营乃至流行病学。在时间序列中,时间通常是自变量,目标是预测未来。

时序分析最显著的优势在于它有可能在观测值之间建立关联,原因就是时间序列中的数据点是在相邻时间段以线性方式收集的。这一特点将时间序列数据与横截面数据区分开来。

时序分析技术

正如我们在上面所看到的,时序分析对于组织来说可能是一个宏大目标。为了从模型拟合中获得准确的结果,可以在时序分析中使用几种数学模型之一,例如:

  • Box-Jenkins 自回归综合移动平均线 (ARIMA) 模型
  • Box-Jenkins 多变量模型
  • Holt-Winters 指数平滑

虽然精确的数学模型不在本文的讨论范围之内,但这些模型的一些具体应用值得在这里讨论。

ARIMA 和多变量变量的 Box-Jenkins 模型都使用变量过去的行为来决定哪个模型最适合分析它。假设任何用于分析的时间序列数据都可以通过其过去值、过去误差或两者的线性函数来表征。该模型最初开发时,使用的数据来自燃气炉及其随时间变化的行为。

相比之下,Holt-Winters 指数平滑模型最适合分析表现出定义趋势且随季节变化的时间序列数据。

这样的数学模型是几种测量方法的组合;Holt-Winters 方法使用看起来很简单的加权平均值,但这些值分次用于指数平滑方程。

时序分析的应用

时序分析模型产生两个结果:

  • 了解产生观测数据模式的潜在力量和结构。复杂的真实场景很少会落入固定的模式,时序分析支持对场景及随着时间推移观察到的所有变量进行研究。此应用通常旨在了解在一段时间内逐步发生的过程,例如气候变化对感染率上升的影响。
  • 尽可能精确地拟合数学模型,以便该过程可以进入预测、监控甚至某些反馈循环。对于那些希望大规模运营并需要所有投入才能取得成功的企业来说,这是一个用例。

虽然数据是数值的,分析过程似乎是数理的,但时序分析似乎几乎是抽象的。不过,任何组织都可以实现这种方法的一些现实应用。例如,有趣的是,像亚马逊这样的大型全球供应链就是因为对不同时期此种复杂的数据进行解释才得以维持。即使在 COVID-19 疫情期间,供应链遭受最大损失,还是能够更快地反弹,这要归功于数字,以及每天和每周持续对这些数字的理解。

时序分析用于确定可用于预测业务指标的最佳模型。例如,股票市场价格波动、销售、营业额以及任何其他可以使用时间序列数据来预测未来的过程。它使管理层能够了解数据中随时间变化的模式,并分析业务指标的趋势。

从实际的角度来看,组织中的时序分析主要用于:

  • 经济预测
  • 销售预测
  • 效用研究
  • 预算分析
  • 股市分析
  • 收益率预测
  • 人口普查分析
  • 流程和质量控制
  • 库存研究
  • 工作量预测

时序分析的优点

数据分析师可以从时序分析中受益匪浅。从清理原始数据、理解原始数据到发现模式以帮助进行预测,通过应用各种时间序列模型可以完成很多工作。

以下是时序分析的一些优点:

它清理数据并消除混淆因素

数据清理可过滤掉噪声、移除离群值或应用各种平均值以获得更好的数据整体视角。这意味着通过消除噪声来对信号进行分区。时序分析的过程消除了所有的噪音,使企业能够真正更清楚地了解日常情况。

提供对数据的理解

时序分析中使用的模型确实有助于解释数据集中数据的真实含义,使数据分析师的工作更加轻松。应用自相关模式和季节性度量可以预测何时可以预期某个数据点。此外,平稳度测量可以获得对所述数据点值的估计值。

这意味着企业可以查看数据并查看跨时空的模式,而不是大量对组织的核心职能没有意义的数字和数。

预测数据

时序分析可以作为预测数据的基础。时序分析固有的能力可以发现数据中的模式,这些模式构成了预测未来数据点的基础。时序分析的这种预测特性使其在业务领域非常受欢迎。大多数数据分析使用过去的数据来追溯获取洞见,而时序分析则有助于预测未来。正是这种优势帮助管理层做出更好的业务决策。

时序分析的缺点

时序分析并不完美。在需要更多数据点和模型的单一研究中,它可能会受到泛化的影响。人为错误可能会误认正确的数据模型,可能对输出产生滚雪球式的影响。

获得适当的数据点也并非易事。时序分析与大多数其他统计问题之间的主要区别在于,观测值在时间序列中并不总是独立的。

例如,一次单一机会事件可能会影响所有以后的数据点,每位数据科学家都有责任准确衡量其中哪些事件可能对相关分析产生影响。预测中是否会有相似之处可以使历史数据变得有用?

时序分析资源
免费电子书:哪种类型的分析适合您?报告、预测分析还是其他类型的分析。
哪种分析适合您?找出符合您业务需求的最佳解决方案。

时序分析的未来

时序分析代表了一个非常先进的数据分析领域。它侧重于描述、处理和预测时间序列。时间序列是按时间顺序排列的数据集。在解释时间序列时,在选择正确的模型进行分析之前,必须考虑自相关模式、季节性和平稳性。有几种时序分析模型,包括基本、微调和高级模型。高级模型可帮助数据分析师更准确地预测时间序列行为。

随着自动化和机器学习技术的出现,理解这些信息并进行复杂的计算不再像以前那样艰难,这为充分了解我们的过去和未来铺平了道路。