什麼是時間序列分析?

時間序列分析是一種統計學技巧,用於處理時間序列資料和趨勢分析。時間序列資料具有週期性時間間隔,會依照規律的時間間隔來定期測量,或依照特定的時間間隔來收集資料。換句話說,時間序列只是按時間排序的一系列資料點,時間序列分析則是理解這些資料的過程。

時間序列分析範例

在業務環境中,時間序列資料的例子包括需要在一段時間內捕捉的任何趨勢,例如 Google 趨勢報告就是一種可以分析的時間序列資料。它還有更複雜的應用,例如基於過去趨勢來做供需預測。

TIBCO 的時間序列分析
嘗試 TIBCO Spotfire - 免費試用
借助 TIBCO Spotfire(市場上最完整的分析解決方案),可以輕鬆地從數據中發現新見解。

時間序列資料的範例

在經濟學中,時間序列資料可能包括國內生產總值 (GDP)、消費者價格指數、標準普爾 500 指數和失業率,此資料集可能來自美國聯準會經濟資料的某個國家的國內生產總值。

從社會科學的角度來看,時間序列資料可能是出生率、遷移資料、人口增長和政治因素。

時間序列資料的統計學特徵並非總是符合傳統的統計方法,因此,準確分析時間序列資料需要一套獨特的工具和方法,統稱為時間序列分析。

某些方面是時間序列分析過程不可或缺的組成部分,分析師應該能夠確定資料是:

  • 穩定性是時間序列的一個重要方面。如果一個時間序列的統計學特性(例如平均值)和變異數不隨著時間改變,就被認為是穩定的,亦即它具有恆定的變異數和平均值,並且共變異數與時間無關。
  • 季節性是指週期性波動。例如,如果您想想用電量,通常是白天較高、晚上較低。如果是購物模式,則假日期間線上銷售會飆升,然後放緩並下降。
  • 自相關是觀察值之間具有相似性,它們之間的時間差能以函數表示。繪製自相關資料時會產生類似於正弦函數的圖形。

資料:類型、術語和概念

通常,資料被認為是以下三種類型之一:

  1. 時間序列資料:這組觀察值是變數在不同時間點的值。
  2. 橫截面資料:在同一時間點收集一或多個變數的資料。
  3. 合併資料:時間序列資料和橫截面資料的組合。

以下是與時間序列資料分析相關的一些術語和概念:

  • 相依性:相依性是指兩個觀察值都與先前時間點的同一個變數有關聯。
  • 穩定性:此參數用於測量序列的平均值。如果一個值在給定的一段時間內保持不變,如果整個資料中存在峰值,或者如果這些值趨於無限大,那麼它就不是穩定的。
  • 差分:差分是一種使時間序列平穩化並控制自動出現的相關性的技術。也就是說,並非所有時間序列分析都需要差分,有時這樣做反而會產生不準確的估計。
  • 曲線擬合:曲線擬合是一種迴歸方法,對於非線性關係的資料很有用。在這種情況下,曲線擬合的數學方程式可確保將落在邊緣而無法產生任何實際影響的眾多資料「迴歸」到具有系統可以使用和解釋的獨特公式曲線上。

識別橫截面資料與時間序列資料

與時間序列資料相反的是橫截面資料,這是在單一時間點觀察各種實體(例如個人和組織)以得出推論。這兩種形式的資料分析都各自有其價值,有時企業會同時使用這兩種形式的分析來得出更好的結論。

在幾乎所有會受過去影響的業務和組織應用領域中,都可以找到時間序列資料,範圍從經濟學、社會科學、人類學,到氣候變化、商業、金融、作業、甚至流行病學,幾乎到處可見。在時間序列中,時間往往是獨立變數,目標是對未來做出預測。

時間序列分析最突出的優點是,因為時間序列中的資料點是以線性方式在相鄰時段收集的資料,所以它可能可以在觀察值之間建立相關性。此功能將時間序列資料與橫截面資料區分開來。

時間序列分析技術

正如我們在上文看到的,時間序列分析對組織來說可能是一個遠大目標。為了從模型擬合中獲得準確的結果,可以在時間序列分析中使用幾種數學模型,例如:

  • Box-Jenkins 自迴歸移動平均 (ARIMA) 模型
  • Box-Jenkins 多變數模型
  • Holt-Winters 指數平滑

雖然確切的數學模型超出了本文範圍,但這些模型的一些具體應用非常值得在這裡討論。

Box-Jenkins 的 ARIMA 模型和多變數模型都使用變數的過去行為來決定哪個模型最適合分析它,假設任何用於分析的時間序列資料,都可以透過其過去值、過去誤差或兩者,以線性函數來表示。最初開發該模型時,使用的資料來自於瓦斯爐及其隨時間變化的行為。

相比之下,Holt-Winters 指數平滑模型最適合分析具有明確趨勢並隨季節變化的時間序列資料。

這種數學模型是幾種測量方法的組合,Holt-Winters 方法使用看起來很簡單的加權平均值,但這些值在指數平滑方程式上會分層使用。

時間序列分析的應用

時間序列分析模型會產生兩個結果:

  • 對於會產生所觀察資料模式的底層力量和結構有所瞭解。複雜的現實世界場景很少陷入固定模式,時間序列分析可用來研究隨著時間推移而觀察到的所有變數。此應用通常旨在瞭解一段時間內逐漸發生的過程,例如氣候變化對感染率上升的影響。
  • 盡可能準確地擬合數學模型,以便進入預測、監控、甚至特定回饋循環的過程。對於希望大規模操作、並需要可以獲致成功的所有投入的企業來說,這是一個使用案例。

雖然是數字資料,而且分析過程似乎是數學的,但時間序列分析的內容幾乎是抽象的,然而,任何組織都可以在目前許多應用中使用這些方法。例如想起來就很有趣,像 Amazon 這樣的大型全球供應鏈,就是憑藉解讀不同時段內如此複雜的資料來維持營運,即使在供應鏈遭受最大損失的 COVID-19 疫情期間,由於對這些數字以及對這些數字的理解,使他們仍能快速應變處理,而這個實況每天、每週都在持續發生。

時間序列分析可用來判斷應該使用哪個最佳模型來預測業務指標。例如,股票市場價格波動、銷售額、營業額,和任何其他可用時間序列資料來預測未來的過程。它使管理階層更能瞭解資料中與時間相關的模式,並分析業務指標的趨勢。

從實踐的角度來看,組織中的時間序列分析主要用於:

  • 經濟預測
  • 銷售預測
  • 效用研究
  • 預算分析
  • 股市分析
  • 產量預測
  • 人口普查分析
  • 過程和品質控制
  • 庫存研究
  • 工作量預測

時間序列分析的優勢

資料分析師可以從時間序列分析中獲益良多。從清理原始資料、理解資料、到發現模式以幫助預測,他們可以透過應用各種時間序列模型來完成很多工作。

以下是時間序列分析的一些優點:

清理資料並消除混雜因素

資料清理能夠過濾掉雜訊,去除離群值,或應用各種平均值以獲得更好的資料整體視角。這意味著透過濾除雜訊來分隔訊號,時間序列分析過程會消除所有的雜訊,讓企業能夠真正更清楚地瞭解日常發生的事情。

提供對資料的理解

時間序列分析中使用的模型確實有助於解釋資料集中的資料真實含義,使資料分析師的工作更輕鬆。他們可以運用自相關模式和季節性測量值,來預測何時可以預期出現某個資料點。此外,穩定性測量值可以用來估計所述資料點的值。

這意味著企業可以查看資料,並跨越時間和空間來查看其變化模式,而不是只看到大量對組織核心功能沒有意義的圖片和數字。

預測資料

時間序列分析可以做為預測資料的基礎。時間序列分析天生具備揭示資料模式的能力,這些模式構成了預測未來資料點的基礎。正是時間序列分析的這種預測能力,使它在業務領域非常流行。大多數資料分析都使用過去的資料來回溯取得洞察見解,而時間序列分析有助於預測未來,這種優勢將能幫助管理階層做出更好的業務決策。

時間序列分析的缺點

時間序列分析並不完美。在需要更多資料點和模型的單一研究中,它可能會受到普遍化的影響。人為錯誤可能會誤判正確的資料模型,而其輸出將產生滾雪球效應。

此外,也可能難以獲得適當的資料點。時間序列分析與大多數其他統計問題之間的主要區別在於,在時間序列中,觀察值並非總是獨立的。

例如,一個偶然事件可能會影響所有後來的資料點,每個資料科學家都需要準確判斷哪些事件可能對相關分析產生影響,思考使用歷史資料所做的不同預測之間是否存在相似之處?

時間序列分析資源
免費電子書:報告、預測型分析,還是兩者混合,哪種類型的分析方案最適合您?
哪種分析法最適合您?尋找適合您業務需求的最佳解決方案。

時間序列分析的未來

時間序列分析是一個非常先進的資料分析領域,側重於描述、處理和預測時間序列。時間序列是按時間排序的資料集,在解釋時間序列時,必須先將自相關模式、季節性和穩定性等納入考量,才能選出正確的模型進行分析。時間序列分析模型有好幾種,包括基本、微調和進階的模型,其中進階模型可幫助資料分析師更準確地預測時間序列行為。

隨著自動化和機器學習技術的出現,理解這些資訊和進行複雜運算已不再像以前那樣困難,讓我們能夠更好地瞭解去和未來。