Che cos'è l'analisi delle serie temporali?

L'analisi delle serie temporali è una tecnica statistica che si occupa dei dati delle serie temporali e dell'analisi delle tendenze. I dati delle serie temporali seguono intervalli di tempo periodici che sono stati misurati in intervalli di tempo regolari o sono stati raccolti in particolari intervalli di tempo. In altre parole, una serie temporale è semplicemente una serie di punti dati ordinati nel tempo e l'analisi delle serie temporali è il processo per dare un senso a questi dati.

Esempio di analisi delle serie temporali

In un contesto aziendale, gli esempi di dati di serie temporali includono qualsiasi tendenza che deve essere catturata in un periodo di tempo. Un rapporto sulle tendenze di Google è un tipo di dati di serie temporali che può essere analizzato. Esistono anche applicazioni molto più complesse, come la previsione della domanda e dell'offerta sulla base delle tendenze passate.

Analisi delle serie temporali con TIBCO
Prova TIBCO Spotfire - Prova gratuita
Con TIBCO Spotfire, la soluzione di analisi più completa sul mercato, scopri facilmente nuove insight dai tuoi dati.

Esempi di dati di serie temporali

In economia, i dati delle serie temporali possono essere il Prodotto interno lordo (PIL), l'Indice dei prezzi al consumo, l'Indice S&P 500 e i tassi di disoccupazione. La serie di dati potrebbe essere il prodotto interno lordo di un Paese, ricavato dai dati economici della Federal Reserve.

Dal punto di vista delle scienze sociali, i dati delle serie temporali possono essere il tasso di natalità, i dati sulle migrazioni, l'aumento della popolazione e i fattori politici.

Le caratteristiche statistiche dei dati delle serie temporali non sempre si adattano ai metodi statistici convenzionali. Di conseguenza, l'analisi accurata dei dati delle serie temporali richiede un insieme unico di strumenti e metodi, noti collettivamente come analisi delle serie temporali.

Alcuni aspetti sono parte integrante del processo di analisi delle serie temporali. L'analista deve essere in grado di identificare:

  • Stazionarietà è un aspetto cruciale di una serie temporale. Una serie temporale è considerata stazionaria quando le sue proprietà statistiche, come la media e la varianza, non cambiano nel tempo. La varianza e la media sono costanti e la covarianza è separata dal tempo.
  • Stagionalità si riferisce alle fluttuazioni periodiche. Ad esempio, se si considera il consumo di elettricità, questo è normalmente elevato durante il giorno e diminuisce durante la notte. Nel caso delle abitudini di acquisto, le vendite online registrano un picco durante le vacanze prima di rallentare e diminuire.
  • Autocorrelazione è la somiglianza tra le osservazioni in funzione dell'intervallo di tempo che le separa. Tracciando i dati autocorrelati si ottiene un grafico simile a una funzione sinusoidale.

I dati: tipi, termini e concetti

I dati, in generale, sono considerati uno di questi tre tipi:

  1. Dati di serie temporali: un insieme di osservazioni sui valori che una variabile assume in diversi momenti.
  2. Dati trasversali: dati di una o più variabili, raccolti nello stesso momento.
  3. Dati in pool: una combinazione di dati di serie temporali e dati trasversali.

Questi sono alcuni dei termini e dei concetti associati all'analisi delle serie temporali:

  • Dipendenza: la dipendenza si riferisce all'associazione di due osservazioni con la stessa variabile in punti temporali precedenti.
  • Stazionarietà: questo parametro misura la media o il valore medio della serie. Se un valore rimane costante per un determinato periodo di tempo, se ci sono picchi nei dati o se questi valori tendono all'infinito, allora non si tratta di stazionarietà.
  • Differenziazione: la differenziazione è una tecnica per rendere stazionarie le serie temporali e per controllare le correlazioni che sorgono automaticamente. Detto questo, non tutte le analisi delle serie temporali necessitano di differenziazione e la differenziazione può produrre stime imprecise.
  • Curve fitting: l'adattamento della curva come metodo di regressione è utile per i dati che non presentano una relazione lineare. In questi casi, l'equazione matematica per l'adattamento della curva assicura che i dati che cadono troppo ai margini per avere un impatto reale siano "regrediti" su una curva con una formula distinta che i sistemi possono utilizzare e interpretare.

Identificazione dei dati trasversali rispetto a quelli delle serie temporali

L'opposto dei dati delle serie temporali è rappresentato dai dati trasversali. Si tratta di osservare diverse entità, come individui e organizzazioni, in un unico momento per trarre conclusioni. Entrambe le forme di analisi dei dati hanno il loro valore e talvolta le aziende utilizzano entrambe le forme di analisi per trarre conclusioni migliori.

I dati delle serie temporali sono presenti in quasi tutte le aree di applicazione aziendale e organizzativa che hanno a che fare con il passato. Si va dall'economia, alle scienze sociali e all'antropologia, ai cambiamenti climatici, agli affari, alla finanza, alle operazioni e persino all'epidemiologia. In una serie temporale, il tempo è spesso la variabile indipendente e l'obiettivo è fare una previsione per il futuro.

Il vantaggio principale dell'analisi delle serie temporali è il seguente: poiché i punti dati di una serie temporale sono raccolti in modo lineare in periodi di tempo adiacenti, è possibile creare correlazioni tra le osservazioni. Questa caratteristica distingue i dati delle serie temporali dai dati trasversali.

Tecniche di analisi delle serie temporali

Come abbiamo visto in precedenza, l'analisi delle serie temporali può essere un obiettivo ambizioso per le organizzazioni. Per ottenere risultati accurati dal model-fitting, nell'analisi delle serie temporali si può utilizzare uno dei diversi modelli matematici, come ad esempio:

  • Modelli autoregressivi integrati a media mobile Box-Jenkins (ARIMA)
  • Modelli multivariati Box-Jenkins
  • Livellamento esponenziale di Holt-Winters

Sebbene i modelli matematici esatti vadano al di là dello scopo del presente articolo, alcune applicazioni specifiche di questi modelli meritano di essere discusse in questa sede.

I modelli Box-Jenkins, sia di tipo ARIMA che multivariato, utilizzano il comportamento passato di una variabile per decidere quale sia il modello migliore per analizzarla. Il presupposto è che qualsiasi serie temporale di dati da analizzare può essere caratterizzata da una funzione lineare dei suoi valori passati, degli errori passati o di entrambi. Quando il modello è stato sviluppato per la prima volta, i dati utilizzati erano quelli di un forno a gas e del suo comportamento nel tempo.

Al contrario, il modello di livellamento esponenziale di Holt-Winters è più adatto all'analisi di serie temporali che presentano un andamento definito e variano in base alle stagioni.

Tali modelli matematici sono una combinazione di diversi metodi di misurazione; il metodo Holt-Winters utilizza medie ponderate che possono sembrare abbastanza semplici, ma questi valori sono sovrapposti alle equazioni per la lisciatura esponenziale.

Applicazioni dell'analisi delle serie temporali

I modelli di analisi delle serie temporali producono due risultati:

  • Ottenere una comprensione delle forze e delle strutture sottostanti che hanno prodotto i modelli di dati osservati. Gli scenari complessi del mondo reale molto raramente rientrano in schemi prefissati e l'analisi delle serie temporali consente di studiarli, insieme a tutte le loro variabili osservate nel tempo. Questa applicazione è solitamente destinata a comprendere processi che avvengono gradualmente e per un periodo di tempo, come l'impatto del cambiamento climatico sull'aumento dei tassi di infezione.
  • Adattare un modello matematico nel modo più accurato possibile, in modo che il processo possa passare alla previsione, al monitoraggio o anche a determinati cicli di feedback. Si tratta di un caso d'uso per le aziende che vogliono operare su scala e che hanno bisogno di tutti gli input possibili per avere successo.

Mentre i dati sono numerici e il processo di analisi sembra matematico, l'analisi delle serie temporali può sembrare quasi astratta. Tuttavia, qualsiasi organizzazione può realizzare una serie di applicazioni attuali di tali metodi. Ad esempio, è interessante immaginare che grandi catene di distribuzione globali come quella di Amazon si mantengano a galla solo grazie all'interpretazione di dati così complessi in vari periodi di tempo. Anche durante la pandemia COVID-19, in cui le catene di distribuzione hanno subito il massimo danno, il fatto che siano state in grado di riprendersi più velocemente è merito dei numeri e della loro comprensione, che continua a verificarsi ogni giorno e ogni settimana.

L'analisi delle serie temporali viene utilizzata per determinare il modello migliore da utilizzare per prevedere i parametri aziendali. Ad esempio, le fluttuazioni dei prezzi di borsa, le vendite, il fatturato e qualsiasi altro processo che possa utilizzare i dati delle serie temporali per fare previsioni sul futuro. Consente alla direzione di comprendere i modelli dei dati dipendenti dal tempo e di analizzare le tendenze dei parametri aziendali.

Da un punto di vista pratico, l'analisi delle serie temporali nelle organizzazioni viene utilizzata soprattutto per:

  • Previsioni economiche
  • Previsioni di vendita
  • Studi sull'utilità
  • Analisi di bilancio
  • Analisi del mercato azionario
  • Proiezioni di rendimento
  • Analisi del censimento
  • Controllo dei processi e della qualità
  • Studi di inventario
  • Proiezioni del carico di lavoro

Vantaggi dell'analisi delle serie temporali

Gli analisti di dati hanno molto da guadagnare dall'analisi delle serie temporali. Dalla pulizia dei dati grezzi, alla loro comprensione, alla scoperta di schemi per aiutare le proiezioni, molto può essere ottenuto attraverso l'applicazione di vari modelli di serie temporali.

Ecco alcuni vantaggi dell'analisi delle serie temporali:

Pulisce i dati e rimuove i fattori confondenti

La pulizia dei dati filtra il rumore, rimuove gli outlier o applica varie medie per ottenere una migliore prospettiva generale dei dati. Significa concentrarsi sul segnale filtrando il rumore. Il processo di analisi delle serie temporali rimuove tutto il rumore e consente alle aziende di avere un quadro più chiaro di ciò che accade giorno per giorno.

Fornisce la comprensione dei dati

I modelli utilizzati nell'analisi delle serie temporali aiutano a interpretare il vero significato dei dati in una serie, rendendo la vita più facile agli analisti di dati. I modelli di autocorrelazione e le misure di stagionalità possono essere applicati per prevedere quando ci si può aspettare un determinato punto dati. Inoltre, le misure di stazionarietà consentono di ottenere una stima del valore di tale punto.

Ciò significa che le aziende possono osservare i dati e vedere i modelli nel tempo e nello spazio, piuttosto che una massa di cifre e numeri che non sono significativi per la funzione principale dell'organizzazione.

Dati di previsione

L'analisi delle serie temporali può essere la base per la previsione dei dati. L'analisi delle serie temporali è intrinsecamente in grado di scoprire modelli nei dati che costituiscono la base per prevedere i punti dati futuri. È proprio questo aspetto previsionale dell'analisi delle serie temporali che la rende estremamente popolare in ambito aziendale. Mentre la maggior parte dell'analisi dei dati utilizza i dati passati per ottenere informazioni retroattive, l'analisi delle serie temporali aiuta a prevedere il futuro. È proprio questo aspetto che aiuta la direzione a prendere decisioni aziendali migliori.

Svantaggi dell'analisi delle serie temporali

L'analisi delle serie temporali non è perfetta. Può soffrire di una generalizzazione da un singolo studio in cui erano giustificati più punti dati e modelli. L'errore umano potrebbe sbagliare l'identificazione del modello di dati corretto, con un conseguente effetto a valanga sui risultati.

Potrebbe anche essere difficile ottenere i punti dati appropriati. Un importante punto di differenza tra l'analisi delle serie temporali e la maggior parte degli altri problemi statistici è che in una serie temporale le osservazioni non sono sempre indipendenti.

Ad esempio, un singolo evento fortuito può influenzare tutti i punti dati successivi e spetta a ogni data scientist valutare con precisione quali di questi eventi possono avere un impatto sull'analisi in questione. Esistono analogie nelle previsioni che possono rendere utili i dati storici?

Risorsa per l'analisi delle serie temporali
E-Book gratuito: quale tipo di analytics è giusto per te? Reporting, Predictive Analytics e tutto il resto.
Quale tipo di analytics è giusto per te? Trova la soluzione migliore per le tue esigenze aziendali.

Il futuro dell'analisi delle serie temporali

L'analisi delle serie temporali rappresenta un'area molto avanzata dell'analisi dei dati. Si concentra sulla descrizione, l'elaborazione e la previsione delle serie temporali. Le serie temporali sono serie di dati ordinati nel tempo. Nell'interpretazione di una serie temporale, prima di scegliere il modello di analisi più adatto, è necessario tenere conto dei modelli di autocorrelazione, stagionalità e stazionarietà. Esistono diversi modelli di analisi delle serie temporali, che vanno da quelli di base a quelli avanzati. I modelli avanzati aiutano gli analisti dei dati a prevedere il comportamento delle serie temporali con una precisione molto maggiore.

Con l'avvento dell'automazione e delle tecniche di machine learning, la comprensione di queste informazioni e l'esecuzione di calcoli complessi non sono più così difficili come un tempo, aprendo la strada a una migliore comprensione del nostro passato e del nostro futuro.