O que é análise de séries temporais?
A análise de séries temporais é uma técnica em estatística que lida com dados de séries temporais e análise de tendências. Os dados de séries temporais seguem intervalos de tempo periódicos que foram medidos em intervalos regulares ou coletados em intervalos específicos. Em outras palavras, uma série temporal é simplesmente uma série de pontos de dados ordenados no tempo, e a análise de séries temporais é o processo de dar sentido a esses dados.
Em um contexto de negócios, exemplos de dados de séries temporais incluem quaisquer tendências que precisam ser capturadas durante um período de tempo. Um relatório de tendências do Google é um tipo de dados de série temporal que podem ser analisados. Existem também aplicações muito mais complexas, como previsão de demanda e oferta com base em tendências passadas.

Exemplos de dados de séries temporais
Em economia, os dados de séries temporais podem ser o Produto Interno Bruto (PIB), o Índice de Preços ao Consumidor, o Índice S&P 500 e as taxas de desemprego. O conjunto de dados pode ser o produto interno bruto de um país a partir dos dados econômicos do Banco Central.
Do ponto de vista das ciências sociais, os dados de séries temporais podem ser taxa de natalidade, dados de migração, aumento da população e fatores políticos.
As características estatísticas dos dados de séries temporais nem sempre se ajustam aos métodos estatísticos convencionais. Como resultado, analisar dados de séries temporais com precisão requer um conjunto exclusivo de ferramentas e métodos, conhecidos coletivamente como análise de séries temporais.
Certos aspectos são parte integrante do processo de análise de séries temporais. O analista deve ser capaz de identificar que os dados são:
- A estacionariedade é um aspecto crucial de uma série temporal. Uma série temporal é determinada como estacionária quando suas propriedades estatísticas, como a média (mediana) e a variância não se alteram ao longo do tempo. Ela tem uma variância e uma média constantes, e a covariância é separada do tempo.
- A sazonalidade refere-se a flutuações periódicas. Por exemplo, o consumo de eletricidade geralmente é alto durante o dia e diminui durante a noite. No caso de padrões de compras, as vendas on-line aumentam durante os feriados antes de desacelerar e cair.
- Autocorrelação é a similaridade entre as observações em função do intervalo de tempo entre elas. A plotagem de dados autocorrelacionados produz um gráfico semelhante a uma função senoidal.
Dados: tipos, termos e conceitos
Os dados, em geral, são considerados como um destes três tipos:
- Dados de séries temporais: um conjunto de observações sobre os valores que uma variável assume em diferentes pontos do tempo.
- Dados transversais: dados de uma ou mais variáveis, coletados no mesmo momento.
- Dados agrupados: uma combinação de dados de séries temporais e dados transversais.
Estes são alguns dos termos e conceitos associados à análise de dados de séries temporais:
- Dependência: a dependência refere-se à associação de duas observações com a mesma variável em momentos anteriores.
- Estacionariedade: este parâmetro mede o valor médio ou mediano da série. Se um valor permanecer constante durante o período de tempo determinado, se houver picos em todos os dados ou se esses valores tenderem ao infinito, então não há estacionariedade.
- Diferenciação: a diferenciação é uma técnica para tornar a série temporal estacionária e controlar as correlações que surgem automaticamente. Dito isto, nem todas as análises de séries temporais precisam de diferenciação, e fazer isso pode produzir estimativas imprecisas.
- Ajuste de curva: o ajuste de curva como método de regressão é útil para dados que não estão em uma relação linear. Nesses casos, a equação matemática para ajuste de curva garante que os dados situados nas margens sem qualquer impacto real sejam “regredidos” em uma curva com uma fórmula distinta que os sistemas podem usar e interpretar.
Identificação de dados transversais vs dados de séries temporais
O oposto de dados de séries temporais são dados transversais. É quando várias entidades, como indivíduos e organizações, são observadas em um único ponto no tempo para fazer inferências. Ambas as formas de análise de dados têm seu próprio valor e, às vezes, as empresas usam ambas as formas de análise para tirar melhores conclusões.
Dados de séries temporais podem ser encontrados em quase todas as áreas de negócios e aplicações organizacionais afetadas pelo passado. Isso varia de economia, ciências sociais e antropologia a mudanças climáticas, negócios, finanças, operações e até epidemiologia. Em uma série temporal, o tempo geralmente é a variável independente e o objetivo é fazer uma previsão para o futuro.
A vantagem mais proeminente da análise de séries temporais é que – como os pontos de dados em uma série temporal são coletados de maneira linear em períodos de tempo adjacentes – ela pode potencialmente fazer correlações entre observações. Esse recurso separa os dados de séries temporais dos dados transversais.
Técnicas de análise de séries temporais
Como vimos acima, a análise de séries temporais pode ser uma meta ambiciosa para as organizações. Para obter resultados precisos do ajuste de modelo, um dos vários modelos matemáticos pode ser usado na análise de séries temporais, como:
- Modelos autorregressivos integrados de médias móveis (ARIMA) Box-Jenkins
- Modelos multivariados Box-Jenkins
- Suavização exponencial de Holt-Winters
Embora os modelos matemáticos exatos estejam além do escopo deste artigo, essas são algumas aplicações específicas desses modelos que vale a pena discutir aqui.
Os modelos Box-Jenkins das variedades ARIMA e multivariadas usam o comportamento passado de uma variável para decidir qual modelo é melhor para analisá-la. A suposição é que quaisquer dados de séries temporais para análise podem ser caracterizados por uma função linear de seus valores passados, erros passados ou ambos. Quando o modelo foi desenvolvido, os dados utilizados eram de um forno a gás e seu comportamento variável ao longo do tempo.
Em contraste, o modelo de suavização exponencial de Holt-Winters é mais adequado para analisar dados de séries temporais que exibem uma tendência definidora e variam de acordo com as estações.
Tais modelos matemáticos são uma combinação de vários métodos de medição; o método de Holt-Winters usa médias ponderadas que podem parecer bastante simples, mas esses valores são colocados em camadas nas equações para suavização exponencial.
Aplicações da análise de séries temporais
Os modelos de análise de séries temporais geram dois resultados:
- Obter uma compreensão das forças e estrutura subjacentes que produziram os padrões de dados observados. Cenários complexos do mundo real raramente se enquadram em padrões definidos, e a análise de séries temporais permite seu estudo – juntamente com todas as suas variáveis observadas ao longo do tempo. Essa aplicação geralmente se destina a entender processos que acontecem gradualmente e ao longo de um período de tempo, como o impacto das mudanças climáticas no aumento das taxas de infecção.
- Encaixar-se em um modelo matemático com a maior precisão possível para que o processo possa passar para previsão, monitoramento ou até mesmo certos ciclos de feedback. Este é um caso de uso para empresas que buscam operar em escala e precisam de todas as informações que podem obter para ter sucesso.
Embora os dados sejam numéricos e o processo de análise pareça matemático, a análise de séries temporais pode parecer quase abstrata. No entanto, qualquer organização pode realizar uma série de aplicações atuais de tais métodos. Por exemplo, é interessante imaginar que grandes cadeias de suprimentos globais, como as da Amazon, só são mantidas em alta devido à interpretação de dados tão complexos em vários períodos de tempo. Mesmo durante a pandemia do COVID-19, onde as cadeias de suprimentos sofreram danos máximos, o fato de terem conseguido se recuperar mais rapidamente se deve aos números e à compreensão desses números, que continuam acontecendo todos os dias da semana.
A análise de séries temporais é usada para determinar o melhor modelo que pode ser usado para prever métricas de negócios. Por exemplo, flutuações de preços no mercado de ações, vendas, rotatividade e qualquer outro processo que possa usar dados de séries temporais para fazer previsões sobre o futuro. Ela permite que o gerenciamento entenda os padrões dependentes do tempo nos dados e analise as tendências nas métricas de negócios.
Do ponto de vista prático, a análise de séries temporais nas organizações é usada principalmente para:
- Previsão econômica
- Previsão de vendas
- Estudos de concessionárias
- Análise orçamentária
- Análise do mercado de ações
- Projeções de rendimento
- Análise do censo
- Controle de processos e qualidade
- Estudos de inventário
- Projeções de carga de trabalho
Vantagens da análise de séries temporais
Os analistas de dados têm muito a ganhar com a análise de séries temporais. Desde limpar dados brutos, dar sentido a eles e descobrir padrões para ajudar nas projeções, muito pode ser feito por meio da aplicação de vários modelos de séries temporais.
Aqui estão algumas vantagens da análise de séries temporais:
Limpa dados e remove fatores de confusão
A limpeza de dados filtra ruídos, remove discrepâncias ou aplica várias médias para obter uma melhor perspectiva geral dos dados. Isso significa identificar o sinal filtrando o ruído. O processo de análise de séries temporais remove todo o ruído e permite que as empresas realmente tenham uma visão mais clara do que está acontecendo no dia a dia.
Fornece compreensão dos dados
Os modelos usados na análise de séries temporais ajudam a interpretar o verdadeiro significado dos dados em um conjunto, facilitando a vida dos analistas de dados. Padrões de autocorrelação e medidas de sazonalidade podem ser aplicados para prever quando um determinado ponto de dados pode ser esperado. Além disso, as medidas de estacionariedade podem obter uma estimativa do valor do referido ponto de dados.
Isso significa que as empresas podem analisar os dados e ver padrões ao longo do tempo e do espaço, em vez de uma massa de informações e números que não são significativos para a função central da organização.
Previsão de dados
A análise de séries temporais pode ser a base para a previsão de dados. A análise de séries temporais é inerentemente equipada para descobrir padrões nos dados que formam a base para prever pontos de dados futuros. É esse aspecto de previsão da análise de séries temporais que a torna extremamente popular na área de negócios. Enquanto a maioria das análises de dados usa dados anteriores para obter informações de forma retroativa, a análise de séries temporais ajuda a prever o futuro. É exatamente essa vantagem que ajuda a gerência a tomar melhores decisões de negócios.
Desvantagens da análise de séries temporais
A análise de séries temporais não é perfeita. Ela pode ser prejudicada pela generalização a partir de um único estudo onde mais pontos de dados e modelos foram garantidos. Erro humano pode afetar a escolha do modelo de dados correto, o que pode ter um efeito de bola de neve no resultado.
Também pode ser difícil obter os pontos de dados apropriados. Uma diferença importante entre a análise de séries temporais e a maioria dos outros problemas estatísticos é que, em uma série temporal, as observações nem sempre são independentes.
Por exemplo, um único evento casual pode afetar todos os pontos de dados posteriores, e cabe a cada cientista de dados avaliar com precisão quais desses eventos podem ter impacto na análise em questão. Existem semelhanças nas previsões que podem tornar os dados históricos úteis?

O futuro da análise de séries temporais
A análise de séries temporais representa uma área altamente avançada da análise de dados. Ela se concentra na descrição, no processamento e na previsão de séries temporais. As séries temporais são conjuntos de dados ordenados no tempo. Ao interpretar uma série temporal, padrões de autocorrelação, sazonalidade e estacionariedade devem ser levados em consideração antes de selecionar o modelo correto para análise. Existem vários modelos de análise de séries temporais, passando por básicos, ajustados e avançados. Modelos avançados ajudam os analistas de dados a prever o comportamento das séries temporais com muito mais precisão.
Com o advento das técnicas de automação e aprendizado de máquina, compreender essas informações e realizar cálculos complexos não é mais tão difícil, abrindo caminho para uma melhor compreensão do nosso passado e futuro.