¿Qué es el análisis de series temporales?

El análisis de series temporales es una técnica estadística que se ocupa de los datos de series temporales y el análisis de tendencias. Los datos de series temporales siguen intervalos de tiempo periódicos que se midieron en intervalos de tiempo regulares o se recopilaron en intervalos de tiempo particulares. En otras palabras, una serie temporal es simplemente una serie de puntos de datos ordenados en el tiempo, y el análisis de series temporales es el proceso de dar sentido a dichos datos.

Ejemplo de análisis de series temporales

En un contexto comercial, los ejemplos de datos de series temporales incluyen cualquier tendencia que deba capturarse durante un período de tiempo. Un informe de tendencias de Google es un tipo de datos de series temporales que se pueden analizar. También existen aplicaciones mucho más complejas, como la previsión de demanda y oferta basadas en tendencias pasadas.

Análisis de series temporales con TIBCO
Pruebe TIBCO Spotfire - Prueba gratuita
Con TIBCO Spotfire, la solución de análisis más completa del mercado, descubra fácilmente nuevos conocimientos a partir de sus datos.

Ejemplos de datos de series temporales

En economía, los datos de series temporales pueden ser el Producto Interno Bruto (PIB), el Índice de Precios al Consumidor, el Índice S&P 500 y las tasas de desempleo. El conjunto de datos podría ser el producto interno bruto de un país a partir de los datos económicos de la reserva federal.

Desde la perspectiva de las ciencias sociales, los datos de series temporales podrían ser la tasa de natalidad, los datos de migración, el aumento de la población y los factores políticos.

Las características estadísticas de los datos de series temporales no siempre se ajustan a los métodos estadísticos convencionales. Como resultado, el análisis preciso de los datos de series temporales requiere un conjunto único de herramientas y métodos, conocidos colectivamente como análisis de series temporales.

Ciertos aspectos son una parte integral del proceso de análisis de series temporales. El analista deberá identificar que los datos poseen las siguientes características:

  • La estacionariedad es un aspecto crucial de una serie temporal. Se determina que una serie temporal es estacionaria cuando sus propiedades estadísticas, como el promedio (media) y la varianza, no se alteran con el tiempo. Tiene una varianza y una media constantes, y la covarianza está separada del tiempo.
  • La estacionalidad se refiere a las fluctuaciones periódicas. Por ejemplo, si considera el consumo de electricidad, generalmente es alto durante el día y más bajo durante la noche. En el caso de los patrones de compra, las ventas en línea aumentan durante las vacaciones antes de desacelerarse y caer.
  • La autocorrelación es la similitud entre las observaciones en función del tiempo que transcurre entre ellas. Trazar datos autocorrelacionados produce un gráfico similar a una función sinusoidal.

Datos: tipos, términos y conceptos

Los datos, en general, serán uno de estos tres tipos:

  1. Datos de series temporales: Conjunto de observaciones sobre los valores que toma una variable en diferentes puntos del tiempo.
  2. Datos transversales: Datos de una o más variables, recopilados en el mismo punto en el tiempo.
  3. Datos agrupados: una combinación de datos de series temporales y datos transversales.

A continuación algunos de los términos y conceptos asociados con el análisis de datos de series temporales:

  • Dependencia: La dependencia se refiere a la asociación de dos observaciones con la misma variable en puntos de tiempo anteriores.
  • Estacionariedad: Este parámetro mide el valor medio o promedio de la serie. Si un valor permanece constante durante el período de tiempo dado, si existen picos a lo largo de los datos, o si estos valores tienden hacia el infinito, entonces no es estacionario.
  • Diferenciación: La diferenciación es una técnica para hacer estacionaria la series temporales y controlar las correlaciones que surgen automáticamente. Dicho esto, no todos los análisis de series temporales necesitan diferenciación y hacerlo podría producir estimaciones inexactas.
  • Ajuste de curvas: el ajuste de curvas como método de regresión es útil para datos que no están en una relación lineal. En tales casos, la ecuación matemática para el ajuste de curvas garantizará que los datos que caen demasiado en los márgenes como para tener un impacto real se "retroceden" en una curva con una fórmula distinta que los sistemas pueden usar e interpretar.

Identificación de datos transversales frente a datos de series temporales

Lo opuesto a los datos de series temporales son los datos transversales. Esto sucede cuando varias entidades, como individuos y organizaciones, se observan en un solo momento para sacar inferencias. Ambas formas de análisis de datos tienen su propio valor y, a veces, las empresas usan ambas formas de análisis para sacar mejores conclusiones.

Los datos de series temporales se pueden encontrar en casi todas las áreas de aplicaciones comerciales y organizacionales afectadas por el pasado. Esto abarca desde la economía, las ciencias sociales y la antropología hasta el cambio climático, los negocios, las finanzas, las operaciones e incluso la epidemiología. En una serie temporal, el tiempo suele ser la variable independiente y el objetivo es hacer un pronóstico para el futuro.

La ventaja más destacada del análisis de series temporales es que, debido a que los puntos de datos en una serie temporal se recopilan de manera lineal en períodos de tiempo adyacentes, potencialmente puede establecer correlaciones entre las observaciones. Esta función distingue los datos de series temporales de los datos transversales.

Técnicas de análisis de series temporales

Como hemos visto anteriormente, el análisis de series temporales puede ser un objetivo ambicioso para las organizaciones. Para obtener resultados precisos del ajuste de modelos, se puede usar uno de varios modelos matemáticos en el análisis de series temporales, como:

  • Modelo autorregresivo integrado de media móvil (ARIMA) de Box-Jenkins
  • Modelos multivariados de Box-Jenkins
  • Suavizado exponencial de Holt-Winters

Si bien los modelos matemáticos exactos están más allá del alcance de este artículo, estas son algunas aplicaciones específicas de estos modelos que vale la pena analizarlas aquí.

Los modelos de Box-Jenkins tanto de ARIMA como de los multivariados utilizan el comportamiento pasado de una variable para decidir qué modelo es el mejor para analizarla. La suposición es que cualquier dato de series temporales para el análisis se puede caracterizar por una función lineal de sus valores pasados, errores pasados o ambos. Cuando se desarrolló el modelo por primera vez, los datos utilizados eran de un horno de gas y su comportamiento variable a lo largo del tiempo.

Por el contrario, el modelo de suavizado exponencial de Holt-Winters es más adecuado para analizar datos de series temporales que muestran una tendencia definitoria y varían según las estaciones.

Dichos modelos matemáticos son una combinación de varios métodos de medición; el método de Holt-Winters utiliza promedios ponderados que pueden parecer bastante simples, pero estos valores se superponen en las ecuaciones para suavizar exponencialmente.

Aplicaciones del análisis de series temporales

Los modelos de análisis de series temporales arrojan dos resultados:

  • Obtener una comprensión de las fuerzas y la estructura subyacentes que produjeron los patrones de datos observados. Los escenarios complejos del mundo real rara vez caen en patrones establecidos, y el análisis de series temporales permite su estudio, junto con todas sus variables observadas a lo largo del tiempo. Esta aplicación generalmente está destinada a comprender los procesos que ocurren gradualmente y durante un período de tiempo, como el impacto del cambio climático en el aumento de las tasas de infección.
  • Ajustar un modelo matemático con la mayor precisión posible para que el proceso pueda avanzar hacia la previsión, el seguimiento o incluso ciertos círculos de retroalimentación. Este es un caso de uso para empresas que buscan operar a escala y necesitan todos los comentarios que puedan obtener para tener éxito.

Si bien los datos son numéricos y el proceso de análisis parece matemático, el análisis de series temporales puede parecer casi abstracto. Sin embargo, cualquier organización puede realizar una serie de aplicaciones actuales de dichos métodos. Por ejemplo, es interesante imaginar que las grandes cadenas de suministro globales como las de Amazon solo se mantienen a flote debido a la interpretación de datos tan complejos en varios períodos de tiempo. Incluso durante la pandemia de COVID-19, cuando las cadenas de suministro sufrieron el mayor daño, el hecho de que hayan podido recuperarse más rápido es gracias a los números y la comprensión de estos números, que continúa sucediendo cada día y cada semana.

El análisis de series temporales se usa para determinar el mejor modelo que se puede usar para pronosticar las métricas comerciales. Por ejemplo, las fluctuaciones de los precios del mercado de valores, las ventas, la facturación y cualquier otro proceso que pueda utilizar datos de series temporales para hacer predicciones sobre el futuro. Permite a la gerencia comprender patrones dependientes del tiempo en los datos y analizar tendencias en las métricas comerciales.

Desde un punto de vista práctico, el análisis de series temporales en las organizaciones se utiliza principalmente para:

  • Pronóstico económico
  • Pronóstico de ventas
  • Estudios de utilidad
  • Análisis presupuestario
  • Análisis bursátil
  • Proyecciones de rendimiento
  • Análisis del censo
  • Proceso y control de calidad
  • Estudios de inventario
  • Proyecciones de carga de trabajo

Ventajas del análisis de series temporales

Los analistas de datos tienen mucho que ganar con el análisis de series temporales. Desde la limpieza de datos sin procesar, darles sentido y descubrir patrones para ayudar con las proyecciones, se puede lograr mucho mediante la aplicación de varios modelos de series temporales.

He aquí algunas ventajas del análisis de series temporales:

Limpia datos y elimina factores de confusión

La limpieza de datos filtra el ruido, elimina los valores atípicos o aplica varios promedios para obtener una mejor perspectiva general de los datos. Significa concentrarse en la señal filtrando el ruido. El proceso de análisis de series temporales elimina todo el ruido y permite a las empresas obtener una imagen más clara de lo que sucede día a día.

Proporciona la comprensión de los datos

Los modelos utilizados en el análisis de series temporales ayudan a interpretar el verdadero significado de los datos en un conjunto de datos, lo que facilita la vida de los analistas de datos. Los patrones de autocorrelación y las medidas de estacionalidad se pueden aplicar para predecir cuándo se puede esperar un determinado punto de datos. Además, las medidas de estacionariedad pueden obtener una estimación del valor de dicho punto de datos.

Esto significa que las empresas podrán analizar los datos y ver patrones a lo largo del tiempo y el espacio, en lugar de una masa de cifras y números que no son significativos para la función principal de la organización.

Datos de previsión

El análisis de series temporales puede ser la base para pronosticar datos. El análisis de series temporales está inherentemente equipado para descubrir patrones en los datos que forman la base para predecir puntos de datos futuros. Es este aspecto de pronóstico del análisis de series temporales lo que lo hace extremadamente popular en el área de negocios. Si bien la mayoría de los análisis de datos usan datos pasados para obtener información de manera retroactiva, el análisis de series temporales ayuda a predecir el futuro. Es esta misma ventaja la que ayuda a la gerencia a tomar mejores decisiones comerciales.

Desventajas del análisis de series temporales

El análisis de series temporales no es perfecto. Puede sufrir la generalización a partir de un solo estudio donde se justificaron más puntos de datos y modelos. El error humano podría identificar erróneamente el modelo de datos correcto, lo que podría tener un efecto de bola de nieve en la salida.

También podría ser difícil obtener los puntos de datos convenientes. Un punto importante de diferencia entre el análisis de series temporales y la mayoría de los demás problemas estadísticos es que en una serie temporal, las observaciones no siempre son independientes.

Por ejemplo, un solo evento fortuito puede afectar todos los puntos de datos posteriores, y depende de cada científico de datos medir con precisión cuál de estos eventos puede tener un impacto en el análisis en cuestión. ¿Existen similitudes en las predicciones que pueden hacer que los datos históricos sean útiles?

Recurso de análisis de series temporales
Libro electrónico gratuito: ¿Qué tipo de análisis es el adecuado para usted? Informes, analítica predictiva y todo lo demás.
¿Qué tipo de análisis es el adecuado para usted? Encuentre la mejor solución para sus necesidades de negocio.

Futuro del análisis de series temporales

El análisis de series temporales representa un área muy avanzada del análisis de datos. Se enfoca en describir, procesar y pronosticar series temporales. Las series temporales son conjuntos de datos ordenados en el tiempo. Al interpretar una serie temporal, se deben tener en cuenta los patrones de autocorrelación, la estacionalidad y la estacionariedad antes de seleccionar el modelo correcto para el análisis. Existen varios modelos de análisis de series temporales, que van desde básicos, ajustados y avanzados. Los modelos avanzados ayudan a los analistas de datos a predecir el comportamiento de las series temporales con mucha mayor precisión.

Con el advenimiento de las técnicas de automatización y Machine Learning, comprender esta información y realizar cálculos complejos no es tan difícil como lo era antes, preparando el camino para una mejor comprensión de nuestro pasado y nuestro futuro.