¿Qué es un gráfico Scatter?

Un gráfico Scatter, también llamado diagrama de dispersión, es un gráfico que muestra la relación entre dos variables. Es un tipo de gráfico increíblemente poderoso, que permite a los espectadores comprender de inmediato una relación o tendencia, que sería imposible ver en casi cualquier otra forma.

Ejemplo de gráfico Scatter/diagrama de dispersión

Sus orígenes no están claros, pero los gráficos Scatter modernos se basan en el sistema de coordenadas cartesianas de René Descartes, creado en el siglo XVII. Los diagramas de dispersión se usan mucho en la ciencia y la gran mayoría se usa en revistas y publicaciones científicas.

Se ha dicho que los gráficos Scatter son uno de los inventos más versátiles y útiles en la historia de los gráficos estadísticos. Si bien esto puede ser una afirmación audaz, los gráficos Scatter toman datos confusos y les dan sentido. Son mucho más que una simple herramienta de visualización; son una herramienta para el descubrimiento.

Demostración de gráfico Scatter
Visualizaciones/Gráficos con Spotfire
Vea esta demostración para ver la forma sencilla de cómo lo hace Spotfire para comenzar a visualizar todos los aspectos de sus datos.

¿Cómo funciona un gráfico Scatter?

Como la mayoría de los otros tipos de gráficos o cuadros, un diagrama de dispersión tiene un eje X y uno Y. La X es la línea horizontal con la variable independiente y la Y es la vertical con la variable dependiente. Se crea una escala uniforme en ambos ejes y luego se hace una marca o punto en el punto que representa la intersección de las dos coordenadas.

Existen otros patrones que se pueden encontrar dentro de un gráfico Scatter:

  • Lineal o no lineal: se puede formar una correlación lineal (recta) a través de los puntos de datos, pero una correlación no lineal puede mostrar una relación curva.
  • Débil o fuerte: cuanto más fuerte sea la correlación, más cerca estarán los puntos. Una correlación débil tendrá más puntos de datos dispersos.

Para mostrar claramente estas relaciones y tendencias, muchos gráficos Scatter utilizan líneas de tendencia. Se dibuja una línea de tendencia en el gráfico para enfatizar la dirección y la fuerza de la tendencia.

Mejores prácticas para gráficos Scatter

Existen algunos consejos simples para asegurarse de que su gráfico Scatter presente la información de forma clara y sin distorsiones en los datos.

Comience el eje Y en cero. Si bien puede haber algunos casos en los que se requiera un acordeón de escala para que los datos se presenten con mayor precisión, estos casos son pocos. Tenga mucho cuidado al decidir si necesita un acordeón o no.

Mantenga la escala distribuida uniformemente en ambos ejes. Esto significa que no existe distorsión.

Piense cuidadosamente acerca de los valores atípicos. Si existen motivos para sospechar que son incorrectos o si no agregan valor a su historia, sería conveniente excluirlos.

Con los diagramas de dispersión, a menudo es mejor incluir más datos y variables, no menos. A diferencia de otros tipos de gráficos, si se realizan correctamente, los gráficos Scatter no se confunden con más datos. Considere agregar variaciones de tamaño y color a los puntos para incluir datos más relevantes de una manera que sea fácil de entender.

Utiliza líneas de tendencia. Estas líneas generalmente son trazadas por el software, aunque se pueden agregar manualmente. Estas líneas ayudan a que las tendencias sean muy claras para el espectador. Sin embargo, no tenga más de dos líneas de tendencia, ya que esto puede resultar confuso.

Cuándo usar gráficos Scatter

Aparte de los estudios científicos, existen algunas ocasiones en las que las empresas pueden decidir utilizar un gráfico Scatter:

  • Para identificar anomalías
  • Para ver cómo una variable afecta a otra
  • Para ver una correlación, patrón, tendencia o relación

Un agente de bienes raíces puede querer ver una relación entre los pies cuadrados y el precio pagado por las casas. Si bien es posible que este simple gráfico Scatter no profundice y muestre todas las variables, como la ubicación, la antigüedad de las renovaciones o el tamaño del jardín, aún les dará a los compradores y vendedores una idea de lo que está haciendo el mercado y dónde podría una casa encajar en la escala.

Una empresa puede querer ver si existe una relación entre los volúmenes de ventas y alguna otra variable. ¿El clima influye en las ventas? ¿El día de la semana? ¿Qué pasa con la cantidad de ropa en un perchero? ¿Se vende más ropa si hay más en exhibición?

Beneficios de los gráficos Scatter

Los gráficos Scatter tienen múltiples beneficios y ventajas.

Muestra claramente las relaciones

Podría decirse que este es el mejor gráfico para mostrar las relaciones entre dos variables. No solo muestra una relación entre dos puntos de datos, sino que también muestra un patrón completo o una tendencia sobre un conjunto de datos.

Fácil de crear y entender

Quizás debido a su popularidad, los diagramas de dispersión se comprenden de inmediato. Su propósito se reconoce fácilmente y sus datos son fáciles de digerir. No solo eso, sino que para aquellos que quieran hacer un gráfico Scatter, son fáciles de crear.

El rango de datos se puede determinar

Los valores máximo y mínimo se pueden ver en diagramas de dispersión, lo cual es importante para comprender todo el conjunto de datos. Sin embargo, los valores atípicos pueden crear confusión.

Desventajas de los gráficos Scatter

Pueden tener demasiados datos

Si hay un gráfico de diagrama de dispersión sobre trazado, los patrones son difíciles de ver, ya que es solo una mancha gigante. Entonces, si bien un gráfico necesita suficientes datos para formar una correlación o patrón visible, existe un punto en el que más datos se vuelven menos útiles.

Solución

Un mapa de calor puede ayudar, mostrando las partes del gráfico con más puntos. Considere codificar por colores diferentes conjuntos de datos.

Ausencia de asociaciones

Existen momentos en los que los datos pueden parecer tener un patrón o una asociación. Pero si bien la altura y el hecho de tener un gato pueden parecer relacionados, probablemente no lo estén.

Solución

Evite graficar variables que probablemente no estén relacionadas.

Correlación no es igual a causalidad

Recuerda siempre que correlación no es igual a causalidad. El hecho de que exista una correlación no significa que una sea la causa de la otra. Si bien puede parecer que las personas altas tienen más gatos, es poco probable que la altura sea la causa de tener gatos. Incluso las relaciones más lógicas pueden sucumbir a esto también; Si bien las ventas pueden aumentar cuando hace frío, ¿se debe eso al clima o a alguna tercera variable, como el chocolate caliente gratis que la tienda ofrece a los clientes?

Solución

No asigne la causalidad en función de una correlación.

Prueba de software de gráfico Scatter
Pruebe TIBCO Spotfire - Prueba gratuita
Con TIBCO Spotfire, la solución de análisis más completa del mercado, descubra fácilmente nuevos conocimientos a partir de sus datos.

Alternativas a un gráfico Scatter

Gráfico de cola de pescado

Un diagrama de cola de pescado se parece al esqueleto de un pez. La "cabeza" es el problema, y las causas del problema salen de la columna vertebral, como lo hacen las espinas de pescado. Este es el otro gráfico principal que la gente usa para ayudar a establecer la causalidad. Sin embargo, esto no utiliza datos cuantitativos como un diagrama de dispersión, sino que es más una sesión de lluvia de ideas orgánica. Son gráficos muy diferentes, diseñados para diferentes procesos. Si bien puede haber una causa y un efecto, este es el límite de las similitudes de los gráficos.