Che cos'è un grafico a dispersione?

Il grafico a dispersione, chiamato anche diagramma di dispersione, è un grafico che mostra la relazione tra due variabili. Si tratta di un tipo di grafico incredibilmente potente, che consente agli spettatori di comprendere immediatamente una relazione o una tendenza che sarebbe impossibile vedere in quasi tutte le altre forme.

Esempio di grafico/diagramma a dispersione

Le loro origini non sono chiare, ma i grafici a dispersione moderni si basano sul sistema di coordinate cartesiane di Renato Cartesio, creato nel XVII secolo. I diagrammi di dispersione sono molto utilizzati in ambito scientifico e la maggior parte di essi viene utilizzata nelle riviste e nelle pubblicazioni scientifiche.

Si dice che i grafici a dispersione siano una delle invenzioni più versatili e utili nella storia dei grafici statistici. Anche se si tratta di un'affermazione azzardata, i grafici a dispersione prendono dati confusionari e li rendono sensati. Sono molto più di un semplice strumento di visualizzazione; sono uno strumento di scoperta.

Dimostrazione del diagramma di dispersione
Visualizzazioni/grafici con Spotfire
Dai un'occhiata a questa demo per vedere quanto Spotfire sia in grado di rendere facile la visualizzazione dei tuoi dati sotto ogni aspetto.

Come funziona un grafico a dispersione?

Come la maggior parte degli altri tipi di grafico o diagramma, un diagramma a dispersione ha un asse X e un asse Y. La X è la linea orizzontale con la variabile indipendente e la Y è la verticale con la variabile dipendente. Si crea una scala uniforme su entrambi gli assi e si fa un segno o un punto nel punto che rappresenta l'intersezione delle due coordinate.

Esistono altri modelli che si possono trovare in un grafico a dispersione:

  • Lineare o non lineare: una correlazione lineare, rettilinea, può formarsi attraverso i punti dati, ma una correlazione non lineare potrebbe mostrare una relazione curva.
  • Debole o forte: quanto più forte è la correlazione, tanto più vicini saranno i punti. Una correlazione debole avrà più punti dati sparsi.

Per mostrare chiaramente queste relazioni e tendenze, molti grafici a dispersione utilizzano linee di tendenza. Una linea di tendenza viene tracciata sul grafico per sottolineare la direzione e la forza della tendenza.

Migliori prassi per i grafici a dispersione

Esistono alcuni semplici consigli per assicurarsi che il grafico a dispersione presenti le informazioni in modo pulito e senza distorsioni dei dati.

Iniziare l'asse Y a zero. Sebbene in alcuni casi sia necessaria una fisarmonica di scala per presentare i dati in modo più accurato, si tratta di pochi casi. Fare molta attenzione quando si decide se una fisarmonica è necessaria o meno.

Mantenere la scala uniformemente distribuita su entrambi gli assi. In questo modo si evita la distorsione.

Riflettere attentamente sui dati anomali. Se c'è motivo di sospettare che non siano corretti, o se non aggiungono valore alla storia, potrebbe essere saggio escluderli.

Con i diagrammi di dispersione, spesso è meglio includere più dati e variabili, non meno. A differenza di altri tipi di grafici, se realizzati correttamente, i grafici a dispersione non creano confusione con un maggior numero di dati. Considerare la possibilità di aggiungere variazioni di dimensione e colore ai punti per includere più dati rilevanti in modo da renderli facilmente comprensibili.

Utilizzare le linee di tendenza. Queste linee sono generalmente tracciate dal software, anche se possono essere aggiunte manualmente. Queste linee contribuiscono a rendere le tendenze molto chiare per l'osservatore. Tuttavia, non bisogna avere più di due linee di tendenza, perché possono creare confusione.

Quando utilizzare i grafici a dispersione

A parte gli studi scientifici, ci sono alcuni casi in cui le aziende possono decidere di utilizzare un grafico a dispersione:

  • Per identificare le anomalie
  • Per vedere come una variabile influisce su un'altra
  • Per vedere una correlazione, un modello, una tendenza o una relazione

Un agente immobiliare potrebbe aver bisogno di vedere una relazione tra la metratura e il prezzo pagato per le case. Sebbene questo semplice grafico a dispersione non sia in grado di mostrare tutte le variabili, come la posizione, la recente ristrutturazione o le dimensioni del giardino, darà comunque agli acquirenti e ai venditori un'idea dell'andamento del mercato e della posizione della casa sulla scala.

Un'azienda potrebbe dover verificare se esiste una relazione tra i volumi di vendita e qualche altra variabile. Il tempo influisce sulle vendite? Il giorno della settimana? E il numero di vestiti su uno scaffale? Si vendono più capi se ce ne sono di più esposti?

Vantaggi dei grafici a dispersione

I grafici a dispersione presentano molteplici vantaggi e benefici.

Mostrano chiaramente le relazioni

Questo è probabilmente il miglior grafico per mostrare le relazioni tra due variabili. Non solo mostra una relazione tra due punti dati, ma anche un intero modello o tendenza su un insieme di dati.

Facili da creare e da comprendere

Probabilmente grazie alla loro popolarità, i diagrammi a dispersione sono immediatamente comprensibili. Il loro scopo è facilmente riconoscibile e i dati sono facili da assimilare. Non solo, ma per coloro che desiderano creare un grafico a dispersione, sono semplici da realizzare.

È possibile determinare l'intervallo di dati

I valori massimi e minimi sono visibili sui grafici a dispersione, il che è importante per comprendere l'intera serie di dati. Tuttavia, i valori anomali possono creare confusione.

Svantaggi dei grafici a dispersione

Possono avere troppi dati

Se il grafico a dispersione è eccessivamente tracciato, i modelli sono difficili da vedere, poiché si tratta solo di un gigantesco blob. Sebbene un grafico necessiti di un numero sufficiente di dati per formare una correlazione o un modello visibile, c'è un punto in cui un numero maggiore di dati diventa meno utile.

La soluzione

Può essere utile una mappa di calore che mostri le parti del grafico più ricche di punti. Considera la possibilità di codificare i colori delle diverse serie di dati.

Nessuna relazione

A volte può sembrare che i dati seguano uno schema o un'associazione. Ma se l'altezza e il possesso di un gatto possono sembrare correlati, probabilmente non lo sono.

La soluzione

Evitare di tracciare variabili che difficilmente sono correlate.

La correlazione non equivale alla causalità

Ricorda sempre che correlazione non equivale a causalità. Solo perché esiste una correlazione, non significa che una sia la causa dell'altra. Sebbene possa sembrare che le persone alte possiedano più gatti, è improbabile che l'altezza sia la causa del possesso di gatti. Anche le relazioni più logiche possono soccombere a questo fenomeno: se le vendite aumentano quando il tempo è freddo, ciò è dovuto al tempo o a qualche terza variabile, come la cioccolata calda gratuita che il negozio offre ai clienti?

La soluzione

Non assegnare la causalità sulla base di una correlazione.

Versione di valutazione del software per i grafici a dispersione
Prova TIBCO Spotfire - Prova gratuita
Con TIBCO Spotfire, la soluzione di analisi più completa sul mercato, scopri facilmente nuove insight dai tuoi dati.

Alternative al grafico a dispersione

Diagramma a lisca di pesce

Il diagramma a lisca di pesce assomiglia allo scheletro di un pesce. La "testa" è il problema e le cause del problema si dipartono dalla spina dorsale, proprio come le lische di pesce. Questo è l'altro grafico principale che si usa per stabilire il nesso di causalità. Tuttavia, non utilizza dati quantitativi come un diagramma di dispersione, ma è più una sessione organica di brainstorming. Si tratta di grafici molto diversi, progettati per processi diversi. Sebbene possano esserci una causa e un effetto, questo è il limite delle somiglianze tra di essi.