Qu'est-ce qu'un histogramme ?

Un histogramme est une méthode d'affichage des données avec des catégories représentées par un rectangle, parfois appelé graphique à barres verticales. Il permet de comparer facilement un certain nombre d'éléments et d'analyser les tendances. En général, les statistiques et les chiffres sont difficiles à comprendre lorsqu'ils sont présentés dans des tableaux ou sous forme écrite. Les histogrammes rendent les choses faciles, immédiates et compréhensibles.

Exemple d'histogramme

Un histogramme est différent d'un diagramme à barres. Alors qu'un diagramme à barres représente la variable horizontalement et la dimension fixe verticalement, l'histogramme fait l'inverse. Cependant, la plupart des gens ne font pas la distinction et utilisent indifféremment les histogrammes et les diagrammes à barres.

On pense que l'inventeur des histogrammes et des diagrammes à barres est William Playfair. À la fin des années 1700, il a publié un atlas sur les statistiques commerciales et politiques de l'époque. Le premier diagramme à barres concernait les exportations et les importations de l'Écosse entre Noël 1780 et Noël 1781.

Démonstration d'un histogramme
Visualisations et graphiques avec Spotfire
Regardez cette démo pour voir à quel point il est facile, grâce à Spotfire, de commencer à visualiser tous les aspects de vos données.

Quand utiliser les histogrammes

Il s'agit de l'un des graphiques les plus courants et il existe une série de scénarios dans lesquels ils sont excellents pour transmettre des informations de manière logique et claire. Les histogrammes sont idéalement utilisés lorsque :

  • Les données comportent un petit nombre de catégories discrètes. Chacune de ces catégories a une seule valeur.
  • Le graphique doit comparer les valeurs de chaque catégorie.
  • L'objectif est de rendre l'information aussi facile à comprendre que possible.

Dans le monde des affaires, les histogrammes sont régulièrement utilisés dans les rapports. Qu'il s'agisse d'informations sur les ventes, de résultats d'indicateurs clés de performance ou d'une analyse de la clientèle, les histogrammes sont idéaux. Ils sont beaucoup plus flexibles dans leur utilisation qu'un graphique circulaire par exemple, et présentent davantage de données et de catégories.

Pour comparer les valeurs des données de catégories connexes

Les histogrammes, dans leur forme la plus simple, comparent une série de catégories en une seule mesure. Cela permet aux lecteurs de juger de la performance de chaque catégorie par rapport aux autres. La performance des ventes en est un exemple.

Pour voir les changements dans les variables dépendantes au fil du temps

L'observation des changements sur une période donnée est une autre excellente utilisation des histogrammes. Souvent, les graphiques linéaires peuvent être remplacés par un histogramme. Une entreprise peut souhaiter voir les sources de son trafic Internet au cours d'une année, par exemple.

Comparer les contributions des membres de différentes catégories

Les diagramme à barres stacked montrent comment différents groupes contribuent au total général de quelque chose. Le total des ventes réalisées dans différentes branches par des vendeurs individuels en est un exemple.

Comparaison des valeurs négatives et positives

De nombreux graphiques n'affichent pas bien les données négatives. Cependant, les histogrammes sont idéaux pour afficher les données négatives par rapport aux données positives et pour comparer les performances par rapport à une référence.

Quand ne pas utiliser les histogrammes

Évitez les histogrammes et trouvez un autre graphique lorsqu'il y a un grand nombre de catégories, lorsque vous avez besoin de valeurs cumulées, que les valeurs sont petites ou qu'il s'agit de taux. Envisagez d'utiliser des graphiques linéaires s'il y a beaucoup de catégories à comparer.

Bonnes pratiques pour les histogrammes

Pour créer un graphique facile à comprendre et qui ne soit pas trompeur, il y a quelques pratiques de base à suivre.

À moins qu'il y ait un ordre naturel dans les données, comme les groupes d'âge, triez les catégories de façon à ce que la plus grande catégorie se trouve à l'extrême gauche. Ceci est conforme au principe de Pareto.

L'axe Y doit commencer à zéro. Dans certains cas, il peut être possible ou acceptable de « réduire » l'échelle en bas, mais cela doit être utilisé avec parcimonie. Par exemple, si toutes les données commencent à 1000 et finissent à 1500, vous pouvez réduire l'échelle pour qu'elle commence à 1000, à condition que cela ne soit pas trompeur.

À moins que vous ne choisissiez des couleurs spécifiques pour une raison précise ou que vous ne fassiez des groupes de données, utilisez une seule couleur. La diversité des couleurs peut être source de distraction et de confusion.

Si les chiffres réels sont importants, il peut être avantageux de supprimer l'étiquetage de l'axe et d'écrire les valeurs correspondantes à la fin de la colonne. Toutefois, si l'élément important à afficher est la tendance, il faut toujours utiliser l'axe.

Pensez aux espaces entre les colonnes. Les espaces doivent être distincts, afin de permettre une distinction claire et facile. Cependant, la largeur de la colonne doit toujours être supérieure à l'espace, sinon le graphique sera plus difficile à interpréter.

Variantes des histogrammes

Il existe un grand nombre de variantes d'histogrammes. Elles ne conviennent pas toutes à tous les scénarios.

Histogramme de groupes

Les histogrammes peuvent regrouper des éléments. Par exemple, si l'on analyse les ventes d'un grand magasin, il peut y avoir des groupes pour chaque filiale et les ventes totales de chaque division au sein de la filiale. Ainsi, il pourrait y avoir les ventes des départements de l'électronique et du mobilier pour chaque filiale à travers le pays.

Histogrammes empilés

Les histogrammes empilés sont utiles lorsque le montant total est égal à 100 %. Un graphique comporte des barres qui, empilées ensemble, représentent un pourcentage de 100. Ces chiffres agrégés peuvent facilement montrer les pourcentages des volumes totaux par catégorie ou par période.

Par exemple, pour la même chaîne de grands magasins, un diagramme à barres empilées peut indiquer le pourcentage des ventes réalisées par chaque vendeur au sein de la filiale. Il y a plusieurs magasins et chacun d'entre eux a un diagramme à barres empilées qui montre les ventes totales pour cette filiale et le pourcentage des ventes réalisées par chaque vendeur dans cette filiale.

Ces diagrammes empilés sont idéaux lorsqu'il y a plusieurs valeurs pour une même catégorie.

Diagrammes à barres

Les diagrammes à barres sont des histogrammes inclinés sur le côté. Les quantités sont communiquées par la largeur de la barre, plutôt que par la hauteur. Ils n'offrent aucun avantage ou défi particulier par rapport à un histogramme, mais certaines données peuvent être plus faciles à comprendre lorsqu'elles sont présentées dans un diagramme à barres. Les diagrammes à barres peuvent comporter du texte dans les barres sous forme d'étiquette.

Logiciel d'histogramme
Essai gratuit de TIBCO Spotfire
Avec TIBCO Spotfire, la solution d'analyse la plus complète du marché, découvrez facilement de nouvelles informations à partir de vos données.

Avantages des histogrammes

Résumer visuellement un grand ensemble de données

Si un ensemble de données est regroupé de manière appropriée, les histogrammes sont faciles à comprendre en un coup d'œil. Les catégories peuvent être résumées de manière à ce que leur compréhension et leur interprétation soient visuellement presque instantanées.

Bonne heuristique

Vu que les histogrammes sont faciles à comprendre, ils permettent un contrôle visuel rapide de l'exactitude et de la vraisemblance des données. Vous pouvez voir d'un coup d'œil si les données correspondent et si elles sont logiques.

Facilement compréhensible

En raison de leur utilisation répandue, les histogrammes sont facilement compréhensibles. Ils sont plus faciles à interpréter qu'un tableau et permettent une compréhension rapide des données.

Inconvénients des histogrammes

Peuvent nécessiter des explications supplémentaires

Lorsque quelqu'un regarde le graphique, il peut trouver qu'il n'y a tout simplement pas assez d'informations pour en tirer des conclusions valables. C'est souvent le cas lorsqu'il y a trop de données présentées en même temps, ou lorsqu'elles sont trop complexes pour un histogramme.

Solution : n'affichez qu'un seul ensemble de données à la fois. Indiquez clairement les deux axes, donnez un titre descriptif et, s'il y a des groupes de catégories, donnez une clé pour faciliter l'interprétation. Si les données ne sont toujours pas présentées clairement, envisagez d'utiliser un autre type de graphique, tel qu'un nuage de points ou un graphique à bulles.

Facilement manipulable

Si un créateur de graphiques voulait déformer intentionnellement des données, il lui serait très facile de le faire. En changeant simplement l'échelle ou même la largeur des barres, les données pourraient être manipulées pour répondre à n'importe quel objectif. Par exemple, si une entreprise souhaite montrer l'évolution des volumes de ventes sur une période donnée, elle peut commencer l'échelle à un chiffre différent de zéro, puis laisser une grande distance entre deux chiffres, pour montrer ainsi des différences énormes entre les filiales, alors qu'en réalité, les différences peuvent être minimes.

Solution : éviter les échelles réduites et toujours faire commencer l'axe à zéro. Les lecteurs doivent être conscients des possibilités de manipulation et signaler les présentations de données.

Non-révélation d'effets ou de schémas

Si les données sont mal présentées, elles ne seront pas significatives. Si les catégories ne sont pas égales ou si les données ne sont pas présentées de manière ordonnée, le graphique ne montrera pas les causes, les effets et les modèles.

Solution : disposez de catégories de données significatives et égales. À moins qu'il y ait une raison de le faire, la catégorie la plus importante doit se trouver à gauche avec une tendance à la baisse vers la droite.