Qu'est-ce qu'un graphique treemap ?

Le treemapping est une technique de data visualization qui affiche des données hiérarchiques en utilisant des rectangles de tailles décroissantes, souvent appelés imbrications, pour créer des graphiques treemap.

Exemple de graphique treemap

Comme leur nom l'indique, les graphiques treemap représentent les données sous la forme d'un arbre, avec des branches et des sous-branches qui peuvent être lues d'un seul coup d'œil. Ces graphiques arborescents permettent de prendre une grande quantité de données brutes et de les représenter d'une manière visuellement attrayante, compacte et facile à lire, ce qui permet à l'utilisateur de discerner des modèles et de faire des comparaisons rapidement.

Ceux-ci peuvent être extrêmement bénéfiques lorsqu'il s'agit d'afficher simultanément une magnitude de catégories majeures ainsi que leurs sous-catégories. Ils transmettent avec précision les relations de partie à partie dans un ensemble complexe de données. Les graphiques arborescents peuvent montrer une profondeur de quelques couches à des dizaines de couches. Ils peuvent également permettre à l'utilisateur d'accéder à des centaines de sous-catégories.

Démonstration de graphique treemap
Visualisations et graphiques avec Spotfire
Regardez cette démo pour voir à quel point il est facile, grâce à Spotfire, de commencer à visualiser tous les aspects de vos données.

Caractéristiques et composants d'un graphique treemap

Voici les caractéristiques qui définissent les graphiques treemap :

  • Les données sont représentées par des rectangles.
  • Chaque rectangle représente deux valeurs numériques. Les rectangles sont parfois appelés « nœuds » ou « branches ». Les ensembles de données imbriqués à l'intérieur sont alors appelés « feuilles ».
  • Les dimensions et les couleurs du tracé des rectangles sont calculées sur la base des variables quantitatives associées aux rectangles respectifs.
  • Les données peuvent être multicouches : les données organisées hiérarchiquement sont représentées dans un ensemble de rectangles imbriqués, avec les « éléments parents » et leurs « éléments enfants ».
  • Lorsqu'une quantité est affectée à une catégorie, la taille de la zone du rectangle est proportionnelle à cette quantité.
  • La surface de la catégorie parent est constituée de la somme de ses sous-catégories.
  • Les rectangles de l'arborescence sont disposés en fonction de leur taille. Le format standard est le suivant : les rectangles vont du coin supérieur gauche du graphique au coin inférieur droit. Par conséquent, le coin supérieur gauche de l'arborescence comporte le plus grand rectangle, tandis que le coin inférieur droit du graphique comporte le plus petit rectangle.
  • Avec des données hiérarchiques, c'est-à-dire avec des rectangles imbriqués, le même ordre est suivi, les rectangles de niveau inférieur étant empilés à l'intérieur de chaque rectangle de niveau supérieur dans l'arborescence. La taille et la position dans le graphique du rectangle parent contenant le rectangle imbriqué dépendent de la somme des surfaces des rectangles imbriqués.

Cette forme de représentation permet de distinguer plus facilement les différentes catégories et de lire et interpréter un grand nombre de valeurs de données bien plus facilement que d'autres formats. Les arborescences sont un excellent moyen, peu encombrant et efficace, d'afficher les hiérarchies dans les données.

Exemples de diagrammes treemap et leurs variantes

Il existe un grand nombre de façons d'utiliser une arborescence dans les industries, les domaines d'étude et les types de présentation :

  • La comparaison des chiffres de vente de différentes marques ou de différents modèles sur une période donnée peut constituer un excellent graphique treemap bidimensionnel.
  • Le taux d'alphabétisation dans les districts appartenant à une certaine zone géographique sur une période spécifique
  • Les densités de population relatives des 10 premiers pays les plus peuplés
  • L'inventaire des différents oiseaux, animaux et poissons (y compris les espèces) dans une animalerie est l'exemple parfait d'un graphique treemap imbriqué.
  • Vous trouverez ci-dessous l'image d'un graphique treemap qui utilise des données relatives aux ventes d'articles électroniques dans plusieurs villes.

Création d'un graphique treemap

Un graphique treemap est composé de trois sections principales :

1. La zone de tracé

Le corps de la représentation visuelle est réalisé ici : chaque rectangle est coloré dans les tons de la catégorie du plus haut niveau. Toutefois, cela n'est nécessaire que lorsque l'arborescence représente uniquement des données, et d'autres variantes de couleurs peuvent également être utilisées lors de la conception de l'arborescence.

La zone de tracé est l'endroit où la représentation visuelle a lieu.

2. Le titre du graphique

En donnant au graphique un nom clair et descriptif, vous aiderez vos utilisateurs à comprendre facilement la visualisation.

3. La légende

La légende est la partie de la carte qui permet de distinguer les différentes séries de données. Elle est parfois représentée par une échelle de couleurs glissante. Dans une légende de type clé de couleur, chaque couleur représente une des catégories du plus haut niveau (branches).

Logiciel de création de graphique treemap
Essai gratuit de TIBCO Spotfire
Avec TIBCO Spotfire, la solution d'analyse la plus complète du marché, découvrez facilement de nouvelles informations à partir de vos données.

Quand faut-il utiliser un graphique treemap ?

Un graphique treemap est idéal lorsque vos données doivent être mises en valeur et analysées dans le contexte de deux valeurs quantitatives, dont chaque unité est représentée par un rectangle.

Souvent, les dimensions du rectangle correspondent à un aspect des données, comme les chiffres de vente annuels moyens d'un article électronique, tandis que la couleur du rectangle peut être basée sur une échelle de couleur glissante, représentant le pourcentage de croissance des ventes cette année-là par rapport aux années précédentes. Cela permet de visualiser des données complexes, avec différentes variables et périodes de temps présentées d'une manière facile à comprendre.

Lorsque vous disposez d'une énorme quantité de données qui doit être comprimée dans un espace limité, un graphique treemap est une excellente solution. Lorsqu'il s'agit de représenter des dizaines de milliers de points de données, les graphiques treemap ont l'avantage sur d'autres graphiques fréquemment utilisés pour représenter des données hiérarchiques, tels que les graphiques à nœuds glissants ou les graphiques circulaires multiniveaux. Lorsque le nombre de points de données dépasse une certaine limite, les graphiques à nœuds glissants ou les graphiques circulaires ne peuvent pas s'en accommoder.

Il est plus facile de lire et de comprendre les graphiques linéaires en général que les graphiques circulaires. Alors qu'un camembert est circulaire, le graphique treemap est linéaire, ce qui offre un avantage visuel et analytique.

Choisissez un graphique treemap lorsque vous avez besoin d'un résumé de haut niveau ou lorsque vous devez examiner simultanément plusieurs paramètres. Un graphique treemap identifie les tendances et les modèles entre les rectangles ou les nœuds de toutes les catégories représentées, en plus des relations internodales au sein d'une catégorie unique ou autonome.

Avantages des graphiques treemap

Les principaux avantages des graphiques treemap sont les suivants :

  • La capacité à identifier des modèles et à discerner des relations entre deux catégories ou deux éléments dans une structure de données hiérarchique. De même, les sous-structures ou les sous-éléments y sont représentés.
  • L'utilisation de l'espace lors du rendu de dizaines de milliers de points de données, avec la possibilité d'effectuer des recherches approfondies si nécessaire.
  • L'affichage précis de plusieurs éléments à la fois, y compris les rapports « partie à totalité ». Cela facilite la visualisation des données.
  • L'utilisation de clés de taille et de couleur pour visualiser divers attributs. Les catégories et sous-catégories peuvent être codées en couleur pour correspondre aux catégories parentes. Par exemple, les ventes d'appareils électroniques dans différentes succursales seront en nuances de bleu, tandis que les ventes de meubles seront en nuances de jaune.

Limites des graphiques treemap

Comme tout type de graphique, il y a des limites et des moments où il faut utiliser d'autres types de graphiques :

  • Un graphique treemap ne permet pas de prendre en compte des ensembles de données dont l'ampleur varie.
  • Toutes les valeurs de la variable quantitative qui représente la taille du rectangle doivent être des valeurs positives. Les valeurs négatives ne sont pas acceptables.
  • Étant donné que les points de données sont représentés sous la forme de rectangles sans autre option de tri, il s'ensuit qu'ils prennent de la place. En plus de la contrainte spatiale, la lisibilité peut être un peu plus difficile, car il est plus facile de lire des tracés de données longs et linéaires que des tracés larges et amples. Cela complique également l'impression de l'arborescence.
  • Certaines arborescences demandent beaucoup d'efforts pour être générées, même avec des programmes spécialisés.
  • Parfois, les graphiques treemap n'affichent pas les niveaux hiérarchiques avec autant de netteté que d'autres graphiques utilisés pour visualiser des données hiérarchiques, comme un diagramme en étoile ou un diagramme en arborescence.

Malgré toutes ces limites, les graphiques treemap sont l'un des outils les plus évocateurs visuellement pour représenter des données et fournir des informations sur des aspects qui sont difficiles à saisir à l'aide d'autres formes de graphiques, ce qui en fait un outil indispensable pour l'analyse des données.