什么是树形图?

树形绘图法是一种数据可视化技术,它使用大小递减的矩形(通常称为嵌套)来显示分层数据,以创建树形图

树形图示例

顾名思义,树形图以树的形式描绘数据,其分支和子分支一目了然。树形图擅长获取大量原始数据,并以视觉上吸引人、紧凑且易于阅读的方式对其进行描绘,使用户能够辨别出模式并快速进行比较。

当同时显示大量的主要类别和子类别时,它可能会非常有益。它们通过一组复杂的数据准确地传达部分与整体的关系。树形图可以有几层到几十层的深度。它们还可以允许查看者深入到数百个子类别。

树形图演示
使用 Spotfire 创建可视化/图表
查看此演示,了解 Spotfire 如何轻松地使数据的各个方面可视化。

树形图的特征和组成部分

以下是树形图的定义特征:

  • 数据使用矩形表示。
  • 每个矩形代表两个数值。矩形有时被称为 “节点” 或 “分支”。那么其中的嵌套数据集就称为 “叶子”。
  • 矩形的尺寸和绘图颜色是根据与相应矩形关联的定量变量计算得出的。
  • 数据可以是多层的:分层组织的数据以一组嵌套的矩形表示,“父元素” 与它们的 “子元素” 一起平铺排列。
  • 将数量分配给类别时,矩形的面积大小与该数量成比例。
  • 父类别区域由其子类别的总和组合。
  • 树形图中的矩形根据大小进行排列。标准格式是矩形的大小从图表的左上角到右下角不等。因此,树形图的左上角具有最大的矩形,而图表的右下角具有最小的矩形。
  • 对于分层数据(即嵌套矩形),遵循相同的顺序,较低级别的矩形堆叠在树形图中每个较高级别的矩形内。包含嵌套矩形的父矩形在图表中的大小和位置取决于嵌套矩形的面积之和。

这种表示形式使得区分各种类别变得更加容易,并且比其他格式更容易读取和解释大量数据值。树形图是一种以节省空间且高效方式显示数据层次的极佳方式。

树形图及其不同形式的示例

树形图在不同行业、研究领域和展示类型中得到广泛使用:

  • 比较特定时期内不同品牌或型号的销售数字可以构成一个极佳的二维树形图
  • 特定时期内属于某一地理区域的地区内的识字率
  • 人口密度最高的十大国家的相对人口密度
  • 宠物商店中各种鸟类、动物和鱼类(包括种类)的库存是嵌套树形图的完美示例。
  • 下图是一张树形图的图像,它使用的是多个城市电子产品销售数据。

创建树形图

树形图由三个主要部分组成:

1. 绘图区域

视觉表现的主体是在这里完成的:每个矩形都着以最高级别类别的色调。但是,只有在树形图仅表示数据时才需要这样做,并且在设计树形图时也可以使用其他颜色。

绘图区域是进行视觉呈现的地方。

2. 图表标题

为图表指定一个清晰的描述性名称将有助于您的用户轻松理解可视化。

3. 图例

图例是图中有助于区分一个数据系列与另一个数据系列的部分,有时用滑动色标来表示。在色键类型的图例中,每种颜色代表一个最高级别的类别(分支)。

树形图创建软件
试试 TIBCO Spotfire-免费试用
借助市场上最完整的分析解决方案 TIBCO Spotfire,可以轻松发现您数据中的新见解。

什么时候应该使用树形图?

如果需要在两个定量值的上下文中展示和分析数据,每个定量值的单位由一个矩形表示,则树形图是理想的选择。

矩形的尺寸通常对应于数据的一个方面,例如电子产品的年平均销售数字,而矩形的颜色可以基于滑动色标,描绘当年销售额与往年相比增长的百分比。这允许对复杂数据进行可视化,并以易于理解的方式呈现不同的变量和时间范围。

当您需要将大量数据压缩到有限的空间中时,树形图是一个很好的解决方案。在绘制数万个数据点时,树形图比其他经常用于表示分层数据的图表(例如拖动节点图或多级饼图)更具优势。当数据点的数量增加超过一定限制时,拖动节点或饼图中就无法再容纳更多数据点。

一般而言,与圆形图相比,线性图更容易阅读和理解。虽然饼图是圆形的,但树形图是线性的,具有视觉和分析优势。

当您需要高级摘要或需要同时查看多个参数时,请选择树形图。树形图标识了所表示的所有类别的矩形或节点之间的趋势和模式,以及单个或独立类别中的节点间关系。

树形图的优点

树形图的最大优势包括:

  • 识别模式并辨别分层数据结构中两个类别或两个元素之间关系的能力。子结构或子元素也会同样呈现。
  • 在渲染数万个数据点时利用空间,并能够根据需要下钻。
  • 一次准确显示多个元素,包括 “零件与整体” 比率。这使得数据的可视化变得容易。
  • 使用大小键和颜色键可视化各种属性。类别和子类别可以用颜色编码以匹配父类别。例如,不同分支机构的电子产品销售将是蓝色,而家具销售可以是黄色。

树形图的局限性

与每种图表类型一样,树形图也存在局限性,也有该使用其他图表类型的时候:

  • 树形图不容纳量级变化的数据集。
  • 表示矩形大小的定量变量的所有值都必须为正值。负值是不可接受的。
  • 由于数据点以矩形的形式显示,没有其他排序选项,因此它们会占用空间。除了空间约束之外,可读性可能会稍微困难一些,与宽大的数据图相比,读取线性的长数据图更容易。因此,打印树形图具有一定的困难。
  • 有些树形图需要花费大量精力才能生成,即使是使用专门的程序。
  • 有时,树形图无法像用于显示分层数据的其他图表(如旭日图或树形图)那样清晰地显示层次级别。

尽管存在所有这些局限性,树形图仍是最具视觉效果的一种工具,它可以表示数据,并提供使用其他图表形式难以捕获的方面的信息,使其成为数据分析中不可或缺的工具。