在可视化图表,你选对了吗?(上)中,我们介绍了可视化中五种基本图形及其特点,这一期我们将从数据关系的角度进一步介绍图表的选用原则,辨析图表之间的细微差异。 前一篇文章中我们提到,图表类型按数据关系可划分为分类比较、时间序列、总体构成、频次分布、关联关系这几种。 可视化专家Andrew Abela对该分类方式做了进一步提炼,他提出将图表展示的数据关系分为四类:比较、分布、构成和联系。 比较比较型图表用于比较值的大小。 使用该类型图表可以轻易的找出数据的最大值和最小值,也可以用于查看当前数值和过去的数值相比是增加还是减少。 常见使用场景:哪种产品的销量最好;今年的销量和去年相比如何; 适用图表:柱形图、条形图、折线图等 分布分布类型图用来查看定量值如何沿着数轴从最低到最高分布。 用户可以通过图表中数据的形态,识别数值范围的特征值,集中趋势,形状和异常值。 常见使用场景:客户的年龄段分布;国内七岁男童的身高分布; 适用图表:直方图、正态分布图、散点图等 构成构成类型图表用于展示部分相较于整体的情况,以及一个整体分成几个部分后各自的占比。该类型图表主要展示相对值,但一些类型也可以展示绝对差异,区别在于显示的是占总量的百分比还是具体数值。 常见使用场景:华东地区占据多少市场份额;公司利润来源分布; 适用图表:饼图、堆积柱形图、堆积面积图、瀑布图等 联系联系类型图表用于展示数据之间的关系,并且可以查找数据间的相关性、异常值和数据集群。 常见使用场景:广告支出和销售额之间的相关性;不同来源流量与网站总流量的关系; 适用图表:散点图、气泡图等 有的图表类型可以反映多种数据关系,有的数据关系也可以用多种图表类型反映,这时候该如何分辨这些图表之间的差异,从而选择更合适的图表呢?我们可以从几个常用问题入手: 1. 柱形图和条形图都可以表示分类比较,那两者在使用上有何差异呢? 当所比较项目的标签文本比较长时,柱形图的横轴下的标签会出现重叠或者倾斜,且占用空间大,影响阅读者的目光移动。 所以在表示分类时,如项目数量较少,使用柱形图或条形图均可,如项目数量较多,则建议使用条形图。 2. 柱形图和折线图都可以表示时间序列的趋势,如何选择? 一般来说,建议使用折线图反映趋势变化。 柱形图强调各数据点值之间的差异,折线图则强调起伏变化的趋势;柱形图更适于表现离散型的时间序列,折线图适合表现连续型的时间序列。 所以当时间序列的数据点较少时,可以使用折线图,而当数据点较多时,则建议使用折线图。 3. 面积图和折线图都可以表示时间序列的趋势,两者之间如何选择? 当只展示一个度量数据的趋势时,两者完全等价,都可以使用,通常使用折线图更多。 但是,当在大型会议室展示数据时,即读图人离图表可能较远的情况,使用面积图能让后排的人看的更清楚。 当比较多个度量数据的趋势时,建议使用折线图。如使用面积图,则存在数据序列之间相互遮挡的情况,除了靠近横轴的那个数据序列外,很难观察出其他数据序列的变化趋势。 4. 是不是应该避免使用饼图,能不用就不用? 从精确比较数据的角度来说,条形图的确更易于比较数据点之间的差异,但每种图表都有它的长处和适用场景,饼图能给我们一种整体和构成的印象,适用于表达“占比”。看到饼图就让想起100%,这个特点是条形图所没有的。 但是要尽量避免并列使用两个及以上的饼图,虽然这种用法很常见。例如如下图,分布展示两个国家在不同年份家庭花销占比,由于读图人很难通过饼图直接、准确的看出各个分类的变化趋势和幅度,需要反复在4个饼图之间比较和判断,如果变化幅度不大,很容易造成误读。所以同样是想表示占比,这种情况使用饼图就不是很有效的图表形式。 所以,没有绝对能用或不能用的图形,关键是结合具体应用场景的展示目标选择适合的图表。 Andrew Abela依据他提出的比较、分布、构成和联系这四种关系类型,整理了一份图表选择指南图示,这里我们引用由刘万祥老师翻译的中文版图表选择建议思维指南图: 有了这份指南在手,在确定我们想展示的数据关系后,只要按图索骥,就能找到相应的图表类型建议,方便又轻松。 在实际应用中,也存在需要展示多种数据关系的情况,那么对应的图表类型也是每种关系对应的基本图形的综合运用。例如多个时间点上构成的比较等。 总结充分了解五种基本图表类型,针对实际应用场景判断需要展示的数据关系,在相对应的图表类型中选择最合适的可视化图表。从而有效传达数据信息,达到事半功倍的效果。 你学会了吗? 想马上可视化你的图表?点击进入“壹看板”
|