可视化数据分析是位于整个商业智能(Bussiness Intelligent)应用的最顶端,也是最能够体现将数据转换为信息,由信息产生价值的重要一环。
基于数据的可视化组件包括三个要素:视觉编码、坐标系以及标尺。无论是可视化图表还是可视化看板都是由数据和这三种组件所构成。那么,如何透过可视化的方式准确有效的传达数据信息?首先要从视觉编码入手。
本文将着重探讨关于视觉编码的基本概念以及结合不同类型数据所推荐的视觉编码【关于数据分类请参考“想要学会数据分析,先从认识数据开始”】
视觉编码(visual encoding)
视觉编码是数据与可视化结果的映射关系。这种映射关系可促使阅读者迅速获取信息。所以我们可以把可视化看成一组图形符号的组合,这些图形符号中携带了被编码了的信息。而当阅读者从这些符号中读取信息时,我们称之为解码。
研究表明,能够在10毫秒“解码”可以被视为“有效信息传达”,而不具备这一特点的信息形式,需要40毫秒甚至更长时间。
下面举一个例子
以下图形中共有多少个5?
再看下面这张图:
很显然第二张图更加“一目了然”。
第二张图中使用了“颜色饱和度”视觉编码准确快速的传递信息。
人类解码信息靠的是视觉系统。如果说图形符号是编码信息的工具或通道、那么视觉就是解码信息的通道。因此,把视觉编码<——>信息<——>视觉系统的对应称作视觉通道。
假如想用四个通道来编码四个维度的数据,即可以理解为使用在同一个图形中使用四种视觉编码来对应数据的四个列的信息。
举个例子(引用于[2]陈为 沈则潜 陶煜波. 数据可视化[M]. 电子工业出版社, 2013.)):
·图 A表述了三个不同班级的数学平均分,柱状图的高度作为一个视觉通道,编码了数学平均分的值;柱状,形状作为一个视觉通道编码了数学平均分这一属性。
·图 B在 图A 的基础还展示语文平均分数据(即增加了一个数据维度),
图中“点”这个形状通道编码这两个数学平均分和语文平均分这两个属性;点的横坐标编码语文平均分的值;点的纵坐标编码数学平均分的值。
·图C中增加颜色,图C中增加颜色视觉通道来编码班级属性信息。
·图 D中增加“尺寸”视觉通道来编码班级人数信息
视觉编码中常用的视觉通道
1967 年,Jacques Bertin 出版的《Semiology of Graphics》一书提出了视觉编码与信息的对应关系,奠定了可视化编码的理论基础。
如图所示,作者将图形符号分为两种:
位置:数据在空间中的位置,一般指二维坐标
视网膜变量:大小、数值、纹理、颜色、方向和形状
以上7 种视觉编码映射到点、线、面之后,衍生出 21 种编码可用的视觉通道。而一份具有高度可读性的可视化图表需要慎重选择视觉通道的类型和数量。假设有 m 个视觉通道, n 个数据维度,则一共有 (n+1)^m 种编码方案……从中选出一种最佳方案难度可见一斑。
以下总结出几个常用的视觉编码及应用场景
通过以上总结可以看到有些视觉编码擅于传递与数值相关的信息,有些视觉编码擅于传递与分类相关的信息。结合数据类型我们将不同数据类型对应的可视化元素的应用效果做个汇总
欢迎关注“云途数据”公众号(ID:yuntudata),浏览更多大数据解决方案
扫描二维码加小编微信,立即加入更多关于数据的讨论。
|