主页 > 洞察 > 设计沙龙 > 技术调研
  • 什么是数据可视化?数据可视化的一般流程详解....

    adinnet / 2019-04-28 18:05 /技术调研

        有人说,数据可视化不就是画图嘛,看不出来研究的价值在哪。我原来也天真的以为,数据可视化就是把数据从冰冷的数字转换成图形,顶多就是色彩丰富一些,看起来更酷炫,逼格满满。

        其实不然,一个好的可视化,能够带给人们不仅仅是视觉上的冲击,还能够揭示蕴含在数据中的规律和道理。根据上海艾艺13年的数据可视化开发经验,下面就总结一下数据可视化的基础概念。

    一、什么是数据可视化?

         数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息。也就是说可视化的存在是为了帮助我们更好的去传递信息。

    二、通过数据可视化你想表达什么信息?

        表达某个什么结论(平台上的用户中哪个地区的用户较多、数据分析领域最具有权威的人物是谁、2018年的GMV环比去年是增加类还是降低了)。

        阐述某种现象(比如:身体健康程度可能与家庭背景是否具有一定的相关性、应届生收入和毕业院校是否有一定的相关性)。

    三、数据可视化的一般流程:

        首先我们需要对我们现有的数据进行分析,得出自己的结论,明确要表达的信息和主题(即你通过图表要说明什么问题)。

        然后根据这个目的在现有的或你知道的图表信息库中选择能够满足你目标的图表。最后开始动手制作图表,并对图表进行美化、检查,直至最后图表完成。

        这里我们容易犯的一个错误是:先设想要达到的可视化效果,然后在去寻找相应的数据。

        这样经常会造成:“现有的数据不能够做出事先设想的可视化效果,或者是想要制作理想的图表需要获取更多的数据。”这样的误区。

    四、常见的4大数据种类:

        为了更好的进行可视化,我们将数据分为4大类:时序数据、分类数据、多元变量数据和空间数据。

    1. 时序数据

        时序数据也称时间序列数据,是指同一统一指标按时间顺序记录的数据列。如:每个月的新增用户数量、某公司近十年每年的GMV等。诸如此类按时间顺序来记录的指标对应的数据成为时序数据。

    2. 分类数据

        分类数据是指针反映事物类别的数据。如:用户的设备可以分为Iphone用户和andorid用户两种;支付方式可以分为支付宝、微信、现金支付三种等。诸如此类的分类所得到的数据被称为分类数据。

    3. 多变量数据

        数据通常以表格形式的出现,表格中有多个列,每一列代表一个变量,将这份数据就称为多变量数据,多变量常用来研究变量之间的相关性。即用来找出影响某一指标的因素有哪些。

    4. 空间数据

        空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。

        空间数据是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据。

    五、具体的可视化形式/功能的选择:

        明确了我们要借助图表传递什么信息以后我们就可以着手选择合适的图表了,这里我们借助于《数据之美》作者提出的观点,不是列举什么柱状图、折线图等具体的图表,而是介绍一些组成这些图表的零部件。比如说柱状图就是有长度和直角坐标系组成的。我们只需要选择所需的零部件进行组合即可。接下来具体看一下这些零部件。

        基于数据的零部件有:视觉暗示、坐标系、标尺、背景信息以及前面四种形式的任意组合。

    1. 视觉暗示:

        是指通过查看图表就可以与潜意识中的意识进行联系从而得出图表表达的意识。常用的视觉暗示主要有:位置(位置高低)、长度(长短)、角度(大小)、方向(方向上升还是下降)、形状(不同形状代表不同分类)、面积(面积大小)、体积(体积大小)、饱和度(色调的强度,就是颜色的深浅)、色调(不同颜色)。

    2. 坐标系:

        这里的坐标系和我们之前数学中学到的坐标系是相同的,只不过坐标轴的意义可能稍有不同。常见的坐标系种类有:直角坐标系、极坐标系和地理坐标系。

        大家对直角坐标系、极坐标系比较熟悉,这里说一下地理坐标系。

        地理坐标系是使用三维球面来定义地球表面位置,以实现通过经纬度对地球表面点位引用的坐标系。

        但是我们在进行数据可视化的时候一般用投影的方法把其从三维数据转化成二维的平面图形。

    3. 标尺:

        前面说到的三种坐标系只是定义了展示数据的维度和方向,而标尺的作用是用来衡量不同方向和维度上的大小,其实和我们熟悉的刻度挺像。

    4. 背景信息:

        此处的背景和我们在语文中学习到的背景是一个概念,是为了说明数据的相关信息(who、what、when、where、why),使数据更加清晰,便于读者更好的理解。

    5. 组合组件:

        组合组件就是根据目标用途将上面四种信息进行组合,就是我们最后要呈现的图表样式,具体如何组合视你的目标而定。

    本文来源:知乎

        关于数据可视化的相关内容今天就介绍到这里啦,上海艾艺专注数据可视化开发13年,如果您想开发数据可视化系统请找:17702199087(微信同步)。

上一篇:数据可视化图表设计的3大原则,4个可视化工具分享~ 下一篇:互联网服务行业洗牌后,艾艺还剩下什么?