主页 > 洞察 > 设计沙龙 > 洞察
  • 数据可视化基础研究

    adinnet / 2022-04-02 17:58 /洞察

    数据可视化的目的是有两个:一个是更好地分享和传达数据信息,二个是通过设计之美有效地缩短信息的传达。这是可视化的最根本的目的,可视化的定义在不同人眼中是不一样的。

    数据是可视化的基础,它不仅仅是数字,要想把数据可视化,就必须知道它表达的是什么。根据Ben Shneiderman的分类,信息可视化的数据分为以下几类:

    · 一维数据:X轴一个维度如果1、2、3、4 ···

    · 二维数据:X,Y两个二维度(1、2),(3、4),(5、6),(7、8)···

    · 三维数据:X,Y,Z三个维度(1、2、3),(4、5、6),(7、8、9) ···

    · 多维数据:X,Y,Z,···多个维度(1、2、3、4、···),(5、6、7、8、···)

    · 时态数据:具有数据属性的数据集合。

    · 层次数据:具有等级或层次关系数据集合。

    数据种类划分是十分多的,但是这些数据都描述了现实的世界中的一部分,是现实世界的一个快照。除了类型,数据的数量级也影响这数据的表达结果。

    2(1).jpg 

    小数据量(小于100)展示一下静态结果,中数据量(1K~100K)呈现数据反映的事实,大数据量(大于1M+)用于研究分析,推测结果。

    我们来看一个数据:【2017年1月28号,成都PM2.5值245】,从这个数据里能看出什么,可能只是会觉得当天成都空气质量不好,我们可能会联想到这个样一个画面。

     

    好像就不能得出什么了。其实从单个小数据上来看,我们很难得到什么有价值的信息。

    只能匹配出数据代表的当前的静态状态结果。所以要想发挥出数据可视化的作用,首先我们需要大量真实的数据,知道数据的来龙去脉,把它作为一个整体来理解,关注全貌对原始数据了解得越多,打造的基础就越坚实,也就越可能制作出令人信服的数据图表。

    OK,我们继续丰富我们的原始数据,在中国环境监测总站(http://www.cnemc.cn/)的网站获取到成都2017年整个1月份的PM2.5的数据。

    中国环境监测总站作为空气质量公开的数据来源,它提供了获取数据的API接口。通过API接口我们可以获取到原始数据。

    3.gif 

    原始数据一般包含的信息都比较多,什么PM2.5,、空气质量指数、PM10、一氧化碳、二氧化碳、臭氧、二氧化硫等等。我们只需要PM2.5的,所以清理数据,把其他不必要的内容去掉。然后导入到Excel表中,可以得到我们最终需要的数据。

    有了【数据】下一步就可以开始做数据的【可视化】。

    可视化

    通俗地说,可视化设计的目的是“让数据说话”,用图形去讲述数据的故事。可视化是一种表达数据的方式,是现实世界的抽象表达。它像文字一样,为我们讲述各种各样的故事。作为一种媒介,可视化已经发展成为一种很好的故事讲述方式。

    我们把成都PM2.5的数据,按照日期和当天的PM2.5指数做出最简单图形来,我们可以得到下面这类的图表来。

    这类的图用Excel很简单就能得到。我们可去修改下柱状图的配色,但它依然只是一个简单的图表,而不是好的可视化作品。

    那什么是好的可视化作品呢?

    好的可视化设计需要具备统计和设计方面的知识。没有前者,可视化只是插图和美术练习;没有后者,可视化就只是研究分析结果。统计和设计的知识都只能帮助你完成数据图形的一部分。

    我们需要去讲述数据的故事。那PM2.5代表的是什么,是当天天气的情况,所以我们可以用天气的维度去讲述这个故事。

    我们把成都2017年1月份的天气照片的到,天气好的时候天是蓝色,PM2.5超标的时候是灰色。把它图形化我们可以得到这样一个展示,可以看出对于成都来说一个月中天气好的时间是十分少的。

    好的可视化设计能让你有一见钟情的感觉,你知道眼前的东西就是你想看到的。既可以是艺术的,同时又是真实的。而不是直接把数据转换成图表,找到数据和它所代表事物之间的关系按照“数字化叙事”去做设计,这是全面分析数据的关键,同样还是深层次理解数据的关键。

    我们在网上可以看到大量的优秀的数据可视化图,这些优秀的作品都会以这种“数字化叙事”的方式,告诉用户数据的意义。

    这是哈佛做的一个数据可视化项目,将全球价15万亿美元的大宗交易表现在这里。地图上的每个点都代表 1 亿美元的进出口商品,十分的形象和震撼。

    当然好的数据可视化图都是不断迭代优化出来的,判断是不是一个好的数据可视化可以按照以下的步骤去考虑。【你有什么数据】 -> 【关于数据你想知道什么】 -> 【数据可视化的表现方式】 -> 【你看到了什么?有意义吗?】。每一个问题的答案都取决于前一个答案,不断的去问自己,每个环节有没有问题,这样才能做出最好的设计。

    我们一直在讲数据可视化的目的是有两个:一个是更好地分享和传达数据信息,二个是通过设计之美有效地缩短信息的传达。这是可视化的最根本的目的,可视化的定义在不同人眼中是不一样的。作为一个整体,可视化的广度每天都在变化,但是这是一个新的领域,我们可以用一种全新的方式去认识世界的过程,数据可视化,改变对数据的呈现和思考方式。

    4.jpg

    参考资料

    · 《图解力》 – 木村博之

    · 《数据之美》 – 邱南森

    · 《可视化沟通》 – Randy Krun

    · 《信息设计》 – Dopress Books

    · Designing Data Visualizations with Noah Iliinsky – TED演讲

    · 信息可视化研究综述 – 河北科技大学学报

     


上一篇:引爆超千亿市场,下一代智慧园区如何共创共赢? 下一篇:物联网应用中的数字孪生——实现物联网数字孪生的全面的解决方案