浅谈网站绝大多数据管理方法的可视性化及可视

2021-02-22 03:36 admin

可视性化有很多“标准”。有的是具体的标准,有的则是协助你做出挑选的提议。假如是出于数据信息的规定,并且你也了解该如何做,那末很多具体的标准也无须遵循。

可是,确实有1些标准不可该违反。这些标准一般是用于1些特殊类型、基本上只能用特殊方法阅读文章的图表。当这些标准挨打破,阅读文章全过程中,数据信息有将会被误读。这会有点繁杂。

条形图的基准线务必从零刚开始

条形图依靠长度来展现数据信息。短的条块意味着较低的值,长1些的则表明较高的值。条形图的基本原理便是根据较为条块的长度来较为值的尺寸。

当基准线被更改了,视觉效果实际效果也就歪曲了。

举例来讲,请看上图。左侧第1幅条形图较为了两个值:50和100,它有1条而且它有1条以零为起始点的基准线。很好。意味着标值100的条块长度恰好是标值50的两倍长,为100恰好也是50的两倍尺寸。

但当你把基准线变成1个更高的、非零的值时,第1个条形的长度变短了,而此外1个条形的长度却沒有变。此正值为100的条形已不是值为50的条形的两倍长。以此类推,当最终左侧意味着标值50的条形完全消退了,代表着100无尽地超过50了。

条形图的基准线务必从零刚开始。

例:这张条形图是经福克斯新闻准予应用的。

3月31日总体目标的值为7,066,000,比6,000,000高17.8%,但是第2个条形基本上是第1个条形长度的3倍。

有人或许会辩驳说,这张图的关键在于两个值的差而非这两个值自身。就算这般,用条形图来表明自身便是1个不正确的挑选。应用時间编码序列来展现月积累数或许会更好。

不必太过热衷于于饼图

一些人觉得,应当彻底防止饼图。她们或许是对的,或许又并不是。一些人或许会说,应用饼图彻底是1种不能谅解的不正确。对此,我不一样意。无论如何,客观事实状况是人们依然应用饼图,因此大家最少能够争得正确地应用它们。

防止过多激光切割饼图,不然最后对它的阅读文章将无法为继。

那末是多少是“太多”?这是1个分辨力的难题。但是,假如早已很难从图中看出在其中1块扇形是另外一块两倍大,或好几个较小的扇形地区看起来类似大时,在扇形激光切割上面就该收手了。此时能够考虑到把较小的类目归于1个更大的:“别的”。圆环图也是1样。

另外也考虑到1下用别的类型的图表来表明占比。

不必太依靠于饼图。

例:这张饼图来自维基百科,它展现了我国的不一样地区。

左侧这张饼图中早已激光切割了很多块,但周围另分离出来出1张饼图,显示信息了左图中看不清晰的更小我国的状况,以此来出示更多的信息内容。有很多方法能够展现这组数据信息,例如树状图、依照数据信息占比制做的标志,或就用一般的地形图。薄弱的饼图只可用于显示信息仅有几组值的数据信息。

重视一部分所占总体的占比

相较于展现标值,一些图更侧重于主要表现一部分与总体的关联,它们主要表现的数据信息是一部分所占总体占比。例如,堆积式条形图,堆积地区图,树状图,马赛克图,圆环图和饼图。在这些图表格中,每个一部分都表明1个单独的、不重合的占比。

有关这1条,最多见的不正确产生在调研难题容许多选时。例如说:“你上星期应用了哪种交通出行专用工具?能够多选。”这样的话,在人们多选的难题上就会出現占比的重合,不一样选项的百分比之和超过1。以便防止这类状况,你不可以立即把占比做成统计分析图。

例:这张饼图来自福克斯新闻属下组织,它主要表现了3个不属于同1个总体的百分比。

每个值全是1个独立的总体,因而在这1例中,用3个堆积式条块(或一般的条块)会更直观地主要表现每一个值的占比。

展现数据信息

让读者看到数据信息,这是可视性化的关键。假如数据信息的展现不足清楚,就违反了做图表的初衷。这经常是由于1张图里的数据信息太多,因而读者的兴趣爱好就被分散化了。

这是1个經典的“制图过多”的难题,有关的科学研究有许多。可是针对基础的图表,也是有1些简易的处理方法。

最先是能够更改标记的尺寸,这样上图中的小圆点(或是别的的标记)就不容易占有太多室内空间。以便让数据信息直观清楚,关键要提升空白。

调整全透明度,多层级的图案设计就不容易被遮盖。

根据抽样或把对数据信息开展归类的方法,把整体分为几个更小的子群。从中,你能够采用小而多的方法,这样每张表中的信息内容就会少1些。

数据信息开展再统计分析及分门别类。

总而言之,更好地展现数据信息。

例:这张图展现了金州nba勇士队在2008-09赛季的每一个投篮。

这张图最后产生了1个球场的样子,并得出了针对球员们投篮数最多的地址的1个小结果——近框,中间距,和3分球。可是它们之间的差别是很小的,读者其实不能看清真实量级上的差别。

数据信息汇聚法将有助于处理此类难题。

解释编号

根据1定的样子、色调和几何图形图型的融合,将数据信息展现出来。以便让读者能读清晰,图表设计方案者就要把这些图型解码回数据信息值。經典的事例是沒有标明的座标轴。

有时编号不必须解释。例如说,读者或许了解如何读条形图,就无须解释条的长度表明的是值的尺寸了。可是设计方案者确实应当解释数据信息,也便是图表的企业和主题。

因此标出座标轴意味着的含意。要给读者出示案件线索或图例,解释图表。

例:这个不正确标明的图表来自温尼伯太阳报:

大家如果能了解这是统计分析有关甚么的难题就行了。


2015年数据信息可视性化10佳新项目
2015 年,出色的可视性化著作活力勃勃,我能够明确,2020年也会有许多好著作。横跨不一样主题和运用方式的新项目很多出现,但假如让我选1个年度主题的话,那1定是“课堂教学”,无论是根据解释表明,仿真模拟表明還是刻骨铭心剖析的方法。有时会觉得可视性化原创者很胆大,试着让读者们已不用惯有的逻辑思维方法来了解数据信息和统计分析学。我很喜爱这1点。

下列是我选出的 2015 最好新项目。依照国际惯例,排名分不清前后。另外,也是有许多不在这个名单上的著作,它们一样很出色。

大家1起看来看它们。

1.亲爱的数据信息

这是1个值得追踪的趣味新项目,它涉及到的两个话题——可视性化和自身监测——引发了我的留意。

亲爱的数据信息是1个 Stefanie Posavec 和 Giorgia Lupi 做的1年新项目。每一个人会跟踪1周中每日产生的事儿,例如每一个人接是多少次电話,随后把这些数据信息可视性化在1张明信片上。随后她们把这些明信片寄给对方—— Lupi 现居纽约而 Posavec 住在伦敦。

2.你来画:家中收入怎样预测分析孩子的大学入学概率

觉得2020年好像是挑戰读者怎样在1个更高的统计分析学视角上了解数据信息的1年。

纽约时报 Upshot 的 Gregor Aisch, Amanda Cox 和 Kevin Quealy 请读者画1条反应家中收入和上大学孩子数百分比的线。因此你能看到你自身画的线,真正数据信息画出的线和别的人是如何看待这个关联的。

有关Upshot/New York Times 和数据信息假定,参照 this quick puzzle to test your pattern-finding ability (迅速检测你的方式鉴别工作能力)和 3-D chart of the economy’s future(经济发展将来发展趋势三d图)。

3.“黑”出你的科学研究荣誉

纽约时报的 538 也根据她们的可视性化互动交流开展了1些数据信息科学研究课堂教学主题活动。在其中最好是的1节课是教人们怎样根据“盗取 P 值”( p-hacking )来从同1数据信息集中化获得你要想的結果.

这个新项目公布的情况下更是1个刚大学毕业的学员被曝出仿冒数据信息的情况下(hyperlink)。Christie Aschwanden和Ritchie King的关键并不是怀疑1个荒诞的結果是怎样根据了严苛的同行业评审的,相反,她们想说的是,科学研究地做科学研究并解释数据信息才是真实的难点。

4.制做音乐“你如今在哪儿里”

纽约时报的这个精英团队做了1个相关 Justin Bieber 的访谈,不但非常好,还很趣味。

虽然 Bieber 更像1个女配角,由于 Diplo 和 Skrillex 才是详细科学研究怎样制做1首大卖音乐的人,可是这个配在视頻周围的歌曲可视性化著作能够协助你更好自然地理解歌曲家们究竟在说甚么。

5.麻疹怎样在接种了预苗的少年儿童中散播及什么时候不散播

卫报的 Rich Harris,Nadja Popovich 和 Kenton Powell 展现了当1个我国的孩子们不接种麻疹预苗时会产生甚么。

做为爸爸妈妈,我想把这全部目录做成互动式的。

6.设备学习培训的可视性化详细介绍

设备学习培训好像像1个有魔力的定义,好像代表着1个设备人能够不会受到你的教育去做怪异的事。Stephanie Yee 和 Tony Chu 对此用1个可视性化事例开展掌握谜。

这个可视性化事例如卷轴般带着你1步1步掌握设备是怎样“学习培训”的。过渡图表让全部图对接得十分畅顺。现有成效好像是1个系列新项目的第1一部分,可是大家将会得等1段時间才可以看到后边的。

7.第2次全球对决的完毕

Neil Halloran 的这个新项目的1一部分是纪录,另外一一部分是互动式可视性化,2者无缝拼接对接在了1起。

我很诧异地发现并沒有许多人做这个种类的新项目。当我观念到她们在做这样1个新项目时,我十分期待这个能再次下去(阅读文章更多)。

8. 2014 年是有纪录以来最热的1年

最直观的可视性化这类数据信息的方法是单线图。但把线开展溶解后,大家能够获得更多的信息内容。

彭博社的 Tom Randall 和 Blacki Migliozzi 做的这张动态性图展现了月度均值气温。每条线意味着1个详细的年份,伴随着時间由远到近,这条线在几英寸几英寸地上升。

9.互联网效用

间距上1次看到 Jonathan Harris 的这类新项目早已以往1段時间了

他和 Greg Hochmuth 协作了这个新项目,“互联网效用”是对全部互联网技术的评价,可让人根据1种奇特而扣人心弦的方法掌握互联网技术的各个方面,1次花几分钟。

10.常见比喻

“比喻修辞是创作者常见的,在读者脑海中有特殊形象的,1种专用工具和创作习惯性”。Bocoup 数据信息可视性化精英团队做的“常见比喻”新项目科学研究了比喻修辞中常见的词。

假如你想掌握电影里的性別人物角色和角色性情,这个新项目更是你要找的那个。