丽江天气预报,原创《经济学人》数据可视化修改:过错的图表,咱们也画了许多,saturday

大数据文摘出品

来历:Medium

编译:张秋玥、夏雅薇

经济学人杂志除了色彩鲜demand明的文章之外,其在数据可视化方面也自成一派。绝妙的颜丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday色调配,风格显着的图表总能让读者过目不忘。

据图表编辑编辑Sarah Leo在一篇英拉博客中介绍到:尽管关于每一张图表,他们都尽量精确地以最能支撑故事表达的方法来可视化数字,但有时分也会犯错。

为了能够做的更好,他们在从差错中不断总结经验,不断的自我改善。为此Sarah Leo还把经济学人的差错总结为3点,并写成一篇博客,供我们参阅,大数据文摘对文章编译如下☟

幼师
郫县豆瓣酱
柜子壁橱门板

深化了解我们的记载后,我军婚晚爱找到了几个有用的比方。我将大航海时代ol针对数据可视化的问题分为三类:

免责声明:大多数“原始”图表是在我们的图表从头规划之前发布的。改善的图表是为了契合我们的新标准而制作的。它们的数据彻底一致。

误导性的图表

以误导的方法出现数据是数据可视化中最严峻的问题,尽管我们从不成心这样做,但它的确时不时发作。我们来看看三个比方。

差错:切断标尺

这图就很左翼分子对不对

此图表显现了政治左翼Facebook页面上帖子的点赞均匀数量。这张图表的要点是显现Corbyn先生与其他帖子之间的差异。

原始图表不只轻视了Corbyn先生的数量,还夸张了其他帖子的数量。在从头规划的版别中,我们完整地展现了Corbyn先生的数据并确保一切其他数据长条依然可见。

另一个奇怪的是色彩的挑选。为了仿照工党的配色计划,原图运用了三种橙色/赤色色调来差异Jeremy Corbyn与其他国会议员和政党。尽管色彩背面的逻辑对许多读者来说或许是清楚明了的,但关于那些不太了解英国政敞开女治的人来说,这或许没什么含义。

差错:通过成心操作坐标轴来伪装存在相相联系

可贵的完美相关?并不是的。

上面的图表附有一个关于狗分量下降的故事。乍一看,好像狗的体重和颈部巨细彻底相关。但这是真的吗?其实并不是很相关哦。

在原始图表中,两个坐标轴的跨度均为三个单位(左面是21到18;右边是45到42)。按百分比最美证件照核算,左面大桥未久编号的份额下降了14%而右边则下降了7%。在从头规划的图表中丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday,我保存了双坐标轴的规划,但调整了它们的规模以反映可比较的份额改变。

考虑到这个图表的休闲主题,这个差错或许看起来并没有那么重要。究竟,图表的信息在两个版别中都是相同的。但我们从中学到的作业很重要:假如两个变量过于严密相关,那么再仔细观察一下坐标轴标准或许是一个好主意。

差错:挑选差错的可视化方法

对脱欧的观念简直和商洽成果相同不稳定

我们在每日新闻运用Espresso中发布了此投票图表。它显现了民众对欧盟公投成果的情绪,并以折线图制作。从数据来看,好像受访者对公投成果的观念适当不稳定——每周都会添加或减少几个百分点。

我们并未运用滑润曲线制作单个民意调查来显现趋势,而是衔接每个民意调查的实践值。这首要是因为我们的内部图表东西没有制作滑润线条的功用。我们直到最近才逐龙眼的成效与效果渐开端了解更杂乱的可视化计算软件(如R)。今日,我们团队一切人都能够制作一个相似上面从头规划的投票图表了。

此图表中需求留意的另一件事是坐标轴怎么起点的方法。原始图表将数据扩展到悉数空间。而在从头规划的版别中,我在坐标轴开端的部位和最小数据点之间留下了更多空间。弗朗西斯加农(Francis Gagnon)为此拟定了一个很好的规矩:我们应丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday当试着在丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday一个不从零开端的折线图下留出至少33%的空白区域。

含糊的图表

这没有误导性图表那么过火,可是一份难以阅览的图表仍是标明可视化作业做得很糟糕。

差错:“发散性思想”过于发散了

…这啥玩意?

在“经济学人”杂志上,我们被鼓舞发明“发散性思想”的丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday新闻报导。可是有时分,我们会以为这有点过分火了。上图显现了美国的产品贸易逆差和制造业工作人数。

该图表十分难以阅览。它有两个首要问题。首要,一个变量(贸易逆差)的值彻底是负数,而另一变量(制造业工作)都是正数。将这些差异结合在一个图表中而不平坦化任一变量十分不合理。有一个清楚明了的处理计划,但这却会导致第二个问题:两个变量陈尔敏不同享一同基线。贸易赤字的基线坐落图表的顶部(通过图表左半边那截红线杰出显现),而右半部分的基线则坐落底部。秀丽中华

从头规划的图表显现其实并没有必悬疑电视剧要组合这两个数据系列。贸易逆差与制造业工作之间的联系依然很显着,而这一图表并没有额定占有多少空间。

差错:不可思议的色彩运用

该图表将政府在养老金福利方面的开销与国家65岁以上人口份额进行了比较,并特别重视了巴西的状况。为了使图表占有较小版面,可视化东西仅标记了部分国家/区域,并以电脾脏蓝色杰出显现。经合安排的大前门均匀值则以淡蓝色杰出显现。

可视化者疏忽了这样一个现实,即不同色彩一般意味着不同分类。乍一看,这个图表好像也是如此——一切电蓝色好像归于与深蓝色不同的组合。但其实压根不是这样的,差异仅仅一个有打上国家标签,一个没有罢了。

在从头规划的版别中,一切国家/区域的圆圈色彩坚持不变。我将没有标签的数据点的透明度调高了。剩余的就靠排版了:巴西是要点国家所以用字体加粗;而经合安排则用斜体字表明。

未能阐明问题的图表

最终一类的差错不太显着。像这样的图表不会误导读者,也不会让人感到困惑。他们仅仅没有证明他们存在的合理性 - 一般是因为可视化不合理,或许因为我们非要在小版面内塞进过多信息。

差错:包含太多细节

“色彩越多越好!”——好的可视化才不会这样

这彩虹真美观!我们在德国预算盈利的专栏中发布了这张图表。它显现了10个欧元区国家的预算余额和活期账户余额。

有这么多色彩,并且其间一些很难被差异。别的,因为对应的值太小了,压根没有方法得到任何丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday图表信息。它只会让你眼前一愣然后赶忙转移视线。并且更重要的是,因为我们没有制作一切欧元区国家,因而堆叠数据没有任何含义。

我回过头看看有没有方法简化这个图表。该专栏说到德国、希腊、荷兰、西班牙以及欧元区总数。在从头规划的图表版别中,我决议只着重这些。为了处理仅堆叠部分国家的问题,我添加了另一个类别(“其他”),其间包含一切其他欧元区国家。(因为欧盟计算局进行了数据修订,从头规划的图表中的活动账户余额kmphb总额低于原始图表。)

差错:很多数据,空间缺乏

我抛弃。

遭到有限版面空间的约束,我们常常企图将一切数据一股脑儿塞进图表中。尽管这能够节约页面上的名贵空间,但它仍是会有负面影响。比方这张2017年三月的图表,它是关于科学界的论文宣布是怎么由男性主导的。一切数据点都相同风趣且与宗旨严密相关。可是,一会儿供给如此多的数据(四个研讨范畴类别以及宣布人的份额)这些信息很难一同被承受。

通过深思熟虑之后,我决议不从头规划法人代表这个图表。假如我要保存一切数据,那么图表就会变得过于杂乱而不简练。在这种状况下,减少一些内容会更好。或许,我们能够展现某种均匀化的衡量标准,例如一切范畴的女人宣布著作的均匀份额。

相关报导:

https://medium.economist.com/mistakes-weve-drawn-a-few-8cdd8a42d丽江天气预报,原创《经济学人》数据可视化修正:差错的图表,我们也画了许多,saturday368

声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。