饼图,为何是数据界最被诟病的图表?

2023-10-29 07:20
文章标签 数据 图表 诟病

本文主要是介绍饼图,为何是数据界最被诟病的图表?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

饼图,为何是数据界最被诟病的图表?

  • 饼图的缺点
    • 缺点一:饼图不能详细展现每部分的细节情况
    • 缺点二:违反视觉感知规律:人们并不能真正理解圆形和角度的大小
    • 缺点三:依赖数据标签说明信息
  • 那在我们得知饼图的优劣势,是否有其他替代饼图的图表呢?
    • 条形图
    • 树状图

饼图(Pie Chart) 的每个切片代表整体的一部分,通常切片大小用于显示百分比,扇区的总和为100%。

但在数据可视化不断发展中,饼图被广为诟病为是最糟糕的展现形式之一。

当然还存在其他更冗杂和麻烦的数据展现形式,但饼图是广为公众熟悉的图表之一。文章接下来将分析饼图在数据可视化中的劣势以及可替代的图表。

饼图的缺点

缺点一:饼图不能详细展现每部分的细节情况

饼图的意义在于展现各部分相对于总体的关系。以下是三张饼图表示五个候选人在A,B,C三个时间段内的获票情况。
在这里插入图片描述
图表应该让读者明确看出每个候选人在不同时间段的得票比重,以及候选人之间的得票角逐。然而上述饼图展现出来的效果并非如此。无法通过上述饼图回答以下几点问题:

  • 五号候选人和三号候选人相比,哪个表现更好?

  • AB时间段内,候选人二号和候选人四号,哪个表现更好?

  • 哪位候选人在选票上领先?

如果图表的意义在于更容易解读信息,如果直接给投票数据表格,是否相比上述饼图更容易让读者获取信息呢?

同样的数据换一种展现方式——条形图——则清晰很多:
在这里插入图片描述
通过上述条形图,读者能直观到每个候选人在每个时间段的具体获票情况。即使饼图的意义就在于展现部分和整体关系,但上述条形图比饼图更加清晰展现出部分相对于整体的情况。

缺点二:违反视觉感知规律:人们并不能真正理解圆形和角度的大小

是否能从以下的饼图找出最大的一组,并按照值大小排序切片?答案可能是否定的。
在这里插入图片描述
如果你仍然不信?那尝试通过以下饼图中辨别出哪个组的值最高,并且尝试弄清楚各组的数值变化过程。或许仍非常困难找出差异。

在这里插入图片描述
如果使用条形图表示完全相同的数据呢?

结果一目了然!正如条形图展现,三个饼图之间存在着巨大的差异
在这里插入图片描述
同理,以下这张饼图展现欧洲议会的党派的划分:
在这里插入图片描述
你是否可以通过比较切片找出每个切片之间的大小差异么?

如果仅针对这一个问题,那么确实可以。从以上饼图可知EPP党的份额大于S&D党。那么该饼图的重点又是什么?图表只有在我们能够比较其中每个元素的时候才有用。

在这里插入图片描述
那么出于比较目的,我们单独脱离整体和文本对比单个切片。

事实证明,人们并不擅长通过比较饼图切片来衡量大小。这就是为什么人们会认为三角形学和弧度比矩形几何更难

以下条形图同样展现党派细分信息:在这里插入图片描述
通常人们只会比较矩形的长度来了解数据的变化。若将左纵坐标轴改成百分比,读者可以得知议会内不同的党派分配。对比可见,条形图可以看到每个党派拥有多少席位,但此信息无法从饼图得知

以下是同样的党派细分信息,但以3D饼图的效果呈现:
在这里插入图片描述
有角度的3D饼图非常能给出迷惑读者的信息!上述3D饼图中红方的S&D党似乎与深青色方的EPP党大致持平。然而这样的扭曲视觉的效果完全可以人为操作

缺点三:依赖数据标签说明信息

在这里插入图片描述
上述饼图旨在展现男性中红绿色盲的比例。但我们并不能由上述饼图直接得知男性色盲的占比约为10%。一般来说,越高级的图表越不需要数据标签。如果必须得依靠数据标签才能表达信息,大概率你则使用了错误的图表。

饼图的优势
在这里插入图片描述
在对比2-3个具备较大差异的数据点时,饼图还是具备优势的。上述饼图表示的是底特律房产拖欠情况。上述图表能清晰告诉读者,100人中有32人是什么情况。

综上:
以下情况饼图不适合使用:

  • 每当可用信息存在相似性时;

  • 每当由多个(三个或者更多)不同数据点时;

  • 如果必须标记每个数值的百分比才能读取信息时。

以下情况会让饼图更糟糕:

  • 3D效果;

  • 保留图例;

  • 扇区各部分总和不足100的百分比;

  • 过多数据点比较;

  • 切割所有切片脱离整体单独对比(ExplodedPie Charts)。

那在我们得知饼图的优劣势,是否有其他替代饼图的图表呢?

条形图

如果有多个值需要展示,可以采用比柱状图更加优雅简洁的“棒棒糖图”(Lolipop Plot)。以下图展现几个代表国家出售武器的数量情况:

在这里插入图片描述

树状图

如果你想描述整体的组成情况,那么树状图是个不错的选择

在这里插入图片描述
简而言之,在对比多个不同数据点或者必须依赖数据标记才能得知数据间相似性时,应该尽量避免使用饼图。饼图大多时不能达到理想的数据可视化的效果,而且视觉效果太容易被搞砸。因此,在使用饼图时,请多考虑是否能有可替代的图表呈现出更理想的效果

这篇关于饼图,为何是数据界最被诟病的图表?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/299127

相关文章

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左

SpringBoot中4种数据水平分片策略

《SpringBoot中4种数据水平分片策略》数据水平分片作为一种水平扩展策略,通过将数据分散到多个物理节点上,有效解决了存储容量和性能瓶颈问题,下面小编就来和大家分享4种数据分片策略吧... 目录一、前言二、哈希分片2.1 原理2.2 SpringBoot实现2.3 优缺点分析2.4 适用场景三、范围分片

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

浅析如何保证MySQL与Redis数据一致性

《浅析如何保证MySQL与Redis数据一致性》在互联网应用中,MySQL作为持久化存储引擎,Redis作为高性能缓存层,两者的组合能有效提升系统性能,下面我们来看看如何保证两者的数据一致性吧... 目录一、数据不一致性的根源1.1 典型不一致场景1.2 关键矛盾点二、一致性保障策略2.1 基础策略:更新数