独家 | 7个新手数据讲述者犯下的致命错误

2024-04-14 00:18

本文主要是介绍独家 | 7个新手数据讲述者犯下的致命错误,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=png

作者(本文内容来源):Think Like a Data Storyteller workshop

翻译:王威力

校对:白静

本文约1800字建议阅读5分钟。

本文介绍了新手数据讲师所犯的最常见的错误,以及如何改正它们。


640?wx_fmt=png

图1 在墙上贴便签的女人 来自Unsplash网站上的rawpixel


在制作数据故事时,很容易迷失在细节中,并且无法创造出可以激发别人动手操作的数据故事。下面是新手数据讲师所犯的最常见的错误,以及如何改正它们。这些技巧来自“像数据讲述者一样思考”研究会。

 

1. 数据故事不适合听众


不是所有的听众都是相同的,不是所有的听众都有一样的目标。即使您自己审视自己团队内部,也可以考虑一个技术支持专家和一个运营主管如何具有不同的观点。尽管两者都有共同的目标即服务客户,但每个人对于这个目标能够实现的方法和原因具有不同的观点。

 

许多展示数据故事的讲师只创建一套目标过于广泛的幻灯片。在这些故事中,听众可能不理解接下来会发生什么,或者可能无法理解这个问题。所以请确保仔细思考,您的听众可能会遇到什么问题并通过故事的讲述回答这些疑问。

 

2. 数据支持的是另一个不同版本的故事


研究数据的很多时候,研究者允许偏差蔓延。偏差可能源于我们为了得到想要的结果,精心选择特定数据。在“醉酒与癌症之间的混乱关系”一文中,作者说,表明酒精是健康的先前研究受到了偏差选择的影响。该文中的原始数据把健康的饮酒者和因病戒酒者混在一起,作者将其描述为非饮酒者和适度饮酒者相比,实际上这些“非饮酒者”是一些曾经的酗酒者或者因病不能再继续喝酒的人组成的,而这些人通常比健康的适度饮酒者病得更严重。这个结果证明该研究得到了错误的结论。

 

在制作数据故事时,请确保你正在使用合适的统计技术,并让其他人严格地审查您的结论。


3. 数据故事缺乏重点


对于一个数据故事,为有效地促成听众进行操作,信息必须是简单的。新手的数据讲师大多使用多个信息形成一个复杂的故事。听众会因此变得困惑甚至有挫败感。

 

1854年,约翰·斯诺博士用一个简单的信息讲述了一个数据故事:“我们可以通过关闭被污染的布罗德街水泵来阻止霍乱流行。”这不仅是一个简单的信息,也是一个可行的信息。

 

让你的信息简单和重点明确。想一想,“在看了我的数据故事后,我想让听众做些什么?”那么就在那个元素周围加工你的信息。

 

4. 数据故事充满了数据


我们的大脑对故事更敏感而非数据。在“Made to Stick”这本书中,作者Chip and Dan Heath提及了一项研究,研究要求学生向班里的同学展示一分钟有说服力的演讲。平均每个演讲 包含2.5个数据。只有一个演讲包含了一段故事。

 

十分钟之后,研究者要求这些学生拿出一张纸并且写下他们记得的信息。只有5%的同学记住了数据;63%的学生记住了故事。想一想——这个故事是听众能够保留下来的。这是因为故事能激发我们的情感,使我们能够成功地回忆起故事。

 

讲述数据故事时,试着把统计数据限定在最重要的几个方面。你使用的任何统计数据都应该是效果出色的并且有助于叙述。请仔细选择那些具有重要影响的部分。

 

5. 恰当的数据可视化方法被忽视了


许多数据故事陈述者并不精通展示数据的方法。因此,信息在不恰当的表达方式下变得混乱和费解。可以把这件事比作有人在同时说两种语言,但你只会理解你所知道的语言。

 

在制作数据故事前,确保理解如何编码变量。研究数据可视化技术或者与能助你成功完成展示的专家合作。

 

想想已故的汉斯·罗斯林教授在他的TED演讲中讲述的故事,或者他为BBC4创作的这个叫做“The Joy of Stats”的故事。他巧妙地用一张图表将120个数字简化成关于健康和财富的简单信息。

 

6. 缺乏引人入胜的叙述


当数据呈现出令人意外的结果时,听众会很激动。但如果你的数据故事没有展示出任何新结论,那么听众也会失去兴趣,没有动力去尝试。

 

Freakanomics这本书的作者Steve Levitt 和Steve Dubner,在数据中找到了意想不到的答案。在一项研究中,他们发现,低级别的毒贩可能赚不到比在快餐店工作更多的钱。由于大多数人认为毒品交易能带来奢华的生活,因此这个发现令人意外。然而,在每一个播客中,他们都讲述了一个吸引人的故事。

 

如果你的数据甚至无法让你发出一声“哇”的惊叹,或许你的叙述方式是不对的。

 

7. 数据故事中缺乏“人”


人们都对其他人的故事感兴趣。如果你了解过历史上的伟大故事,那么你会知道所有这些故事都是关于某人如何成功地处理逆境。“某人”可能是卢克·天行者或李尔王这样的个体,也可能是一个群体,比如军队如何打败敌人。故事帮助我们了解生活是如何变化的以及它为什么会改变。这些故事可以教会听众如何处理反对意见,如何面对困难的决定,以及如何采取最佳行动。

 

我们的大脑关注其他人的故事。在罗斯林的“Numbers are Boring, People are Interesting”演讲中,他用自己举例来鼓励听众改变对于家庭的看法。他讲述了自己牺牲职业目标,在家陪伴孩子的故事。他的题目泄露了一个讲好故事的秘密——这是关于人的故事,不是关于数字的故事。

 

你的关键点


你可能会多次重复修改你的数据故事,就像在写小说一样。没关系,这是过程的一部分,每次都会有提升。


原文标题:

Seven Deadly Mistakes New Data Storytellers Make

原文链接:

https://towardsdatascience.com/seven-deadly-mistakes-new-data-storytellers-make-aac32d06d702


译者简介

640?wx_fmt=png

王power,求职狗,在香港科技大学学习大数据科技。感觉数据科学很有难度,也很有意思,还在学(tu)习(tou)中。一个人肝不动的文献,来数据派follow大佬一起肝。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。


点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:datapi),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

点击“阅读原文”拥抱组织

这篇关于独家 | 7个新手数据讲述者犯下的致命错误的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901620

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本