大数据时代,路透社如何玩转“原生数据”做新闻?

2023-12-19 09:10

本文主要是介绍大数据时代,路透社如何玩转“原生数据”做新闻?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是数据新闻

数据新闻简单来讲就是利用真实有效的数据来发现、辅证和讲述新闻故事。举个最简单的例子,人的身体需要各种各样的营养,缺维生素B1可能导致消化不良,缺少维生素C导致抵抗力下降。事实上,我们的身体也可以理解为一个永不休息的数据新闻记者,搜集身体营养数据,向大脑报告发现的问题。当如此这般的“健康报告”不再是关乎一个人,而是一群人的时候,这就成了我们所说的数据新闻了。

如今,可视化数据已经成为数据新闻的饕餮盛宴,例如《卫报》的数据新闻博客,采用图表、地图以及互动效果图等不同形式,既有量化数据也有质性数据,还有两者兼顾的混合数据。可是路透对这一形式的数据新闻并不感冒。不论是数字堆砌出来的路透财经新闻,还是技术搜集获得的平民新闻,路透社追求的永远是数据本身所蕴含的道理,而不是对数据做过多的视觉化修饰。路透社的网络编辑迪恩-赖特表示:“在辩论和真相方面,媒体已经不再是垄断力量了。所以对于数据新闻,我们只是在做一种服务,更多的是做一个收集的渠道,运用我们的技术进行最准确的分析,为大众提供了一个互动、交流的一个平台。”

“我们需要做的就是减少各种数据噪音,以便为客户提供更有价值的数据。”克雷格说,“随着社交媒体增多,人们获取免费数据的途径也越来越多,此时如何挖掘出值得信赖的、客户需要的数据,才是最有价值的。”所以说,路透数据新闻,就是用原生数据,做大数据时代的“过滤器”。

如何运用数字技术为美国选举推力

纽约时间2016年2月23日 路透社报道称路透与SAP(全球领先的企业管理软件解决方案提供商)合作,发布了名为《Reuters White House Run》的ios移动游戏,让选民模拟美国总统候选人和竞选的选举。

大数据

路透社说,用户可以建立自己的候选人,并通过声明对问题的立场进入选举。这可以测试游戏用户的时事知识。 候选人的选择是由路透/益普索调查数据(2012年,路透社设置了美国政治话题的题目,并与益普索公司合作,通过预先筛选,在线调查,电话普查等多种形式开展调查和收集。三年多来,每个月调查人数超过11000人)来确定,让用户的舆论来选择美国的下一任领导人,享受一番真实的体验。在游戏外,用户也可以在应用程序内获取当前路透社政治新闻,并可以进行投票和查看投票结果。执行主编Reginald Chua表示:““白宫运行”使用户与路透社丰富的调查数据结合在一起,把政治新闻与数字技术相结合,是对数据新闻一种新的尝试。通过投票结果,用户可以把自己的看法与民意相比较,以及他们如何应对这些政治问题的立场都会在投票中公布。”

数字技术正在改变政治和选举,使美国选民转变成数字选民。SAP北美总裁珍妮弗·摩根说,“能够直接访问实时数据驱动的信息和公众的情绪不仅能让记者们创建引人入胜的和令人信服的内容,而且还赋予消费者和公民提供独特的见解的机会。”

丹尼尔·曼德尔,路透社媒体的首席执行官说,“选民依靠我们的报道做出明智的决定。通过建立这样一个数据分享平台,让“我们”把最公正,最原始的新闻和信息交付给读者,这正是路透社的期望。”

路透社的数据新闻从来没有富于表现力的信息图来讲述错综复杂的新闻故事,也没有交互的、有趣的视觉化图表来吸引读者。可是路透的数字新闻却永远不缺读者,这又是为什么呢?

20160422021901371.png

  (图为iTunes Preview的部分评论)

什么是数字新闻的核心竞争力

数据新闻既要处理数据,又要不断检验数据的信度与价值,并通过多种手段和渠道完成报道。英国伯明翰城市大学教授布拉德肖依照传统新闻学“倒金字塔”结构理论,提出数据新闻采编流程“双金字塔”结构。倒金字塔部分自上而下包括数据搜集、清洗、情境化、合并等4个环节,以传播为纽带,形成一个自上而下包括视觉化、叙事、社交化、人性化、个性化和应用化等6个环节的正金字塔结构。他强调,数据新闻通过可视化形成新闻故事之后在各种平台发布实现社交化,读者可根据个人的兴趣和需求对新闻作品加以应用

笔者认为,尽管上述说法各异,但数据新闻生产流程都离不开数据搜集、数据处理和数据呈现3个阶段。而这3个阶段最重要的就是搜集和整理。如何把搜集到的数据不断的提炼,把原始数据转换成有意义的信息,才是数据新闻的核心竞争力。正如记者David Mccandless, 《信息之美》一书的作者所言,“数据正变得越来越重要, 这并不是因为数据的量大, 而是我们拥有了工具和能力去分析数据, 找出模式、结构并揭示趋势。为此,路透社也正是这么做的。”

2006年路透社与牛津大学合作一同创办了路透研究社(Reuters Institute),研究所的目的就是通过数据搜集、观察、为长期问题提供理论分析。一直以来,路透研究所的报告,都是业界和学界对新闻研究的重要参考资料,因为该报告既权威又全面。它的研究结果是通过大量的调查,对不同的国家,国内外知名媒体的长期观察,依靠路透强大的数字技术和专业人士分析得到。

基于数据搜集及价值挖掘这一核心逻辑关系的战略选择,路透数据新闻才能有今天。但许多业内人士表示,路透这种只依靠强大数据能力的数字新闻,它的路并不会走多远。将来会是怎样,让我们拭目以待吧。



本文转自d1net(转载)

这篇关于大数据时代,路透社如何玩转“原生数据”做新闻?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/511633

相关文章

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

MySQL中查询和展示LONGBLOB类型数据的技巧总结

《MySQL中查询和展示LONGBLOB类型数据的技巧总结》在MySQL中LONGBLOB是一种二进制大对象(BLOB)数据类型,用于存储大量的二进制数据,:本文主要介绍MySQL中查询和展示LO... 目录前言1. 查询 LONGBLOB 数据的大小2. 查询并展示 LONGBLOB 数据2.1 转换为十

使用SpringBoot+InfluxDB实现高效数据存储与查询

《使用SpringBoot+InfluxDB实现高效数据存储与查询》InfluxDB是一个开源的时间序列数据库,特别适合处理带有时间戳的监控数据、指标数据等,下面详细介绍如何在SpringBoot项目... 目录1、项目介绍2、 InfluxDB 介绍3、Spring Boot 配置 InfluxDB4、I

Java整合Protocol Buffers实现高效数据序列化实践

《Java整合ProtocolBuffers实现高效数据序列化实践》ProtocolBuffers是Google开发的一种语言中立、平台中立、可扩展的结构化数据序列化机制,类似于XML但更小、更快... 目录一、Protocol Buffers简介1.1 什么是Protocol Buffers1.2 Pro

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

MySQL数据脱敏的实现方法

《MySQL数据脱敏的实现方法》本文主要介绍了MySQL数据脱敏的实现方法,包括字符替换、加密等方法,通过工具类和数据库服务整合,确保敏感信息在查询结果中被掩码处理,感兴趣的可以了解一下... 目录一. 数据脱敏的方法二. 字符替换脱敏1. 创建数据脱敏工具类三. 整合到数据库操作1. 创建服务类进行数据库

MySQL中处理数据的并发一致性的实现示例

《MySQL中处理数据的并发一致性的实现示例》在MySQL中处理数据的并发一致性是确保多个用户或应用程序同时访问和修改数据库时,不会导致数据冲突、数据丢失或数据不一致,MySQL通过事务和锁机制来管理... 目录一、事务(Transactions)1. 事务控制语句二、锁(Locks)1. 锁类型2. 锁粒