成为数据专家,你只差一个Quick Insights的距离

2024-02-02 14:58

本文主要是介绍成为数据专家,你只差一个Quick Insights的距离,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

成为数据专家,你只差一个Quick Insights的距离
微软亚洲研究院
2015年12月22日
 

身处如今的大数据时代,你真的知道如何处理数据和分析数据吗?或许那些被你忽视的数据背后就暗藏着重要的商业灵感。并非人人都是数据专家,有时候你需要一些专业的软件来帮你处理数据。那么如何能快速、准确地从数据中提取最有价值的部分从而进行有效的分析呢?只会简单统计图肯定是不够的,你还需要Power BI平台最新推出的“快速洞察”(Quick Insights)功能,利用可视化的数据呈现方法以及专家级的数据洞察能力,实现快速、专业的数据分析。

Power BI是微软推出的在线服务,通过powerbi.com能够让你用最直观的方法对数据进行处理,例如查找和呈现数据、在线共享数据、团队协同合作,等等。目前,Power BI平台最新推出的“快速洞察”(Quick Insights)功能够帮助你快速找到数据背后的秘密。想要使用这个新的工具,你只需选择“Quick Insights”,并将它应用在一个已经上传到Power BI的数据集上,系统将会在大约几秒钟内从数据中搜索出你可能感兴趣的信息,如数据之间的相关性、数据内的异常点、时序数据的趋势以及周期性变化规律等等,并进行可视化呈现。当用户面对陌生的数据集不知从哪里入手进行分析时,这些自动搜索出的信息可以为用户提供有效的切入点。对于用户熟悉的数据集,Quick Insights也有可能提供超出预期的分析结果。

更好的数据分析从Quick Insights开始!

BI即商业智能(Business Intelligence, BI)。过去在商业智能领域,用户和数据分析工具之间的交互往往是单向的。具体表现为,用户用命令或者通过图形化界面告诉系统需要进行查询或者生成图表。这样系统只是被动地接受指令,对数据进行处理然后返回结果。相比之下,Quick Insights提供了双向的交互模型。当用户上传数据之后,它的算法能够主动对这些数据进行分析,将分析结果以insights的形式进行组织和排序,并将排名在前的insights提供给用户。不仅如此,Quick Insights会选择适合的数据展示方式来呈现这些insights,并配合文字说明以方便用户理解。

目前,Quick Insights提供了七种类型的insights。借助这些不同种类的insights,用户能够快速地在数据中找到关键信息。以汽车销售数据为例,倘若你上传了一份跨越多年的汽车销售记录数据,或者是一份应用软件的下载记录数据,那么如何在如此庞杂的数据中筛选出最有价值的信息呢?Quick Insights可以从以下方面提供帮助。

主因素分析:在特定维度下,分析找出对于结果影响最大的某个因素。例如汽车销售量的大部分是由一线销售贡献的。

类别优势或劣势分析:鉴别出单一维度下,相对优势或劣势突出的元素类型。例如,在消费者获取购车折扣的联系人中,一线销售和市场经理这两项,相比于其他项有明显的领先优势。

时间序列特殊点:对于时间序列数据,分析出具有异常数据的时间点。例如2012年1月到7月的某几天,消费者对于天气相关的应用软件的下载量异常的高。

时间序列的趋势:分析数据随时间变化趋势。如南美地区的折扣在逐年增加等等。

时间序列的周期性:分析数据的周期性变化趋势。如产品预算随时间呈现明显的周期性增长。

稳定的比例关系分析:找出一系列变量中有稳定比例关系的自变量与因变量。例如在汽车销售的成本核算上,一线销售所占比例基本不变。

数据关联分析:找出多个变量之间的相关性。例如折扣力度和销售量之间的正比例关系。

未来,Quick Insights还将推出时序数据的变化分析以及均匀分布分析等更多的专业分析模型供用户使用。“Power BI的新功能——Quick Insights,让你只通过点击鼠标,就能对数据使用多种分析算法并找到潜在规律,” Power BI的项目主管Patrick Baumgartner解释说。

知其一,也知其二

Quick Insights的诞生来源于两个团队的共同努力,分别是微软亚洲研究院的软件分析组(Software Analytics Group)和总部的Power BI产品团队。微软亚洲研究院软件分析组多年来在数据分析以及可视化等方面的研究和积累为Quick Insights的研发奠定了牢固的基础。

“微软亚洲研究院软件分析组的研究工作可以分为应用领域和基础研究领域,”该组的首席研究员张冬梅博士介绍道。从应用领域来说,软件分析组以软件为研究对象,主要采用数据驱动的方式解决三个方面的问题,一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等等;最后是软件开发效率(Productivity)。为了解决这些应用领域中的问题,我们需要在一些基础研究领域内有相应的技术支撑,包括大规模数据存储与计算、各种数据分析算法、以及信息可视化。

张冬梅博士说:“日常工作中,我们在基础研究领域中的技术会为应用领域的研究目标提供支持;同时,我们在应用领域中遇到的挑战也为我们在基础领域的研究提供问题和灵感。事实上包括‘Quick Insights’在内,我们有很多研究课题与项目设想是基于这种‘应用领域与基础领域’相互作用的工作状态。”

在张冬梅博士和她的团队内部, Quick Insights有一个内部代号,即“IN4”项目。“IN4”的名称取自interactive(互动)、intuitive(直观)、instant(瞬时)和insights(洞察)这四个单词。这四个单词描述了Quick Insights的产品特性,更包含了微软亚洲研究院软件分析组对于这项技术的期待与追求。团队成员们希望“IN4”能让未来的数据分析过程更具互动性、更加直观、更实时快速,最后也更具智能化的洞察性。

成功的基石伴随着合作的共赢

2015年3月在微软技术节(TechFest)上,“IN4”项目首次在公司内发布。就在这场微软技术节上,“IN4”项目和Power BI首次相遇,并一拍即合。随后的几个月中,两个跨国团队密切合作,攻克了许多技术难关,迅速开发出Quick Insights的原型,随后不断完善。Power BI团队十分激动地在邮件中写道:“非常感谢微软亚洲研究院团队的支持。如果没有你们的技术,我们在智能数据分析方面的产品开发将会难以开展。正因为有了你们的帮助,我们才能如此迅速和高效地把这项让人惊喜的技术应用到Power BI中。”

今年12月,Quick Insights正式上线。在短短不到9个月的时间里,我们见证了一项技术研究向产品的转化,时间之快,在众多技术转化的合作案例中也不常见。谈及为何能在这么短的时间内从合作想法的萌芽到产品功能的发布,冬梅博士感慨这离不开两个团队的共同努力:“虽然两个团队距离遥远,甚至都没有太多面对面交流的机会,但两个团队的合作非常默契。有了想法、技术再加之以践行,合作共赢,才最终让我们的灵感‘振翅高飞’!“相信在未来,两个团队将会继续携手并进,在Power BI的平台上为用户带来更多更智能的数据分析服务。

这篇关于成为数据专家,你只差一个Quick Insights的距离的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671082

相关文章

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

MySQL中查询和展示LONGBLOB类型数据的技巧总结

《MySQL中查询和展示LONGBLOB类型数据的技巧总结》在MySQL中LONGBLOB是一种二进制大对象(BLOB)数据类型,用于存储大量的二进制数据,:本文主要介绍MySQL中查询和展示LO... 目录前言1. 查询 LONGBLOB 数据的大小2. 查询并展示 LONGBLOB 数据2.1 转换为十

使用SpringBoot+InfluxDB实现高效数据存储与查询

《使用SpringBoot+InfluxDB实现高效数据存储与查询》InfluxDB是一个开源的时间序列数据库,特别适合处理带有时间戳的监控数据、指标数据等,下面详细介绍如何在SpringBoot项目... 目录1、项目介绍2、 InfluxDB 介绍3、Spring Boot 配置 InfluxDB4、I

Java整合Protocol Buffers实现高效数据序列化实践

《Java整合ProtocolBuffers实现高效数据序列化实践》ProtocolBuffers是Google开发的一种语言中立、平台中立、可扩展的结构化数据序列化机制,类似于XML但更小、更快... 目录一、Protocol Buffers简介1.1 什么是Protocol Buffers1.2 Pro

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

Python中经纬度距离计算的实现方式

《Python中经纬度距离计算的实现方式》文章介绍Python中计算经纬度距离的方法及中国加密坐标系转换工具,主要方法包括geopy(Vincenty/Karney)、Haversine、pyproj... 目录一、基本方法1. 使用geopy库(推荐)2. 手动实现 Haversine 公式3. 使用py

MySQL数据脱敏的实现方法

《MySQL数据脱敏的实现方法》本文主要介绍了MySQL数据脱敏的实现方法,包括字符替换、加密等方法,通过工具类和数据库服务整合,确保敏感信息在查询结果中被掩码处理,感兴趣的可以了解一下... 目录一. 数据脱敏的方法二. 字符替换脱敏1. 创建数据脱敏工具类三. 整合到数据库操作1. 创建服务类进行数据库

MySQL中处理数据的并发一致性的实现示例

《MySQL中处理数据的并发一致性的实现示例》在MySQL中处理数据的并发一致性是确保多个用户或应用程序同时访问和修改数据库时,不会导致数据冲突、数据丢失或数据不一致,MySQL通过事务和锁机制来管理... 目录一、事务(Transactions)1. 事务控制语句二、锁(Locks)1. 锁类型2. 锁粒

Qt中实现多线程导出数据功能的四种方式小结

《Qt中实现多线程导出数据功能的四种方式小结》在以往的项目开发中,在很多地方用到了多线程,本文将记录下在Qt开发中用到的多线程技术实现方法,以导出指定范围的数字到txt文件为例,展示多线程不同的实现方... 目录前言导出文件的示例工具类QThreadQObject的moveToThread方法实现多线程QC