成为数据专家,你只差一个Quick Insights的距离

2024-02-02 14:58

本文主要是介绍成为数据专家,你只差一个Quick Insights的距离,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

成为数据专家,你只差一个Quick Insights的距离
微软亚洲研究院
2015年12月22日
 

身处如今的大数据时代,你真的知道如何处理数据和分析数据吗?或许那些被你忽视的数据背后就暗藏着重要的商业灵感。并非人人都是数据专家,有时候你需要一些专业的软件来帮你处理数据。那么如何能快速、准确地从数据中提取最有价值的部分从而进行有效的分析呢?只会简单统计图肯定是不够的,你还需要Power BI平台最新推出的“快速洞察”(Quick Insights)功能,利用可视化的数据呈现方法以及专家级的数据洞察能力,实现快速、专业的数据分析。

Power BI是微软推出的在线服务,通过powerbi.com能够让你用最直观的方法对数据进行处理,例如查找和呈现数据、在线共享数据、团队协同合作,等等。目前,Power BI平台最新推出的“快速洞察”(Quick Insights)功能够帮助你快速找到数据背后的秘密。想要使用这个新的工具,你只需选择“Quick Insights”,并将它应用在一个已经上传到Power BI的数据集上,系统将会在大约几秒钟内从数据中搜索出你可能感兴趣的信息,如数据之间的相关性、数据内的异常点、时序数据的趋势以及周期性变化规律等等,并进行可视化呈现。当用户面对陌生的数据集不知从哪里入手进行分析时,这些自动搜索出的信息可以为用户提供有效的切入点。对于用户熟悉的数据集,Quick Insights也有可能提供超出预期的分析结果。

更好的数据分析从Quick Insights开始!

BI即商业智能(Business Intelligence, BI)。过去在商业智能领域,用户和数据分析工具之间的交互往往是单向的。具体表现为,用户用命令或者通过图形化界面告诉系统需要进行查询或者生成图表。这样系统只是被动地接受指令,对数据进行处理然后返回结果。相比之下,Quick Insights提供了双向的交互模型。当用户上传数据之后,它的算法能够主动对这些数据进行分析,将分析结果以insights的形式进行组织和排序,并将排名在前的insights提供给用户。不仅如此,Quick Insights会选择适合的数据展示方式来呈现这些insights,并配合文字说明以方便用户理解。

目前,Quick Insights提供了七种类型的insights。借助这些不同种类的insights,用户能够快速地在数据中找到关键信息。以汽车销售数据为例,倘若你上传了一份跨越多年的汽车销售记录数据,或者是一份应用软件的下载记录数据,那么如何在如此庞杂的数据中筛选出最有价值的信息呢?Quick Insights可以从以下方面提供帮助。

主因素分析:在特定维度下,分析找出对于结果影响最大的某个因素。例如汽车销售量的大部分是由一线销售贡献的。

类别优势或劣势分析:鉴别出单一维度下,相对优势或劣势突出的元素类型。例如,在消费者获取购车折扣的联系人中,一线销售和市场经理这两项,相比于其他项有明显的领先优势。

时间序列特殊点:对于时间序列数据,分析出具有异常数据的时间点。例如2012年1月到7月的某几天,消费者对于天气相关的应用软件的下载量异常的高。

时间序列的趋势:分析数据随时间变化趋势。如南美地区的折扣在逐年增加等等。

时间序列的周期性:分析数据的周期性变化趋势。如产品预算随时间呈现明显的周期性增长。

稳定的比例关系分析:找出一系列变量中有稳定比例关系的自变量与因变量。例如在汽车销售的成本核算上,一线销售所占比例基本不变。

数据关联分析:找出多个变量之间的相关性。例如折扣力度和销售量之间的正比例关系。

未来,Quick Insights还将推出时序数据的变化分析以及均匀分布分析等更多的专业分析模型供用户使用。“Power BI的新功能——Quick Insights,让你只通过点击鼠标,就能对数据使用多种分析算法并找到潜在规律,” Power BI的项目主管Patrick Baumgartner解释说。

知其一,也知其二

Quick Insights的诞生来源于两个团队的共同努力,分别是微软亚洲研究院的软件分析组(Software Analytics Group)和总部的Power BI产品团队。微软亚洲研究院软件分析组多年来在数据分析以及可视化等方面的研究和积累为Quick Insights的研发奠定了牢固的基础。

“微软亚洲研究院软件分析组的研究工作可以分为应用领域和基础研究领域,”该组的首席研究员张冬梅博士介绍道。从应用领域来说,软件分析组以软件为研究对象,主要采用数据驱动的方式解决三个方面的问题,一是软件系统的质量(Quality),如可靠性、性能、以及安全性等;二是用户体验(Experience),如用户界面、用户使用方式、以及用户黏度等等;最后是软件开发效率(Productivity)。为了解决这些应用领域中的问题,我们需要在一些基础研究领域内有相应的技术支撑,包括大规模数据存储与计算、各种数据分析算法、以及信息可视化。

张冬梅博士说:“日常工作中,我们在基础研究领域中的技术会为应用领域的研究目标提供支持;同时,我们在应用领域中遇到的挑战也为我们在基础领域的研究提供问题和灵感。事实上包括‘Quick Insights’在内,我们有很多研究课题与项目设想是基于这种‘应用领域与基础领域’相互作用的工作状态。”

在张冬梅博士和她的团队内部, Quick Insights有一个内部代号,即“IN4”项目。“IN4”的名称取自interactive(互动)、intuitive(直观)、instant(瞬时)和insights(洞察)这四个单词。这四个单词描述了Quick Insights的产品特性,更包含了微软亚洲研究院软件分析组对于这项技术的期待与追求。团队成员们希望“IN4”能让未来的数据分析过程更具互动性、更加直观、更实时快速,最后也更具智能化的洞察性。

成功的基石伴随着合作的共赢

2015年3月在微软技术节(TechFest)上,“IN4”项目首次在公司内发布。就在这场微软技术节上,“IN4”项目和Power BI首次相遇,并一拍即合。随后的几个月中,两个跨国团队密切合作,攻克了许多技术难关,迅速开发出Quick Insights的原型,随后不断完善。Power BI团队十分激动地在邮件中写道:“非常感谢微软亚洲研究院团队的支持。如果没有你们的技术,我们在智能数据分析方面的产品开发将会难以开展。正因为有了你们的帮助,我们才能如此迅速和高效地把这项让人惊喜的技术应用到Power BI中。”

今年12月,Quick Insights正式上线。在短短不到9个月的时间里,我们见证了一项技术研究向产品的转化,时间之快,在众多技术转化的合作案例中也不常见。谈及为何能在这么短的时间内从合作想法的萌芽到产品功能的发布,冬梅博士感慨这离不开两个团队的共同努力:“虽然两个团队距离遥远,甚至都没有太多面对面交流的机会,但两个团队的合作非常默契。有了想法、技术再加之以践行,合作共赢,才最终让我们的灵感‘振翅高飞’!“相信在未来,两个团队将会继续携手并进,在Power BI的平台上为用户带来更多更智能的数据分析服务。

这篇关于成为数据专家,你只差一个Quick Insights的距离的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671082

相关文章

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左

SpringBoot中4种数据水平分片策略

《SpringBoot中4种数据水平分片策略》数据水平分片作为一种水平扩展策略,通过将数据分散到多个物理节点上,有效解决了存储容量和性能瓶颈问题,下面小编就来和大家分享4种数据分片策略吧... 目录一、前言二、哈希分片2.1 原理2.2 SpringBoot实现2.3 优缺点分析2.4 适用场景三、范围分片

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

浅析如何保证MySQL与Redis数据一致性

《浅析如何保证MySQL与Redis数据一致性》在互联网应用中,MySQL作为持久化存储引擎,Redis作为高性能缓存层,两者的组合能有效提升系统性能,下面我们来看看如何保证两者的数据一致性吧... 目录一、数据不一致性的根源1.1 典型不一致场景1.2 关键矛盾点二、一致性保障策略2.1 基础策略:更新数

Oracle 数据库数据操作如何精通 INSERT, UPDATE, DELETE

《Oracle数据库数据操作如何精通INSERT,UPDATE,DELETE》在Oracle数据库中,对表内数据进行增加、修改和删除操作是通过数据操作语言来完成的,下面给大家介绍Oracle数... 目录思维导图一、插入数据 (INSERT)1.1 插入单行数据,指定所有列的值语法:1.2 插入单行数据,指

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名