Excel 数据分析之用Power Query实现数据转换和清洗(功能操作篇)

本文主要是介绍Excel 数据分析之用Power Query实现数据转换和清洗(功能操作篇),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一个案例快速了解Power Query

凭借 Power Query,可以搜索数据源,创建连接,然后按照可满足你需求的方式调整数据(例如删除列、更改数据类型或合并表格)以创建报表。
例:将门店一&门店二两个工作簿的数据整合到一张工作表,并统计出各销售代表每个月的业绩

了解案例.gif-2849.3kB

数据的行列管理及删除重复项

如下例所示:

PQ行列管理.gif-2942.2kB

数据格式的转换及删除错误

如下例所示,更改表格中标注黄色的异常单元格

PQ格式转换及删除错误.gif-3482.4kB

*注意事项
1.大小写:Power Query对英文字母的大小写十分敏感,不能用大写字母去找小写字母,反之一样
2.修整:在所选列的每个单元格中删除前导空格和尾随空格
使用“修整”功能时需注意,尽量不要对整张表格进行一次性修整,由于数据格式不同,容易出现报错(文本格式下要)
3.清除:清除所选列中的非输入字符(例如:回车)
4.添加前缀/后缀:在所选列单元格的前/后增加指定的字符,类似于合并

数据格式的拆分、合并和提取操作演示

PQ数据合并拆分和提取.gif-3431.3kB

转置和反转

转置:行列数据互转

PQ转置.gif-883.2kB

反转行:第一行数据和最后一行数据的互换

PQ反转行.gif-539.7kB

透视和逆透视(二维和一维的转换)

一维指仅有列标题的数据,二维指既有行标题又有列标题的数据
透视:一维转二维
选中的列透视后会以行数据的形式出现

PQ透视.gif-204.7kB

逆透视:二维转一维

PQ逆透视.gif-188.5kB

分组依据和添加列

如下例所示:
求出每个班组的人数,平均年龄,居住外地人数,大学生人数,平均满意度

PQ分组依据和添加列.gif-4127.7kB

“添加列”功能下“自定义列”说明:

image_1cqnatmr5b6d134f12u44qh16a2q.png-42.7kB

日期和时间的整理功能说明

如下图所示:

日期.png-122.5kB

时间.png-100.6kB

持续时间:通过年限来提取

持续时间.png-99.8kB

数学运算功能说明

如下图所示:

计算.png-137.4kB

追加查询

用途:追加多份数据到一份数据中查询,对表格的纵向追加
要求多份数据的列标题名称一致(导出的数据以第一份数据的格式为准)

1.追加同一工作表的两份数据到一份数据
如下例所示:

PQ追加.gif-4571.1kB

若列标题不一致,追加查询后导出的数据会新增一列不同名称的列数据
如下例所示:

PQ追加-列名称不同.gif-1239.4kB


或者修改数据后重新导入两份数据

2.追加一个工作簿中多工作表的数据到一个工作表
如下例所示:

PQ追加-多工作表.gif-12800kB

3.追加一个文件夹内多工作簿的数据到一个工作表
如下例所示:

PQ追加-多工作簿.gif-7464.1kB

*需要运用Power Query的M函数之一
=Excel.Workbook(目标)
作用:将Binary列内容转换为Table列

4.追加一个文件夹内多CSV文件到一个工作表

PQ追加-多CSV.gif-4446.5kB

*也可用以下简便方法追加多工作簿/多CSV文件
如下例所示:

PQ追加-简便方法.gif-3624.6kB

合并查询

通过多张数据共有的字段,将其他源数据的内容添加到一张工作表
是对表格的横向合并,类似于Excel的Vlookup函数
如下例所示:
将sheet1中三组数据合并,计算出各客户不同产品的折扣金额

PQ合并.gif-4267.7kB

合并查询里的联接种类

联接种类-1.png-65.8kB

案例之中国式排名

中国式排名.gif-2883.4kB

案例之分组中国式排名

分组中国式排名.gif-4126kB

案例之生成笛卡尔积表

笛卡尔积表.gif-3245.6kB

案例之多行属性合并

多行属性合并.gif-3491.7kB

这篇关于Excel 数据分析之用Power Query实现数据转换和清洗(功能操作篇)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/756643

相关文章

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

OpenCV实现实时颜色检测的示例

《OpenCV实现实时颜色检测的示例》本文主要介绍了OpenCV实现实时颜色检测的示例,通过HSV色彩空间转换和色调范围判断实现红黄绿蓝颜色检测,包含视频捕捉、区域标记、颜色分析等功能,具有一定的参考... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

基于Python实现一个Windows Tree命令工具

《基于Python实现一个WindowsTree命令工具》今天想要在Windows平台的CMD命令终端窗口中使用像Linux下的tree命令,打印一下目录结构层级树,然而还真有tree命令,但是发现... 目录引言实现代码使用说明可用选项示例用法功能特点添加到环境变量方法一:创建批处理文件并添加到PATH1