使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用

2024-03-28 14:32

本文主要是介绍使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注微信公众号:excelwork

 使用Excel进行数据分析,有些数据总要经过很多步操作实现,而在操作过程中,如果对Excel理解不深,又很难掌控。这种时候,我们唯一要做的,就是用最简单的方式解决它。

    以下介绍会包括:数据替换(使用replace函数及条件判别)、数据切割(loc及iloc函数)

01

数据替换

1.1 简单替换

    比如,把空值替换成0,把字符a替换成字符b等诸如此类操作

   pandas有replace函数,可直接使用。

import numpy as np #导入numpyprint(data.replace(np.nan,'0'))

    可以看到,col_c列中的空值被替换成了0。不过,如果此处先进行处理,再进行输出,并不会得到想要的结果,因为原来的对象data并未发生改变,而是生成了一个新的对象。

    而如果必须这么操作,并实现替换的话,可以用replace中的参数inplace=True来完成。

data.replace(np.nan,'0',inplace=True)print(data)

结果如下:

1.2 条件替换

1.2.1 将a列中小于5的数值,用B列替换

data.loc[data.col_a<5,'col_a']=data.col_b

    可以看到,col_a列中的第1~3行小于5的都被col_b列数据替换。

1.2.2 将a列中小于b列的数值,用c列替换

data.loc[data.col_a<data.col_b,'col_a']=data.col_c

1.2.3 当a列小于b列时,对当前行的部分列进行替换

    若col_a列数值小于col_b列,则col_a和col_c列的数值都要被替换成col_b列数值。

data.loc[data.col_c<data.col_e,['col_a','col_b']]=data.col_e

 

02

数据查找

    我们经常会因为需要拿到想要的数据,而需要多次筛选数据,并保留筛选结果,那如何一次性输出想要的数据集呢?

2.1 标签索引

    通过loc函数行标签选择,逗号左侧是行选择,右侧是列选择。

2.1.1 获取某行某列对应的值

    获取第一列和第一行对应的值

print(data.loc['row_1','col_a'])

结果:3

2.1.2 获取连续行、列对应的值

    获取第1~3行和第1~2列对应的值

print(data.loc['row_1:row_3','col_a:col_b'])

结果:

2.1.3 获取不连续行、列对应的值

    获取第1,3行和第1,3,5列对应的值

print(data.loc[['row_1','row_3'],['col_a','col_c','col_e']])

结果:

2.2 位置索引

    通过iloc函数行位置选择,位置为整数索引。同样,逗号左侧是行选择,右侧是列选择。用法基本同标签索引,只不过比标签较少了输入,只需要输入整数即可。(左闭右开)

2.1.1 获取某行某列对应的值

    获取第二列和第二行对应的值

print(data.loc[1,1])

结果:5

2.1.2 获取连续行或列的值

    获取前三行数据(索引0,1,2)

print(data.iloc[:3])

 

    获取第三行之后的数据,也就是第四行和第五行。(索引3及以上)

print(data.iloc[3:])

 

2.3 多条件查找

    获取a列大于5但是b列小于20的数据(注意条件加括号:因为比较运算符优先级低于按位与&,加上括号后,提高了优先级)。

print(data[(data.col_a>5)&(data.col_b<20)])

 

这篇关于使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/855871

相关文章

使用Python实现矢量路径的压缩、解压与可视化

《使用Python实现矢量路径的压缩、解压与可视化》在图形设计和Web开发中,矢量路径数据的高效存储与传输至关重要,本文将通过一个Python示例,展示如何将复杂的矢量路径命令序列压缩为JSON格式,... 目录引言核心功能概述1. 路径命令解析2. 路径数据压缩3. 路径数据解压4. 可视化代码实现详解1

Pandas透视表(Pivot Table)的具体使用

《Pandas透视表(PivotTable)的具体使用》透视表用于在数据分析和处理过程中进行数据重塑和汇总,本文就来介绍一下Pandas透视表(PivotTable)的具体使用,感兴趣的可以了解一下... 目录前言什么是透视表?使用步骤1. 引入必要的库2. 读取数据3. 创建透视表4. 查看透视表总结前言

Python 交互式可视化的利器Bokeh的使用

《Python交互式可视化的利器Bokeh的使用》Bokeh是一个专注于Web端交互式数据可视化的Python库,本文主要介绍了Python交互式可视化的利器Bokeh的使用,具有一定的参考价值,感... 目录1. Bokeh 简介1.1 为什么选择 Bokeh1.2 安装与环境配置2. Bokeh 基础2

Android使用ImageView.ScaleType实现图片的缩放与裁剪功能

《Android使用ImageView.ScaleType实现图片的缩放与裁剪功能》ImageView是最常用的控件之一,它用于展示各种类型的图片,为了能够根据需求调整图片的显示效果,Android提... 目录什么是 ImageView.ScaleType?FIT_XYFIT_STARTFIT_CENTE

pandas中位数填充空值的实现示例

《pandas中位数填充空值的实现示例》中位数填充是一种简单而有效的方法,用于填充数据集中缺失的值,本文就来介绍一下pandas中位数填充空值的实现,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是中位数填充?为什么选择中位数填充?示例数据结果分析完整代码总结在数据分析和机器学习过程中,处理缺失数

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Pandas使用AdaBoost进行分类的实现

《Pandas使用AdaBoost进行分类的实现》Pandas和AdaBoost分类算法,可以高效地进行数据预处理和分类任务,本文主要介绍了Pandas使用AdaBoost进行分类的实现,具有一定的参... 目录什么是 AdaBoost?使用 AdaBoost 的步骤安装必要的库步骤一:数据准备步骤二:模型

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

使用Pandas进行均值填充的实现

《使用Pandas进行均值填充的实现》缺失数据(NaN值)是一个常见的问题,我们可以通过多种方法来处理缺失数据,其中一种常用的方法是均值填充,本文主要介绍了使用Pandas进行均值填充的实现,感兴趣的... 目录什么是均值填充?为什么选择均值填充?均值填充的步骤实际代码示例总结在数据分析和处理过程中,缺失数

如何使用 Python 读取 Excel 数据

《如何使用Python读取Excel数据》:本文主要介绍使用Python读取Excel数据的详细教程,通过pandas和openpyxl,你可以轻松读取Excel文件,并进行各种数据处理操... 目录使用 python 读取 Excel 数据的详细教程1. 安装必要的依赖2. 读取 Excel 文件3. 读