使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用

2024-03-28 14:32

本文主要是介绍使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注微信公众号:excelwork

 使用Excel进行数据分析,有些数据总要经过很多步操作实现,而在操作过程中,如果对Excel理解不深,又很难掌控。这种时候,我们唯一要做的,就是用最简单的方式解决它。

    以下介绍会包括:数据替换(使用replace函数及条件判别)、数据切割(loc及iloc函数)

01

数据替换

1.1 简单替换

    比如,把空值替换成0,把字符a替换成字符b等诸如此类操作

   pandas有replace函数,可直接使用。

import numpy as np #导入numpyprint(data.replace(np.nan,'0'))

    可以看到,col_c列中的空值被替换成了0。不过,如果此处先进行处理,再进行输出,并不会得到想要的结果,因为原来的对象data并未发生改变,而是生成了一个新的对象。

    而如果必须这么操作,并实现替换的话,可以用replace中的参数inplace=True来完成。

data.replace(np.nan,'0',inplace=True)print(data)

结果如下:

1.2 条件替换

1.2.1 将a列中小于5的数值,用B列替换

data.loc[data.col_a<5,'col_a']=data.col_b

    可以看到,col_a列中的第1~3行小于5的都被col_b列数据替换。

1.2.2 将a列中小于b列的数值,用c列替换

data.loc[data.col_a<data.col_b,'col_a']=data.col_c

1.2.3 当a列小于b列时,对当前行的部分列进行替换

    若col_a列数值小于col_b列,则col_a和col_c列的数值都要被替换成col_b列数值。

data.loc[data.col_c<data.col_e,['col_a','col_b']]=data.col_e

 

02

数据查找

    我们经常会因为需要拿到想要的数据,而需要多次筛选数据,并保留筛选结果,那如何一次性输出想要的数据集呢?

2.1 标签索引

    通过loc函数行标签选择,逗号左侧是行选择,右侧是列选择。

2.1.1 获取某行某列对应的值

    获取第一列和第一行对应的值

print(data.loc['row_1','col_a'])

结果:3

2.1.2 获取连续行、列对应的值

    获取第1~3行和第1~2列对应的值

print(data.loc['row_1:row_3','col_a:col_b'])

结果:

2.1.3 获取不连续行、列对应的值

    获取第1,3行和第1,3,5列对应的值

print(data.loc[['row_1','row_3'],['col_a','col_c','col_e']])

结果:

2.2 位置索引

    通过iloc函数行位置选择,位置为整数索引。同样,逗号左侧是行选择,右侧是列选择。用法基本同标签索引,只不过比标签较少了输入,只需要输入整数即可。(左闭右开)

2.1.1 获取某行某列对应的值

    获取第二列和第二行对应的值

print(data.loc[1,1])

结果:5

2.1.2 获取连续行或列的值

    获取前三行数据(索引0,1,2)

print(data.iloc[:3])

 

    获取第三行之后的数据,也就是第四行和第五行。(索引3及以上)

print(data.iloc[3:])

 

2.3 多条件查找

    获取a列大于5但是b列小于20的数据(注意条件加括号:因为比较运算符优先级低于按位与&,加上括号后,提高了优先级)。

print(data[(data.col_a>5)&(data.col_b<20)])

 

这篇关于使用pandas替代Excel中的繁琐操作-条件判别和loc函数使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/855871

相关文章

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

java使用protobuf-maven-plugin的插件编译proto文件详解

《java使用protobuf-maven-plugin的插件编译proto文件详解》:本文主要介绍java使用protobuf-maven-plugin的插件编译proto文件,具有很好的参考价... 目录protobuf文件作为数据传输和存储的协议主要介绍在Java使用maven编译proto文件的插件

SpringBoot线程池配置使用示例详解

《SpringBoot线程池配置使用示例详解》SpringBoot集成@Async注解,支持线程池参数配置(核心数、队列容量、拒绝策略等)及生命周期管理,结合监控与任务装饰器,提升异步处理效率与系统... 目录一、核心特性二、添加依赖三、参数详解四、配置线程池五、应用实践代码说明拒绝策略(Rejected

C++ Log4cpp跨平台日志库的使用小结

《C++Log4cpp跨平台日志库的使用小结》Log4cpp是c++类库,本文详细介绍了C++日志库log4cpp的使用方法,及设置日志输出格式和优先级,具有一定的参考价值,感兴趣的可以了解一下... 目录一、介绍1. log4cpp的日志方式2.设置日志输出的格式3. 设置日志的输出优先级二、Window

Ubuntu如何分配​​未使用的空间

《Ubuntu如何分配​​未使用的空间》Ubuntu磁盘空间不足,实际未分配空间8.2G因LVM卷组名称格式差异(双破折号误写)导致无法扩展,确认正确卷组名后,使用lvextend和resize2fs... 目录1:原因2:操作3:报错5:解决问题:确认卷组名称​6:再次操作7:验证扩展是否成功8:问题已解

Qt使用QSqlDatabase连接MySQL实现增删改查功能

《Qt使用QSqlDatabase连接MySQL实现增删改查功能》这篇文章主要为大家详细介绍了Qt如何使用QSqlDatabase连接MySQL实现增删改查功能,文中的示例代码讲解详细,感兴趣的小伙伴... 目录一、创建数据表二、连接mysql数据库三、封装成一个完整的轻量级 ORM 风格类3.1 表结构

使用Docker构建Python Flask程序的详细教程

《使用Docker构建PythonFlask程序的详细教程》在当今的软件开发领域,容器化技术正变得越来越流行,而Docker无疑是其中的佼佼者,本文我们就来聊聊如何使用Docker构建一个简单的Py... 目录引言一、准备工作二、创建 Flask 应用程序三、创建 dockerfile四、构建 Docker

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Java操作Word文档的全面指南

《Java操作Word文档的全面指南》在Java开发中,操作Word文档是常见的业务需求,广泛应用于合同生成、报表输出、通知发布、法律文书生成、病历模板填写等场景,本文将全面介绍Java操作Word文... 目录简介段落页头与页脚页码表格图片批注文本框目录图表简介Word编程最重要的类是org.apach

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核