五表联筛:从五个表格中筛选出出现过两次及两次以上的人名

2023-11-07 09:36

本文主要是介绍五表联筛:从五个表格中筛选出出现过两次及两次以上的人名,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

五表联筛:从五个表格中筛选出出现过两次及两次以上的人名

需求分析:

1.把五个表格合并起来,合并之前必须确保五个表格的项是一样
2.合并之后查找哪些人出现过两次
3.最后输出结果

代码:

    def delete_from(self):# 读取五份表格文件table1 = pd.read_excel("外籍单列.xlsx",sheet_name='数据源')table2 = pd.read_excel("detele_from.xlsx",sheet_name='外聘教师')table3 = pd.read_excel("detele_from.xlsx",sheet_name='专任教师')table4 = pd.read_excel("detele_from.xlsx",sheet_name='行政人员')table5 = pd.read_excel("detele_from.xlsx",sheet_name='教辅人员')# 合并五份表格为一个大表格merged_table = pd.concat([table1, table2, table3, table4, table5])# 找出出现两次及两次以上的姓名duplicated_names = merged_table['姓名'][merged_table.duplicated(subset='姓名', keep=False)]# 输出这些姓名在哪些表格中for name in duplicated_names:tables_containing_name = [table_name for table_name, table inzip(['数据源', '外聘教师', '专任教师', '行政人员', '教辅人员'], [table1,table2, table3, table4, table5]) if name in table['姓名'].values]print(f"姓名 '{name}' 在表格{','.join(tables_containing_name)} 中出现了两次或更多次。")

重要知识点补充

tables_containing_name = [table_name for table_name, table inzip(['数据源', '外聘教师', '专任教师', '行政人员', '教辅人员'], [table1,table2, table3, table4, table5]) if name in table['姓名'].values]:
在这段代码中,tables_containing_name 是一个列表推导式。它通过迭代5个不同的表格('数据源', '外聘教师', '专任教师', '行政人员', '教辅人员')并检查每个表格中是否存在特定姓名。如果姓名在表格中出现了两次或更多次,就将这个表格的名称添加到列表中。duplicated_names = merged_table['姓名'][merged_table.duplicated(subset='姓名', keep=False)]
首先,merged_table.duplicated(subset='姓名', keep=False) 针对表中的“姓名”列创建了一个布尔索引,表示在此列中是否存在重复的姓名。keep=False 保留所有重复的行,而不仅仅保留第一个或最后一个。
随后,merged_table['姓名'][...] 选取了表中所有重复姓名的数据。这行代码返回了所有在“姓名”列中出现重复的姓名。

这篇关于五表联筛:从五个表格中筛选出出现过两次及两次以上的人名的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/362748

相关文章

Java Web实现类似Excel表格锁定功能实战教程

《JavaWeb实现类似Excel表格锁定功能实战教程》本文将详细介绍通过创建特定div元素并利用CSS布局和JavaScript事件监听来实现类似Excel的锁定行和列效果的方法,感兴趣的朋友跟随... 目录1. 模拟Excel表格锁定功能2. 创建3个div元素实现表格锁定2.1 div元素布局设计2.

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元

使用Python实现网页表格转换为markdown

《使用Python实现网页表格转换为markdown》在日常工作中,我们经常需要从网页上复制表格数据,并将其转换成Markdown格式,本文将使用Python编写一个网页表格转Markdown工具,需... 在日常工作中,我们经常需要从网页上复制表格数据,并将其转换成Markdown格式,以便在文档、邮件或

Python实现pdf电子发票信息提取到excel表格

《Python实现pdf电子发票信息提取到excel表格》这篇文章主要为大家详细介绍了如何使用Python实现pdf电子发票信息提取并保存到excel表格,文中的示例代码讲解详细,感兴趣的小伙伴可以跟... 目录应用场景详细代码步骤总结优化应用场景电子发票信息提取系统主要应用于以下场景:企业财务部门:需

Python实现获取带合并单元格的表格数据

《Python实现获取带合并单元格的表格数据》由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,所以本文我们就来聊聊如何使用Python实现获取带合并单元格的表格数据吧... 由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,现将将封装成类,并通过调用list_exc

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

python获取网页表格的多种方法汇总

《python获取网页表格的多种方法汇总》我们在网页上看到很多的表格,如果要获取里面的数据或者转化成其他格式,就需要将表格获取下来并进行整理,在Python中,获取网页表格的方法有多种,下面就跟随小编... 目录1. 使用Pandas的read_html2. 使用BeautifulSoup和pandas3.

HTML5表格语法格式详解

《HTML5表格语法格式详解》在HTML语法中,表格主要通过table、tr和td3个标签构成,本文通过实例代码讲解HTML5表格语法格式,感兴趣的朋友一起看看吧... 目录一、表格1.表格语法格式2.表格属性 3.例子二、不规则表格1.跨行2.跨列3.例子一、表格在html语法中,表格主要通过< tab

C#实现将Excel表格转换为图片(JPG/ PNG)

《C#实现将Excel表格转换为图片(JPG/PNG)》Excel表格可能会因为不同设备或字体缺失等问题,导致格式错乱或数据显示异常,转换为图片后,能确保数据的排版等保持一致,下面我们看看如何使用C... 目录通过C# 转换Excel工作表到图片通过C# 转换指定单元格区域到图片知识扩展C# 将 Excel