pandas27 merge(数据库风格合并validate参数实例)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge(数据库风格合并validate参数实例)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

# 实例5.1:validate检查重复键left = pd.DataFrame({'A' : [11,12], 'B' : [13, 13]})           #B列重复数字
right = pd.DataFrame({'A' : [14,15,16], 'B': [13,13,13]})      #B列重复数字
left1 = pd.DataFrame({'A' : [11,12], 'B' : [13, 14]})          #B列无重复数字
right1 = pd.DataFrame({'A' : [14,15,16], 'B': [17,18,19]})     #B列无重复数字
left2 = pd.DataFrame({'A' : [11,12], 'B' : [13, 14]})          #B列无重复数字
right2 = pd.DataFrame({'A' : [14,15,16], 'B': [13,13,13]})     #B列重复数字result=pd.merge(left, right, on='B', how='outer')              #结果等价下面
result=pd.merge(left, right, on='B', how='outer', validate="m:m")
result1=pd.merge(left1, right1, on='B', how='outer')
result0 = pd.merge(left, right, on='B', how='outer',validate="one_to_one")  #错误:左侧和右侧B列都有重复值不是一对一合并
result2=pd.merge(left2, right2, on='B', how='outer',validate="one_to_many") #左侧B列无重复值,右侧B列有重复值1:m# left           left1            left2A   B            A   B            A   B
0  11  13        0  11  13        0  11  13
1  12  13        1  12  14        1  12  14# right          right1           right2A   B          A   B            A   B
0  14  13        0  14  17        0  14  13
1  15  13        1  15  18        1  15  13
2  16  13        2  16  19        2  16  13# result               result1对比组            result2 1:mA_x   B  A_y            A_x   B   A_y           A_x   B   A_y
0   11  13   14        0  11.0  13   NaN        0   11  13  14.0
1   11  13   15        1  12.0  14   NaN        1   11  13  15.0
2   11  13   16        2   NaN  17  14.0        2   11  13  16.0
3   12  13   14        3   NaN  18  15.0        3   12  14   NaN
4   12  13   15        4   NaN  19  16.0
5   12  13   16#result1在列上有重复值导致返回数据数量是行维度的乘法,易导致内存溢出;
#在合并前应考虑重复值问题# 实例5.2:正确应用 - 指定唯一值
left = pd.DataFrame({'no':[11,12,13],'name' : ['Tom','Jim','Jim'], 'age' : [13, 13,14]})
right = pd.DataFrame({'no' : [11,12,13], 'weight': [30,40,40]})
pd.merge(left, right, on='B', how='outer', validate="1:1")#no为唯一值no name  age  weight
0  11  Tom   13      30
1  12  Jim   13      40
2  13  Jim   14      40

 

这篇关于pandas27 merge(数据库风格合并validate参数实例)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829047

相关文章

Mysql数据库中数据的操作CRUD详解

《Mysql数据库中数据的操作CRUD详解》:本文主要介绍Mysql数据库中数据的操作(CRUD),详细描述对Mysql数据库中数据的操作(CRUD),包括插入、修改、删除数据,还有查询数据,包括... 目录一、插入数据(insert)1.插入数据的语法2.注意事项二、修改数据(update)1.语法2.有

Python解决雅努斯问题实例方案详解

《Python解决雅努斯问题实例方案详解》:本文主要介绍Python解决雅努斯问题实例方案,雅努斯问题是指AI生成的3D对象在不同视角下出现不一致性的问题,即从不同角度看物体时,物体的形状会出现不... 目录一、雅努斯简介二、雅努斯问题三、示例代码四、解决方案五、完整解决方案一、雅努斯简介雅努斯(Janu

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

查看MySQL数据库版本的四种方法

《查看MySQL数据库版本的四种方法》查看MySQL数据库的版本信息可以通过多种方法实现,包括使用命令行工具、SQL查询语句和图形化管理工具等,以下是详细的步骤和示例代码,需要的朋友可以参考下... 目录方法一:使用命令行工具1. 使用 mysql 命令示例:方法二:使用 mysqladmin 命令示例:方

史上最全nginx详细参数配置

《史上最全nginx详细参数配置》Nginx是一个轻量级高性能的HTTP和反向代理服务器,同时也是一个通用代理服务器(TCP/UDP/IMAP/POP3/SMTP),最初由俄罗斯人IgorSyso... 目录基本命令默认配置搭建站点根据文件类型设置过期时间禁止文件缓存防盗链静态文件压缩指定定错误页面跨域问题

使用Python创建一个功能完整的Windows风格计算器程序

《使用Python创建一个功能完整的Windows风格计算器程序》:本文主要介绍如何使用Python和Tkinter创建一个功能完整的Windows风格计算器程序,包括基本运算、高级科学计算(如三... 目录python实现Windows系统计算器程序(含高级功能)1. 使用Tkinter实现基础计算器2.

Python开发文字版随机事件游戏的项目实例

《Python开发文字版随机事件游戏的项目实例》随机事件游戏是一种通过生成不可预测的事件来增强游戏体验的类型,在这篇博文中,我们将使用Python开发一款文字版随机事件游戏,通过这个项目,读者不仅能够... 目录项目概述2.1 游戏概念2.2 游戏特色2.3 目标玩家群体技术选择与环境准备3.1 开发环境3

MySQL数据库约束深入详解

《MySQL数据库约束深入详解》:本文主要介绍MySQL数据库约束,在MySQL数据库中,约束是用来限制进入表中的数据类型的一种技术,通过使用约束,可以确保数据的准确性、完整性和可靠性,需要的朋友... 目录一、数据库约束的概念二、约束类型三、NOT NULL 非空约束四、DEFAULT 默认值约束五、UN

SpringBoot请求参数接收控制指南分享

《SpringBoot请求参数接收控制指南分享》:本文主要介绍SpringBoot请求参数接收控制指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring Boot 请求参数接收控制指南1. 概述2. 有注解时参数接收方式对比3. 无注解时接收参数默认位置

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http