pandas27 merge(数据库风格合并validate参数实例)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge(数据库风格合并validate参数实例)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

# 实例5.1:validate检查重复键left = pd.DataFrame({'A' : [11,12], 'B' : [13, 13]})           #B列重复数字
right = pd.DataFrame({'A' : [14,15,16], 'B': [13,13,13]})      #B列重复数字
left1 = pd.DataFrame({'A' : [11,12], 'B' : [13, 14]})          #B列无重复数字
right1 = pd.DataFrame({'A' : [14,15,16], 'B': [17,18,19]})     #B列无重复数字
left2 = pd.DataFrame({'A' : [11,12], 'B' : [13, 14]})          #B列无重复数字
right2 = pd.DataFrame({'A' : [14,15,16], 'B': [13,13,13]})     #B列重复数字result=pd.merge(left, right, on='B', how='outer')              #结果等价下面
result=pd.merge(left, right, on='B', how='outer', validate="m:m")
result1=pd.merge(left1, right1, on='B', how='outer')
result0 = pd.merge(left, right, on='B', how='outer',validate="one_to_one")  #错误:左侧和右侧B列都有重复值不是一对一合并
result2=pd.merge(left2, right2, on='B', how='outer',validate="one_to_many") #左侧B列无重复值,右侧B列有重复值1:m# left           left1            left2A   B            A   B            A   B
0  11  13        0  11  13        0  11  13
1  12  13        1  12  14        1  12  14# right          right1           right2A   B          A   B            A   B
0  14  13        0  14  17        0  14  13
1  15  13        1  15  18        1  15  13
2  16  13        2  16  19        2  16  13# result               result1对比组            result2 1:mA_x   B  A_y            A_x   B   A_y           A_x   B   A_y
0   11  13   14        0  11.0  13   NaN        0   11  13  14.0
1   11  13   15        1  12.0  14   NaN        1   11  13  15.0
2   11  13   16        2   NaN  17  14.0        2   11  13  16.0
3   12  13   14        3   NaN  18  15.0        3   12  14   NaN
4   12  13   15        4   NaN  19  16.0
5   12  13   16#result1在列上有重复值导致返回数据数量是行维度的乘法,易导致内存溢出;
#在合并前应考虑重复值问题# 实例5.2:正确应用 - 指定唯一值
left = pd.DataFrame({'no':[11,12,13],'name' : ['Tom','Jim','Jim'], 'age' : [13, 13,14]})
right = pd.DataFrame({'no' : [11,12,13], 'weight': [30,40,40]})
pd.merge(left, right, on='B', how='outer', validate="1:1")#no为唯一值no name  age  weight
0  11  Tom   13      30
1  12  Jim   13      40
2  13  Jim   14      40

 

这篇关于pandas27 merge(数据库风格合并validate参数实例)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829047

相关文章

PostgreSQ数据库实现在Windows上异地自动备份指南的详细教程

《PostgreSQ数据库实现在Windows上异地自动备份指南的详细教程》这篇文章主要为大家详细介绍了如何在Windows系统上实现PostgreSQL数据库的异地自动备份,文中的示例代码讲解详细,... 目录前期准备实现步骤步骤一:创建备份脚本步骤二:配置免密登录(可选但推荐)步骤三:设置任务计划程序步

PyTorch核心方法之state_dict()、parameters()参数打印与应用案例

《PyTorch核心方法之state_dict()、parameters()参数打印与应用案例》PyTorch是一个流行的开源深度学习框架,提供了灵活且高效的方式来训练和部署神经网络,这篇文章主要介绍... 目录前言模型案例A. state_dict()方法验证B. parameters()C. 模型结构冻

Java线程池核心参数原理及使用指南

《Java线程池核心参数原理及使用指南》本文详细介绍了Java线程池的基本概念、核心类、核心参数、工作原理、常见类型以及最佳实践,通过理解每个参数的含义和工作原理,可以更好地配置线程池,提高系统性能,... 目录一、线程池概述1.1 什么是线程池1.2 线程池的优势二、线程池核心类三、ThreadPoolE

Nginx服务器部署详细代码实例

《Nginx服务器部署详细代码实例》Nginx是一个高性能的HTTP和反向代理web服务器,同时也提供了IMAP/POP3/SMTP服务,:本文主要介绍Nginx服务器部署的相关资料,文中通过代码... 目录Nginx 服务器SSL/TLS 配置动态脚本反向代理总结Nginx 服务器Nginx是一个‌高性

idea设置快捷键风格方式

《idea设置快捷键风格方式》在IntelliJIDEA中设置快捷键风格,打开IDEA,进入设置页面,选择Keymap,从Keymaps下拉列表中选择或复制想要的快捷键风格,点击Apply和OK即可使... 目录idea设www.chinasem.cn置快捷键风格按照以下步骤进行总结idea设置快捷键pyth

Go异常处理、泛型和文件操作实例代码

《Go异常处理、泛型和文件操作实例代码》Go语言的异常处理机制与传统的面向对象语言(如Java、C#)所使用的try-catch结构有所不同,它采用了自己独特的设计理念和方法,:本文主要介绍Go异... 目录一:异常处理常见的异常处理向上抛中断程序恢复程序二:泛型泛型函数泛型结构体泛型切片泛型 map三:文

JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)

《JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)》:本文主要介绍如何在IntelliJIDEA2020.1中创建和部署一个JavaWeb项目,包括创建项目、配置Tomcat服务... 目录简介:一、创建项目二、tomcat部署1、将tomcat解压在一个自己找得到路径2、在idea中添加

MySQL MHA集群详解(数据库高可用)

《MySQLMHA集群详解(数据库高可用)》MHA(MasterHighAvailability)是开源MySQL高可用管理工具,用于自动故障检测与转移,支持异步或半同步复制的MySQL主从架构,本... 目录mysql 高可用方案:MHA 详解与实战1. MHA 简介2. MHA 的组件组成(1)MHA

pandas批量拆分与合并Excel文件的实现示例

《pandas批量拆分与合并Excel文件的实现示例》本文介绍了Pandas中基于整数位置的iloc和基于标签的loc方法进行数据索引和切片的操作,并将大Excel文件拆分合并,具有一定的参考价值,感... 目录一、Pandas 进行索引和切编程片的iloc、loc方法二、Pandas批量拆分与合并Exce

MySQL 数据库进阶之SQL 数据操作与子查询操作大全

《MySQL数据库进阶之SQL数据操作与子查询操作大全》本文详细介绍了SQL中的子查询、数据添加(INSERT)、数据修改(UPDATE)和数据删除(DELETE、TRUNCATE、DROP)操作... 目录一、子查询:嵌套在查询中的查询1.1 子查询的基本语法1.2 子查询的实战示例二、数据添加:INSE