pandas27 merge(数据库风格合并indicator参数实例)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge(数据库风格合并indicator参数实例)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

# 实例6:indicator添加分类到输出df1 = pd.DataFrame({'no': [10, 11], 'name':['Tom', 'Bob']})
df2 = pd.DataFrame({'no': [11, 12],'weight':[20, 20]})pd.merge(df1, df2, on='no', how='outer', indicator=True)   #添加分类到输出
pd.merge(df1, df2, on='no', how='outer', indicator='分类') #indicator参数为字符串no name  weight      _merge             no name  weight  分类
0  10  Tom     NaN       left_only       0  10  Tom   NaN    left_only
1  11  Bob     20.0      both            1  11  Bob   20.0   both
2  12  NaN     20.0      right_only      2  12  NaN   20.0   right_only============================================================
# 实例7:连接多个DataFrame或Panel对象
# DataFrames传递列表或元组,join() 在它们的索引上将它们连接在一起left = pd.DataFrame({'k': ['K0', 'K1', 'K2'], 'v': [1, 2, 3]})
right = pd.DataFrame({'k': ['K0', 'K0', 'K3'], 'v': [4, 5, 6]})
left = left.set_index('k')
right = right.set_index('k')
right2 = pd.DataFrame({'v': [7, 8, 9]}, index=['K1', 'K1', 'K2'])result = left.join([right, right2])# left       right        right2           v_x  v_y    vv            v            v        K0    1  4.0  NaN
k            k            K1  7        K0    1  5.0  NaN
K0  1        K0  4        K1  8        K1    2  NaN  7.0
K1  2        K0  5        K2  9        K1    2  NaN  8.0
K2  3        K3  6                     K2    3  NaN  9.0============================================================
备注:
# 合并将保留连接键,保留连接键的dtype# 实例1:
left = pd.DataFrame({'key': [1], 'v1': [10]})
right = pd.DataFrame({'key': [1, 2], 'v1': [20, 30]})result1=pd.merge(left, right, how='outer')           #保留连接键key  v1
pd.merge(left, right, how='outer').dtypes
reslult2=pd.merge(left, right, how='outer', on='key')#缺少引入值生成的dtype将是向上兼容
pd.merge(left, right, how='outer', on='key').dtypes# result1                result2key  v1                    key  v1_x  v1_y
0    1  10                0     1  10.0    20
1    1  20                1     2   NaN    30
2    2  30int64 int64              int64  float64 int64# 实例2:from pandas.api.types import CategoricalDtypeX = pd.Series(np.random.choice(['a', 'b'], size=(4,)))
X = X.astype(CategoricalDtype(categories=['a', 'b']))left = pd.DataFrame({'X': X,'Y': np.random.choice(['ss1', 'ss2'], size=(4,))})
right = pd.DataFrame({ 'X': pd.Series(['a', 'b'],dtype=CategoricalDtype(['a', 'b'])), 'Z': [1, 2] })result = pd.merge(left, right, how='outer')left.dtypes
right.dtypes
result.dtypes# left           right            resultX    Y           X  Z             X    Y  Z
0  a  ss2        0  a  1          0  a  ss2  1
1  b  ss1        1  b  2          1  a  ss2  1
2  a  ss2                         2  b  ss1  2
3  b  ss2                         3  b  ss2  2X  category   X  category      X    category
Y  object     Z  int64         Y    objectZ    int64# 注意 类别dtypes必须完全相同,即相同的类别和有序属性。否则结果将强制转换为objectdtype。
# 注意 与categorydtype 合并相比,在相同的dtypes上合并可以非常高效
============================================================

 

这篇关于pandas27 merge(数据库风格合并indicator参数实例)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829048

相关文章

PostgreSQ数据库实现在Windows上异地自动备份指南的详细教程

《PostgreSQ数据库实现在Windows上异地自动备份指南的详细教程》这篇文章主要为大家详细介绍了如何在Windows系统上实现PostgreSQL数据库的异地自动备份,文中的示例代码讲解详细,... 目录前期准备实现步骤步骤一:创建备份脚本步骤二:配置免密登录(可选但推荐)步骤三:设置任务计划程序步

PyTorch核心方法之state_dict()、parameters()参数打印与应用案例

《PyTorch核心方法之state_dict()、parameters()参数打印与应用案例》PyTorch是一个流行的开源深度学习框架,提供了灵活且高效的方式来训练和部署神经网络,这篇文章主要介绍... 目录前言模型案例A. state_dict()方法验证B. parameters()C. 模型结构冻

Java线程池核心参数原理及使用指南

《Java线程池核心参数原理及使用指南》本文详细介绍了Java线程池的基本概念、核心类、核心参数、工作原理、常见类型以及最佳实践,通过理解每个参数的含义和工作原理,可以更好地配置线程池,提高系统性能,... 目录一、线程池概述1.1 什么是线程池1.2 线程池的优势二、线程池核心类三、ThreadPoolE

Nginx服务器部署详细代码实例

《Nginx服务器部署详细代码实例》Nginx是一个高性能的HTTP和反向代理web服务器,同时也提供了IMAP/POP3/SMTP服务,:本文主要介绍Nginx服务器部署的相关资料,文中通过代码... 目录Nginx 服务器SSL/TLS 配置动态脚本反向代理总结Nginx 服务器Nginx是一个‌高性

idea设置快捷键风格方式

《idea设置快捷键风格方式》在IntelliJIDEA中设置快捷键风格,打开IDEA,进入设置页面,选择Keymap,从Keymaps下拉列表中选择或复制想要的快捷键风格,点击Apply和OK即可使... 目录idea设www.chinasem.cn置快捷键风格按照以下步骤进行总结idea设置快捷键pyth

Go异常处理、泛型和文件操作实例代码

《Go异常处理、泛型和文件操作实例代码》Go语言的异常处理机制与传统的面向对象语言(如Java、C#)所使用的try-catch结构有所不同,它采用了自己独特的设计理念和方法,:本文主要介绍Go异... 目录一:异常处理常见的异常处理向上抛中断程序恢复程序二:泛型泛型函数泛型结构体泛型切片泛型 map三:文

JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)

《JavaWeb项目创建、部署、连接数据库保姆级教程(tomcat)》:本文主要介绍如何在IntelliJIDEA2020.1中创建和部署一个JavaWeb项目,包括创建项目、配置Tomcat服务... 目录简介:一、创建项目二、tomcat部署1、将tomcat解压在一个自己找得到路径2、在idea中添加

MySQL MHA集群详解(数据库高可用)

《MySQLMHA集群详解(数据库高可用)》MHA(MasterHighAvailability)是开源MySQL高可用管理工具,用于自动故障检测与转移,支持异步或半同步复制的MySQL主从架构,本... 目录mysql 高可用方案:MHA 详解与实战1. MHA 简介2. MHA 的组件组成(1)MHA

pandas批量拆分与合并Excel文件的实现示例

《pandas批量拆分与合并Excel文件的实现示例》本文介绍了Pandas中基于整数位置的iloc和基于标签的loc方法进行数据索引和切片的操作,并将大Excel文件拆分合并,具有一定的参考价值,感... 目录一、Pandas 进行索引和切编程片的iloc、loc方法二、Pandas批量拆分与合并Exce

MySQL 数据库进阶之SQL 数据操作与子查询操作大全

《MySQL数据库进阶之SQL数据操作与子查询操作大全》本文详细介绍了SQL中的子查询、数据添加(INSERT)、数据修改(UPDATE)和数据删除(DELETE、TRUNCATE、DROP)操作... 目录一、子查询:嵌套在查询中的查询1.1 子查询的基本语法1.2 子查询的实战示例二、数据添加:INSE