pandas27 merge(数据库风格合并indicator参数实例)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge(数据库风格合并indicator参数实例)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

# 实例6:indicator添加分类到输出df1 = pd.DataFrame({'no': [10, 11], 'name':['Tom', 'Bob']})
df2 = pd.DataFrame({'no': [11, 12],'weight':[20, 20]})pd.merge(df1, df2, on='no', how='outer', indicator=True)   #添加分类到输出
pd.merge(df1, df2, on='no', how='outer', indicator='分类') #indicator参数为字符串no name  weight      _merge             no name  weight  分类
0  10  Tom     NaN       left_only       0  10  Tom   NaN    left_only
1  11  Bob     20.0      both            1  11  Bob   20.0   both
2  12  NaN     20.0      right_only      2  12  NaN   20.0   right_only============================================================
# 实例7:连接多个DataFrame或Panel对象
# DataFrames传递列表或元组,join() 在它们的索引上将它们连接在一起left = pd.DataFrame({'k': ['K0', 'K1', 'K2'], 'v': [1, 2, 3]})
right = pd.DataFrame({'k': ['K0', 'K0', 'K3'], 'v': [4, 5, 6]})
left = left.set_index('k')
right = right.set_index('k')
right2 = pd.DataFrame({'v': [7, 8, 9]}, index=['K1', 'K1', 'K2'])result = left.join([right, right2])# left       right        right2           v_x  v_y    vv            v            v        K0    1  4.0  NaN
k            k            K1  7        K0    1  5.0  NaN
K0  1        K0  4        K1  8        K1    2  NaN  7.0
K1  2        K0  5        K2  9        K1    2  NaN  8.0
K2  3        K3  6                     K2    3  NaN  9.0============================================================
备注:
# 合并将保留连接键,保留连接键的dtype# 实例1:
left = pd.DataFrame({'key': [1], 'v1': [10]})
right = pd.DataFrame({'key': [1, 2], 'v1': [20, 30]})result1=pd.merge(left, right, how='outer')           #保留连接键key  v1
pd.merge(left, right, how='outer').dtypes
reslult2=pd.merge(left, right, how='outer', on='key')#缺少引入值生成的dtype将是向上兼容
pd.merge(left, right, how='outer', on='key').dtypes# result1                result2key  v1                    key  v1_x  v1_y
0    1  10                0     1  10.0    20
1    1  20                1     2   NaN    30
2    2  30int64 int64              int64  float64 int64# 实例2:from pandas.api.types import CategoricalDtypeX = pd.Series(np.random.choice(['a', 'b'], size=(4,)))
X = X.astype(CategoricalDtype(categories=['a', 'b']))left = pd.DataFrame({'X': X,'Y': np.random.choice(['ss1', 'ss2'], size=(4,))})
right = pd.DataFrame({ 'X': pd.Series(['a', 'b'],dtype=CategoricalDtype(['a', 'b'])), 'Z': [1, 2] })result = pd.merge(left, right, how='outer')left.dtypes
right.dtypes
result.dtypes# left           right            resultX    Y           X  Z             X    Y  Z
0  a  ss2        0  a  1          0  a  ss2  1
1  b  ss1        1  b  2          1  a  ss2  1
2  a  ss2                         2  b  ss1  2
3  b  ss2                         3  b  ss2  2X  category   X  category      X    category
Y  object     Z  int64         Y    objectZ    int64# 注意 类别dtypes必须完全相同,即相同的类别和有序属性。否则结果将强制转换为objectdtype。
# 注意 与categorydtype 合并相比,在相同的dtypes上合并可以非常高效
============================================================

 

这篇关于pandas27 merge(数据库风格合并indicator参数实例)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829048

相关文章

Python解决雅努斯问题实例方案详解

《Python解决雅努斯问题实例方案详解》:本文主要介绍Python解决雅努斯问题实例方案,雅努斯问题是指AI生成的3D对象在不同视角下出现不一致性的问题,即从不同角度看物体时,物体的形状会出现不... 目录一、雅努斯简介二、雅努斯问题三、示例代码四、解决方案五、完整解决方案一、雅努斯简介雅努斯(Janu

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

查看MySQL数据库版本的四种方法

《查看MySQL数据库版本的四种方法》查看MySQL数据库的版本信息可以通过多种方法实现,包括使用命令行工具、SQL查询语句和图形化管理工具等,以下是详细的步骤和示例代码,需要的朋友可以参考下... 目录方法一:使用命令行工具1. 使用 mysql 命令示例:方法二:使用 mysqladmin 命令示例:方

史上最全nginx详细参数配置

《史上最全nginx详细参数配置》Nginx是一个轻量级高性能的HTTP和反向代理服务器,同时也是一个通用代理服务器(TCP/UDP/IMAP/POP3/SMTP),最初由俄罗斯人IgorSyso... 目录基本命令默认配置搭建站点根据文件类型设置过期时间禁止文件缓存防盗链静态文件压缩指定定错误页面跨域问题

使用Python创建一个功能完整的Windows风格计算器程序

《使用Python创建一个功能完整的Windows风格计算器程序》:本文主要介绍如何使用Python和Tkinter创建一个功能完整的Windows风格计算器程序,包括基本运算、高级科学计算(如三... 目录python实现Windows系统计算器程序(含高级功能)1. 使用Tkinter实现基础计算器2.

Python开发文字版随机事件游戏的项目实例

《Python开发文字版随机事件游戏的项目实例》随机事件游戏是一种通过生成不可预测的事件来增强游戏体验的类型,在这篇博文中,我们将使用Python开发一款文字版随机事件游戏,通过这个项目,读者不仅能够... 目录项目概述2.1 游戏概念2.2 游戏特色2.3 目标玩家群体技术选择与环境准备3.1 开发环境3

MySQL数据库约束深入详解

《MySQL数据库约束深入详解》:本文主要介绍MySQL数据库约束,在MySQL数据库中,约束是用来限制进入表中的数据类型的一种技术,通过使用约束,可以确保数据的准确性、完整性和可靠性,需要的朋友... 目录一、数据库约束的概念二、约束类型三、NOT NULL 非空约束四、DEFAULT 默认值约束五、UN

SpringBoot请求参数接收控制指南分享

《SpringBoot请求参数接收控制指南分享》:本文主要介绍SpringBoot请求参数接收控制指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring Boot 请求参数接收控制指南1. 概述2. 有注解时参数接收方式对比3. 无注解时接收参数默认位置

Python使用getopt处理命令行参数示例解析(最佳实践)

《Python使用getopt处理命令行参数示例解析(最佳实践)》getopt模块是Python标准库中一个简单但强大的命令行参数处理工具,它特别适合那些需要快速实现基本命令行参数解析的场景,或者需要... 目录为什么需要处理命令行参数?getopt模块基础实际应用示例与其他参数处理方式的比较常见问http

Linux内核参数配置与验证详细指南

《Linux内核参数配置与验证详细指南》在Linux系统运维和性能优化中,内核参数(sysctl)的配置至关重要,本文主要来聊聊如何配置与验证这些Linux内核参数,希望对大家有一定的帮助... 目录1. 引言2. 内核参数的作用3. 如何设置内核参数3.1 临时设置(重启失效)3.2 永久设置(重启仍生效