pandas27 merge(数据库风格合并indicator参数实例)( tcy)

2024-03-20 09:38

本文主要是介绍pandas27 merge(数据库风格合并indicator参数实例)( tcy),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

# 实例6:indicator添加分类到输出df1 = pd.DataFrame({'no': [10, 11], 'name':['Tom', 'Bob']})
df2 = pd.DataFrame({'no': [11, 12],'weight':[20, 20]})pd.merge(df1, df2, on='no', how='outer', indicator=True)   #添加分类到输出
pd.merge(df1, df2, on='no', how='outer', indicator='分类') #indicator参数为字符串no name  weight      _merge             no name  weight  分类
0  10  Tom     NaN       left_only       0  10  Tom   NaN    left_only
1  11  Bob     20.0      both            1  11  Bob   20.0   both
2  12  NaN     20.0      right_only      2  12  NaN   20.0   right_only============================================================
# 实例7:连接多个DataFrame或Panel对象
# DataFrames传递列表或元组,join() 在它们的索引上将它们连接在一起left = pd.DataFrame({'k': ['K0', 'K1', 'K2'], 'v': [1, 2, 3]})
right = pd.DataFrame({'k': ['K0', 'K0', 'K3'], 'v': [4, 5, 6]})
left = left.set_index('k')
right = right.set_index('k')
right2 = pd.DataFrame({'v': [7, 8, 9]}, index=['K1', 'K1', 'K2'])result = left.join([right, right2])# left       right        right2           v_x  v_y    vv            v            v        K0    1  4.0  NaN
k            k            K1  7        K0    1  5.0  NaN
K0  1        K0  4        K1  8        K1    2  NaN  7.0
K1  2        K0  5        K2  9        K1    2  NaN  8.0
K2  3        K3  6                     K2    3  NaN  9.0============================================================
备注:
# 合并将保留连接键,保留连接键的dtype# 实例1:
left = pd.DataFrame({'key': [1], 'v1': [10]})
right = pd.DataFrame({'key': [1, 2], 'v1': [20, 30]})result1=pd.merge(left, right, how='outer')           #保留连接键key  v1
pd.merge(left, right, how='outer').dtypes
reslult2=pd.merge(left, right, how='outer', on='key')#缺少引入值生成的dtype将是向上兼容
pd.merge(left, right, how='outer', on='key').dtypes# result1                result2key  v1                    key  v1_x  v1_y
0    1  10                0     1  10.0    20
1    1  20                1     2   NaN    30
2    2  30int64 int64              int64  float64 int64# 实例2:from pandas.api.types import CategoricalDtypeX = pd.Series(np.random.choice(['a', 'b'], size=(4,)))
X = X.astype(CategoricalDtype(categories=['a', 'b']))left = pd.DataFrame({'X': X,'Y': np.random.choice(['ss1', 'ss2'], size=(4,))})
right = pd.DataFrame({ 'X': pd.Series(['a', 'b'],dtype=CategoricalDtype(['a', 'b'])), 'Z': [1, 2] })result = pd.merge(left, right, how='outer')left.dtypes
right.dtypes
result.dtypes# left           right            resultX    Y           X  Z             X    Y  Z
0  a  ss2        0  a  1          0  a  ss2  1
1  b  ss1        1  b  2          1  a  ss2  1
2  a  ss2                         2  b  ss1  2
3  b  ss2                         3  b  ss2  2X  category   X  category      X    category
Y  object     Z  int64         Y    objectZ    int64# 注意 类别dtypes必须完全相同,即相同的类别和有序属性。否则结果将强制转换为objectdtype。
# 注意 与categorydtype 合并相比,在相同的dtypes上合并可以非常高效
============================================================

 

这篇关于pandas27 merge(数据库风格合并indicator参数实例)( tcy)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/829048

相关文章

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

C#实现一键批量合并PDF文档

《C#实现一键批量合并PDF文档》这篇文章主要为大家详细介绍了如何使用C#实现一键批量合并PDF文档功能,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言效果展示功能实现1、添加文件2、文件分组(书签)3、定义页码范围4、自定义显示5、定义页面尺寸6、PDF批量合并7、其他方法

SpringBoot 获取请求参数的常用注解及用法

《SpringBoot获取请求参数的常用注解及用法》SpringBoot通过@RequestParam、@PathVariable等注解支持从HTTP请求中获取参数,涵盖查询、路径、请求体、头、C... 目录SpringBoot 提供了多种注解来方便地从 HTTP 请求中获取参数以下是主要的注解及其用法:1

HTTP 与 SpringBoot 参数提交与接收协议方式

《HTTP与SpringBoot参数提交与接收协议方式》HTTP参数提交方式包括URL查询、表单、JSON/XML、路径变量、头部、Cookie、GraphQL、WebSocket和SSE,依据... 目录HTTP 协议支持多种参数提交方式,主要取决于请求方法(Method)和内容类型(Content-Ty

如何通过try-catch判断数据库唯一键字段是否重复

《如何通过try-catch判断数据库唯一键字段是否重复》在MyBatis+MySQL中,通过try-catch捕获唯一约束异常可避免重复数据查询,优点是减少数据库交互、提升并发安全,缺点是异常处理开... 目录1、原理2、怎么理解“异常走的是数据库错误路径,开销比普通逻辑分支稍高”?1. 普通逻辑分支 v

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1

使用shardingsphere实现mysql数据库分片方式

《使用shardingsphere实现mysql数据库分片方式》本文介绍如何使用ShardingSphere-JDBC在SpringBoot中实现MySQL水平分库,涵盖分片策略、路由算法及零侵入配置... 目录一、ShardingSphere 简介1.1 对比1.2 核心概念1.3 Sharding-Sp

python中的显式声明类型参数使用方式

《python中的显式声明类型参数使用方式》文章探讨了Python3.10+版本中类型注解的使用,指出FastAPI官方示例强调显式声明参数类型,通过|操作符替代Union/Optional,可提升代... 目录背景python函数显式声明的类型汇总基本类型集合类型Optional and Union(py

MySQL的配置文件详解及实例代码

《MySQL的配置文件详解及实例代码》MySQL的配置文件是服务器运行的重要组成部分,用于设置服务器操作的各种参数,下面:本文主要介绍MySQL配置文件的相关资料,文中通过代码介绍的非常详细,需要... 目录前言一、配置文件结构1.[mysqld]2.[client]3.[mysql]4.[mysqldum

Go语言连接MySQL数据库执行基本的增删改查

《Go语言连接MySQL数据库执行基本的增删改查》在后端开发中,MySQL是最常用的关系型数据库之一,本文主要为大家详细介绍了如何使用Go连接MySQL数据库并执行基本的增删改查吧... 目录Go语言连接mysql数据库准备工作安装 MySQL 驱动代码实现运行结果注意事项Go语言执行基本的增删改查准备工作