Pandas.DataFrame.cummax() 累积最大值 详解 含代码 含测试数据集 随Pandas版本持续更新

本文主要是介绍Pandas.DataFrame.cummax() 累积最大值 详解 含代码 含测试数据集 随Pandas版本持续更新,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关于Pandas版本: 本文基于 pandas2.2.0 编写。

关于本文内容更新: 随着pandas的stable版本更迭,本文持续更新,不断完善补充。

传送门: Pandas API参考目录

传送门: Pandas 版本更新及新特性

传送门: Pandas 由浅入深系列教程

本节目录

  • Pandas.DataFrame.cummax()
    • 计算公式:
    • 语法:
    • 返回值:
    • 参数说明:
      • axis 指定计算方向(行或列)
      • skipna 忽略缺失值
      • *args,**kwargs
    • 相关方法:
    • 示例:
      • 例1:如果是 `Series` 始终保持 `axis=0`,即计算 `Series` 所有元素的累积最大值。
      • 例2:字符串求累积最大值,其实是字符串编码的大小比较
      • 例3、计算每列累积最大值
      • 例4、计算每行累积最大值
      • 例5、默认会跳过缺失值,以缺失值上面的最近有效值,进行后面的计算
      • 例6、如果不忽略缺失值,后面所有的结果,将都是缺失值。

Pandas.DataFrame.cummax()

Pandas.DataFrame.cummax 方法用于返回行或列每一个元素与前面所有元素的累积最大值

⚠️ 注意 :

  1. 字符串可以求累积最大值,其大小是根据字符编码决定的。 例2

    • 字符串不能和任何其他类型数据混用,比如 缺失值、数值,否则报错 TypeError

计算公式:

  • 累积最大值计算公式:

    M i = max ⁡ ( x 1 , x 2 , … , x i ) M_i = \max(x_1, x_2, \ldots, x_i) Mi=max(x1,x2,,xi)

    M i M_i Mi 表示当前位置的累积最大值, max ⁡ ( x 1 , x 2 , … , x i ) \max(x_1, x_2, \ldots, x_i) max(x1,x2,,xi) 表示从起始位置到当前位置的所有元素的最大值。

语法:

DataFrame.cummax(axis=None, skipna=True, *args, **kwargs)

返回值:

  • Series or DataFrame

参数说明:

axis 指定计算方向(行或列)

  • axis : {0 or ‘index’, 1 or ‘columns’}, default 0

    axis 参数,用于指定计算方向,即按行计算或按列计算累积最大值:

    • 如果是 Series 此参数无效,将始终保持 axis=0,即计算整列的累积最大值。例1
    • 如果是 DataFrame 默认为 axis=0 即计算每一列的累积最大值。并有以下参值可选:
      • 0 or ‘index’: 计算每列的累积最大值。 例3
      • 1 or ‘columns’: 计算每行的累积最大值。例4

skipna 忽略缺失值

  • skipna : bool, default True >

    skipna 参数,用于指定求累积最大值的时候是否忽略缺失值,默认 skipna=True 表示忽略缺失值:

    • True: 忽略缺失值。当遇到缺失值,会跳过缺失值,以缺失值上面的最近有效值继续后面的计算。 例5
    • False: 不忽略缺失。但是后面的所有结果将都是缺失值。例6

*args,**kwargs

  • 为了保持与 Numpy 的兼容性而保留的参数,一般不需要传递任何内容。

相关方法:

➡️ 相关方法


  • Series.cummax

    Series 累积最大值

  • DataFrame.max

    最大值

  • DataFrame.cummin

    累积最小值

  • DataFrame.cumsum

    累积和

  • DataFrame.cumprod

    累积乘积

示例:

测试文件下载:

本文所涉及的测试文件,如有需要,可在文章顶部的绑定资源处下载。

若发现文件无法下载,应该是资源包有内容更新,正在审核,请稍后再试。或站内私信作者索要。

测试文件下载位置.png

测试文件下载位置

例1:如果是 Series 始终保持 axis=0,即计算 Series 所有元素的累积最大值。

import numpy as np
import pandas as pds = pd.Series([24.0, np.nan, 21.0, 33, 26], name="age")
s.cummax()
0    24.0
1     NaN
2    24.0
3    33.0
4    33.0
Name: age, dtype: float64

例2:字符串求累积最大值,其实是字符串编码的大小比较

import numpy as np
import pandas as pddf = pd.DataFrame({"第一列": ["一", "二", "三"], "第二列": ["四", "五", "六"]})df.cummax()
第一列第二列
0
1
2

由上面结果可见,字符串是支持累积最大值计算的,只不过是根据其字符编码比较大小。

例3、计算每列累积最大值

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0],[3.0, np.nan],[1.0, 0.0]],columns=list('AB'))df.cummax()
AB
02.01.0
13.0NaN
23.01.0

例4、计算每行累积最大值

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0, 3.0], [3.0, np.nan, 5.0], [1.0, 1.0, 1.0], [1.0, 0.0, 2.0]],columns=list("ABC"),
)df.cummax(axis=1)
ABC
02.02.03.0
13.0NaN5.0
21.01.01.0
31.01.02.0

例5、默认会跳过缺失值,以缺失值上面的最近有效值,进行后面的计算

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0],[3.0, np.nan],[1.0, 1.0],[1.0, 0.0]],columns=list('AB'))df.cummax()
AB
02.01.0
13.0NaN
23.01.0
33.01.0

例6、如果不忽略缺失值,后面所有的结果,将都是缺失值。

import numpy as np
import pandas as pddf = pd.DataFrame([[2.0, 1.0],[3.0, np.nan],[1.0, 1.0],[1.0, 0.0]],columns=list('AB'))df.cummax(skipna=False)
AB
02.01.0
13.0NaN
23.0NaN
33.0NaN

这篇关于Pandas.DataFrame.cummax() 累积最大值 详解 含代码 含测试数据集 随Pandas版本持续更新的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/685700

相关文章

Mysql数据库聚簇索引与非聚簇索引举例详解

《Mysql数据库聚簇索引与非聚簇索引举例详解》在MySQL中聚簇索引和非聚簇索引是两种常见的索引结构,它们的主要区别在于数据的存储方式和索引的组织方式,:本文主要介绍Mysql数据库聚簇索引与非... 目录前言一、核心概念与本质区别二、聚簇索引(Clustered Index)1. 实现原理(以 Inno

使用python生成固定格式序号的方法详解

《使用python生成固定格式序号的方法详解》这篇文章主要为大家详细介绍了如何使用python生成固定格式序号,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录生成结果验证完整生成代码扩展说明1. 保存到文本文件2. 转换为jsON格式3. 处理特殊序号格式(如带圈数字)4

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

从基础到高级详解Go语言中错误处理的实践指南

《从基础到高级详解Go语言中错误处理的实践指南》Go语言采用了一种独特而明确的错误处理哲学,与其他主流编程语言形成鲜明对比,本文将为大家详细介绍Go语言中错误处理详细方法,希望对大家有所帮助... 目录1 Go 错误处理哲学与核心机制1.1 错误接口设计1.2 错误与异常的区别2 错误创建与检查2.1 基础

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D