Python 中实现 CDF 累积分布图的两种方法

2024-03-07 21:36

本文主要是介绍Python 中实现 CDF 累积分布图的两种方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

什么是累积分布

累积分布函数,又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(Cumulative Distribution Function)标记。
《百度百科》

累积分布函数,又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。一般以大写“CDF”(CumulativeDistributionFunction)标记。累积分布图(distribution diagram)是在一组依大小顺序排列的测量值中,当按一定的组即分组时出现测量值小于某个数值的频数或额率对组限的分布图。

简单理解:就是所有 x 左边的值都会落在对应 y 值的概率里。

第一种方法

使用 seaborn 的 ecdfplot 方法, 代码如下:

import seaborn as sns
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np# 假设你有一些数据
data1 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
data2 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
df = pd.DataFrame({'data1': data1, 'data2': data2})
# 使用sns.distplot()来计算并绘制CDF
sns.ecdfplot(data=df, legend=True)
plt.grid()
# 显示图形
plt.show()  

得到的 CDF 图形:

CDF by sns

第二种方法

使用 scipy 的 mquantiles 计算

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.stats.mstats import mquantiles
from matplotlib.ticker import PercentFormatterdef cdf_by_data(df, mark, title):fig, ax = plt.subplots()y = np.arange(0, 1, 0.01)x = mquantiles(df, y)ax.plot(x, y)ax.set_title(title + " - CDF")ax.axvline(x=mark, color='r', linestyle='--', label=str(mark))ax.yaxis.set_major_formatter(PercentFormatter(1))ax.set_xlabel(title)ax.set_ylabel('probability')index = np.abs(x - mark).argmin()plt.plot(mark, y[index], 'o', color='g')ax.text(mark + 1, y[index], "({}, {}%)".format(mark, round(y[index] * 100)), color='r')plt.grid(True)# 假设你有一些数据
data1 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
data2 = np.random.normal(size=1000)  # 生成1000个正态分布的随机数
df = pd.DataFrame({'data1': data1, 'data2': data2})
cdf_by_data(df=df, mark=0, title='cdf of data')
plt.grid()
# 显示图形
plt.show()  

得到的图形如下:
CDF by scipy

这篇关于Python 中实现 CDF 累积分布图的两种方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/784900

相关文章

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流(parallelStream)的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4