【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用

2024-06-16 13:28

本文主要是介绍【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用
 
本次修炼方法请往下查看
在这里插入图片描述

🌈 欢迎莅临我的个人主页 👈这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合,智慧小天地!
🎇 相关内容文档获取 微信公众号
🎇 相关内容视频讲解 B站

🎓 博主简介:AI算法驯化师,混迹多个大厂搜索、推荐、广告、数据分析、数据挖掘岗位 个人申请专利40+,熟练掌握机器、深度学习等各类应用算法原理和项目实战经验

🔧 技术专长: 在机器学习、搜索、广告、推荐、CV、NLP、多模态、数据分析等算法相关领域有丰富的项目实战经验。已累计为求职、科研、学习等需求提供近千次有偿|无偿定制化服务,助力多位小伙伴在学习、求职、工作上少走弯路、提高效率,近一年好评率100%

📝 博客风采: 积极分享关于机器学习、深度学习、数据分析、NLP、PyTorch、Python、Linux、工作、项目总结相关的实用内容。

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

🌵文章目录🌵

  • 🎯 一、基本介绍
  • 💡 二、使用方法
    • 常用函数
    • 创建DataFrame
  • 🔍 三、进阶用法
  • 🔍 四、注意事项
  • 🔧 五、总结

下滑查看解决方法

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

  

🎯 一、基本介绍

  Pandas中的统计函数是数据分析中不可或缺的工具,它们可以帮助我们快速计算数据集中的描述性统计数据,如均值、中位数、标准差等,可以快速的对数据进行分布分析、异常值分析、数据类型等基本数据统计分析。

💡 二、使用方法

常用函数

  Pandas 提供了很多统计函数,以下是一些常用的:

  • mean(): 计算均值
  • median(): 计算中位数
  • std(): 计算标准差
  • var(): 计算方差
  • sum(): 计算总和
  • min(): 找到最小值
  • max(): 找到最大值
  • count(): 数值的个数
  • info(): 总体数据分布

创建DataFrame

import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],'Age': [24, 27, 22, 32, 29],'Income': [50000, 54000, 35000, 62000, 58000]
}
df = pd.DataFrame(data)
# 计算年龄的均值
mean_age = df['Age'].mean()
print("Mean Age:", mean_age)# 计算收入的中位数
median_income = df['Income'].median()
print("Median Income:", median_income)# 计算年龄的标准差
std_age = df['Age'].std()
print("Standard Deviation of Age:", std_age)# 计算年龄的方差
var_age = df['Age'].var()
print("Variance of Age:", var_age)# 计算所有人的总收入
total_income = df['Income'].sum()
print("Total Income:", total_income)# 找到年龄的最大值和最小值
max_age = df['Age'].max()
min_age = df['Age'].min()
print("Max Age:", max_age, "Min Age:", min_age)

  

🔍 三、进阶用法

   当我们想要对整体的数据进行分布的查看时,需要查看各个列是否有缺失值,以及每个列的数据格式是什么样子时,这个时候需要可以通过info函数来获取相关的结果,具体的代码如下所示:

    print(df.info())<class 'pandas.core.frame.DataFrame'>RangeIndex: 5 entries, 0 to 4Data columns (total 3 columns):#   Column  Non-Null Count  Dtype ---  ------  --------------  ----- 0   Name    5 non-null      object1   Age     5 non-null      int64 2   Income  5 non-null      int64 dtypes: int64(2), object(1)memory usage: 248.0+ bytesNone

  从上面的输出结果可以看出来,每个列是否有缺失值,以及每个列中的数据格式是什么样子的。
  

🔍 四、注意事项

  对上述的各个统计函数在使用的过程中需要注意的一些事项,不然可能会出现error,具体主要为:

  • 确保在使用统计函数之前,数据是干净且适合进行统计分析的。
  • 某些统计函数,如 mean() 和 median(),可能会受到异常值的影响。在这种情况下,可能需要先进行数据清洗或转换。
  • 当使用 std() 和 var() 时,要注意它们计算的是样本标准差和方差还是总体标准差和方差。默认情况下,Pandas 计算的是总体标准差和方差(不使用 Bessel’s correction)。

🔧 五、总结

  Pandas 的统计函数是数据分析中的强大工具,它们可以帮助我们快速获取数据的关键信息。通过上述示例,我们可以看到如何使用这些函数来分析数据集。然而,为了得到准确的分析结果,我们需要确保数据的质量,并注意函数的使用条件。希望这篇博客能帮助你更好地利用 Pandas 进行数据分析。

这篇关于【Pandas驯化-03】Pandas中常用统计函数mean、count、std、info使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1066581

相关文章

使用Go调用第三方API的方法详解

《使用Go调用第三方API的方法详解》在现代应用开发中,调用第三方API是非常常见的场景,比如获取天气预报、翻译文本、发送短信等,Go作为一门高效并发的编程语言,拥有强大的标准库和丰富的第三方库,可以... 目录引言一、准备工作二、案例1:调用天气查询 API1. 注册并获取 API Key2. 代码实现3

MySQL8.0临时表空间的使用及解读

《MySQL8.0临时表空间的使用及解读》MySQL8.0+引入会话级(temp_N.ibt)和全局(ibtmp1)InnoDB临时表空间,用于存储临时数据及事务日志,自动创建与回收,重启释放,管理高... 目录一、核心概念:为什么需要“临时表空间”?二、InnoDB 临时表空间的两种类型1. 会话级临时表

MySQL之复合查询使用及说明

《MySQL之复合查询使用及说明》文章讲解了SQL复合查询中emp、dept、salgrade三张表的使用,涵盖多表连接、自连接、子查询(单行/多行/多列)及合并查询(UNION/UNIONALL)等... 目录复合查询基本查询回顾多表查询笛卡尔积自连接子查询单行子查询多行子查询多列子查询在from子句中使

Kotlin 协程之Channel的概念和基本使用详解

《Kotlin协程之Channel的概念和基本使用详解》文章介绍协程在复杂场景中使用Channel进行数据传递与控制,涵盖创建参数、缓冲策略、操作方式及异常处理,适用于持续数据流、多协程协作等,需注... 目录前言launch / async 适合的场景Channel 的概念和基本使用概念Channel 的

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化:通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

C#使用SendMessage实现进程间通信的示例代码

《C#使用SendMessage实现进程间通信的示例代码》在软件开发中,进程间通信(IPC)是关键技术之一,C#通过调用WindowsAPI的SendMessage函数实现这一功能,本文将通过实例介绍... 目录第一章:SendMessage的底层原理揭秘第二章:构建跨进程通信桥梁2.1 定义通信协议2.2

使用python制作一款文件粉碎工具

《使用python制作一款文件粉碎工具》这篇文章主要为大家详细介绍了如何使用python制作一款文件粉碎工具,能够有效粉碎密码文件和机密Excel表格等,感兴趣的小伙伴可以了解一下... 文件粉碎工具:适用于粉碎密码文件和机密的escel表格等等,主要作用就是防止 别人用数据恢复大师把你刚删除的机密的文件恢

MySQL使用EXISTS检查记录是否存在的详细过程

《MySQL使用EXISTS检查记录是否存在的详细过程》EXISTS是SQL中用于检查子查询是否返回至少一条记录的运算符,它通常用于测试是否存在满足特定条件的记录,从而在主查询中进行相应操作,本文给大... 目录基本语法示例数据库和表结构1. 使用 EXISTS 在 SELECT 语句中2. 使用 EXIS

在Android中使用WebView在线查看PDF文件的方法示例

《在Android中使用WebView在线查看PDF文件的方法示例》在Android应用开发中,有时我们需要在客户端展示PDF文件,以便用户可以阅读或交互,:本文主要介绍在Android中使用We... 目录简介:1. WebView组件介绍2. 在androidManifest.XML中添加Interne