NumPy(五):数组统计【平均值:mean()、最大值:max()、最小值:min()、标准差:std()、方差:var()、中位数:median()】【axis=0:按列运算;axis=0:按列】

本文主要是介绍NumPy(五):数组统计【平均值:mean()、最大值:max()、最小值:min()、标准差:std()、方差:var()、中位数:median()】【axis=0:按列运算;axis=0:按列】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

统计运算

  • np.max()
  • np.min()
  • np.median()
  • np.mean()
  • np.std()
  • np.var()
  • np.argmax(axis=) — 最大元素对应的下标
  • np.argmin(axis=) — 最小元素对应的下标

NumPy提供了一个N维数组类型ndarray,它描述了 相同类型 的“items”的集合。(NumPy provides an N-dimensional array type, the ndarray, which describes a collection of “items” of the same type.)

在这里插入图片描述

用ndarray进行存储:

import numpy as np# 创建ndarray
score = np.array(
[[80, 89, 86, 67, 79],
[78, 97, 89, 67, 81],
[90, 94, 78, 67, 74],
[91, 91, 90, 67, 69],
[76, 87, 75, 67, 86],
[70, 79, 84, 67, 84],
[94, 92, 93, 67, 64],
[86, 85, 83, 67, 80]])score

返回结果:

array([[80, 89, 86, 67, 79],[78, 97, 89, 67, 81],[90, 94, 78, 67, 74],[91, 91, 90, 67, 69],[76, 87, 75, 67, 86],[70, 79, 84, 67, 84],[94, 92, 93, 67, 64],[86, 85, 83, 67, 80]])

如果想要知道学生成绩最大的分数,或者做小分数应该怎么做?

一、统计指标

在数据挖掘/机器学习领域,统计指标的值也是我们分析问题的一种方式。

  • axis为0,按列运算
  • axis为1,按行运算

常用的指标如下:

  • min(a, axis)
    • Return the minimum of an array or minimum along an axis.
  • max(a, axis])
    • Return the maximum of an array or maximum along an axis.
  • median(a, axis)
    • Compute the median along the specified axis.
  • mean(a, axis, dtype)
    • Compute the arithmetic mean along the specified axis.
  • std(a, axis, dtype)
    • Compute the standard deviation along the specified axis.
  • var(a, axis, dtype)
    • Compute the variance along the specified axis.

二、案例:学生成绩统计运算

进行统计的时候,axis 轴的取值并不一定,Numpy中不同的API轴的值都不一样,在这里,axis 0代表列, axis 1代表行去进行统计

# 接下来对于前四名学生,进行一些统计运算
# 指定列 去统计
temp = score[:4, 0:5]
print("前四名学生,各科成绩的最大分:{}".format(np.max(temp, axis=0)))
print("前四名学生,各科成绩的最小分:{}".format(np.min(temp, axis=0)))
print("前四名学生,各科成绩波动情况:{}".format(np.std(temp, axis=0)))
print("前四名学生,各科成绩的平均分:{}".format(np.mean(temp, axis=0)))

结果:

前四名学生,各科成绩的最大分:[96 97 72 98 89]
前四名学生,各科成绩的最小分:[55 57 45 76 77]
前四名学生,各科成绩波动情况:[16.25576821 14.92271758 10.40432602  8.0311892   4.32290412]
前四名学生,各科成绩的平均分:[78.5  75.75 62.5  85.   82.25]

如果需要统计出某科最高分对应的是哪个同学?

  • np.argmax(temp, axis=)
  • np.argmin(temp, axis=)
print("前四名学生,各科成绩最高分对应的学生下标:{}".format(np.argmax(temp, axis=0)))

结果:

前四名学生,各科成绩最高分对应的学生下标:[0 2 0 0 1]

三、案例

import numpy as npar = np.arange(6).reshape(2, 3)
print('ar = ', ar)
# 统计运算
print('ar.mean() = ', ar.mean())  # 求平均值
print('按列求平均值:np.mean(ar, axis=0) = ', np.mean(ar, axis=0))  # 按列求平均值
print('按行求平均值:np.mean(ar, axis=1) = ', np.mean(ar, axis=1))  # 按行求平均值
print('ar.max() = ', ar.max())  # 求最大值
print('按列求最大值:np.max(ar, axis=0) = ', np.max(ar, axis=0))  # 按列求最大值
print('按行求最大值:np.max(ar, axis=1) = ', np.max(ar, axis=1))  # 按行求最大值
print('ar.min() = ', ar.min())  # 求最小值
print('按列求最小值:np.min(ar, axis=0) = ', np.min(ar, axis=0))  # 按列求最小值
print('按行求最小值:np.min(ar, axis=1) = ', np.min(ar, axis=1))  # 按行求最小值
print('ar.std() = ', ar.std())  # 求标准差
print('按列求标准差:np.std(ar, axis=0) = ', np.std(ar, axis=0))  # 按列求标准差
print('按列求标准差:np.std(ar, axis=1) = ', np.std(ar, axis=1))  # 按列求标准差
print('ar.var() = ', ar.var())  # 求方差
print('按列求方差:np.var(ar, axis=0) = ', np.var(ar, axis=0))  # 按列求方差
print('按行求方差:np.var(ar, axis=1) = ', np.var(ar, axis=1))  # 按行求方差
print('ar.sum() = ', ar.sum())  # 求和,np.sum()
print('按列求和:np.sum(ar, axis=0) = ', np.sum(ar, axis=0))  # 求和,np.sum() → axis为0,按列求和
print('按行求和:np.sum(ar, axis=1) = ', np.sum(ar, axis=1))  # 求和,np.sum() → axis为1,按行求和

打印结果:

ar =  [[0 1 2][3 4 5]]
ar.mean() =  2.5
按列求平均值:np.mean(ar, axis=0) =  [1.5 2.5 3.5]
按行求平均值:np.mean(ar, axis=1) =  [1. 4.]
ar.max() =  5
按列求最大值:np.max(ar, axis=0) =  [3 4 5]
按行求最大值:np.max(ar, axis=1) =  [2 5]
ar.min() =  0
按列求最小值:np.min(ar, axis=0) =  [0 1 2]
按行求最小值:np.min(ar, axis=1) =  [0 3]
ar.std() =  1.707825127659933
按列求标准差:np.std(ar, axis=0) =  [1.5 1.5 1.5]
按列求标准差:np.std(ar, axis=1) =  [0.81649658 0.81649658]
ar.var() =  2.9166666666666665
按列求方差:np.var(ar, axis=0) =  [2.25 2.25 2.25]
按行求方差:np.var(ar, axis=1) =  [0.66666667 0.66666667]
ar.sum() =  15
按列求和:np.sum(ar, axis=0) =  [3 5 7]
按行求和:np.sum(ar, axis=1) =  [ 3 12]

这篇关于NumPy(五):数组统计【平均值:mean()、最大值:max()、最小值:min()、标准差:std()、方差:var()、中位数:median()】【axis=0:按列运算;axis=0:按列】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1128699

相关文章

MySQL JSON 查询中的对象与数组技巧及查询示例

《MySQLJSON查询中的对象与数组技巧及查询示例》MySQL中JSON对象和JSON数组查询的详细介绍及带有WHERE条件的查询示例,本文给大家介绍的非常详细,mysqljson查询示例相关知... 目录jsON 对象查询1. JSON_CONTAINS2. JSON_EXTRACT3. JSON_TA

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

C/C++中OpenCV 矩阵运算的实现

《C/C++中OpenCV矩阵运算的实现》本文主要介绍了C/C++中OpenCV矩阵运算的实现,包括基本算术运算(标量与矩阵)、矩阵乘法、转置、逆矩阵、行列式、迹、范数等操作,感兴趣的可以了解一下... 目录矩阵的创建与初始化创建矩阵访问矩阵元素基本的算术运算 ➕➖✖️➗矩阵与标量运算矩阵与矩阵运算 (逐元

JAVA数组中五种常见排序方法整理汇总

《JAVA数组中五种常见排序方法整理汇总》本文给大家分享五种常用的Java数组排序方法整理,每种方法结合示例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录前言:法一:Arrays.sort()法二:冒泡排序法三:选择排序法四:反转排序法五:直接插入排序前言:几种常用的Java数组排序

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

Python位移操作和位运算的实现示例

《Python位移操作和位运算的实现示例》本文主要介绍了Python位移操作和位运算的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 位移操作1.1 左移操作 (<<)1.2 右移操作 (>>)注意事项:2. 位运算2.1

pandas中位数填充空值的实现示例

《pandas中位数填充空值的实现示例》中位数填充是一种简单而有效的方法,用于填充数据集中缺失的值,本文就来介绍一下pandas中位数填充空值的实现,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是中位数填充?为什么选择中位数填充?示例数据结果分析完整代码总结在数据分析和机器学习过程中,处理缺失数

Pandas统计每行数据中的空值的方法示例

《Pandas统计每行数据中的空值的方法示例》处理缺失数据(NaN值)是一个非常常见的问题,本文主要介绍了Pandas统计每行数据中的空值的方法示例,具有一定的参考价值,感兴趣的可以了解一下... 目录什么是空值?为什么要统计空值?准备工作创建示例数据统计每行空值数量进一步分析www.chinasem.cn处

Java数组初始化的五种方式

《Java数组初始化的五种方式》数组是Java中最基础且常用的数据结构之一,其初始化方式多样且各具特点,本文详细讲解Java数组初始化的五种方式,分析其适用场景、优劣势对比及注意事项,帮助避免常见陷阱... 目录1. 静态初始化:简洁但固定代码示例核心特点适用场景注意事项2. 动态初始化:灵活但需手动管理代

C++中初始化二维数组的几种常见方法

《C++中初始化二维数组的几种常见方法》本文详细介绍了在C++中初始化二维数组的不同方式,包括静态初始化、循环、全部为零、部分初始化、std::array和std::vector,以及std::vec... 目录1. 静态初始化2. 使用循环初始化3. 全部初始化为零4. 部分初始化5. 使用 std::a