数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)

本文主要是介绍数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用pandas进行自行车销售记录的数据分析,看不懂你打我

本文数据和源代码见github:https://github.com/w1449550206/Pandas-Data-analysis-of-bicycle-sales-record-based-on-pandas.git

文章目录

  • 使用pandas进行自行车销售记录的数据分析,看不懂你打我
    • 原始数据
    • 详细数据分析过程
      • 思路
    • 代码
  • 数据分析报告
    • 1. 商品的种类和商品的总销售数量;
    • 2. 总销售次数,月份数,月均销售次数;
    • 3. 总销售金额,平均每月销售金额,平均每单销售金额;
    • 4. 最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期;
    • 5. 各个月单独的每日销售金额直方图

原始数据

在这里插入图片描述

详细数据分析过程

思路

  • 导入数据集;

  • 检查数据基本属性;

  • 修改个别表头、舍弃缺失的不完整数据行;

  • 对时间这一列信息进行特殊处理,舍弃星期的信息,然后将时间这一列数据的格式转为时间格式pd.to_datetime();

  • “销售数量”、“应收金额”、“实收金额”这三列数据显然不可能有负数,我们要舍弃掉一些异常值的数据行;

  • 对数据按时间升序排序,重置其索引;

  • 计算商品的种类和商品的总销售数量;

  • 计算总销售次数,月份数,月均销售次数;

  • 计算总销售金额,平均每月销售金额,平均每单销售金额;

  • 计算最大和最小日销售金额及对应的日期、最大和最小日销售数量及对应的日期;

  • 画出各个月单独的每日销售金额直方图、每月销售金额直方图、每月销售金额变化直线图、销量前十和最后十名的自行车的直方图。

  • 代码实现

代码

import os
import matplotlib.pyplot as plt
import pandas as pd
from pylab import mpl  # 用于画图时显示中文字符
mpl.rcParams['font.sans-serif'] = ['SimHei']  # 使用matplotlib画图时如果出现中文使用黑体字体
file_data = pd.read_excel("销售记录.xlsx")  # 读取数据文件
file_data

在这里插入图片描述

# 获取文件名
def get_file_name(fl_data):# items()函数以列表返回可遍历的(键, 值)元组数组# globals()是一个字典,存储了所有的全局变量的名字和对应的变量的值# 在这里我们通过判断输入的变量的值与globals()中存储的变量的值是否相等,相等就认为我们输入的变量就是这个globals()中存储的变量# 这样我们就返回这个globals()中存储的变量的变量名,即keyfor var_name, value in globals().items():if value is fl_data:return var_name
# 显示读入的文件数据的一些基本属性
def show_data_basic_description(fl_data):describe_label_shape = get_file_name(file_data) + "文件的shape大小:"print(describe_label_shape, file_data.shape)describe_label_index = get_file_name(file_data) + "文件的索引开头和末尾:"print(describe_label_index, file_data.index)describe_label_table_head = get_file_name(file_data) + "文件的表头项:"print(describe_label_table_head, file_data.columns)describe_label_top_five_line = get_file_name(file_data) + "文件的内容:\n"print(describe_label_top_five_line, file_data.head())describe_label_data_type = get_file_name(file_data) + "文件的各项的数据类型:\n"print(describe_label_data_type, file_data.dtypes)
print("文件预处理前的各项属性:")
show_data_basic_description(file_data)
# 其中一个列的表头重命名一下
file_data.rename(columns={"下单日期": "销售时间"}, inplace=True)

在这里插入图片描述

# 删除所有有缺失数据的行
file_data = file_data.dropna(subset=['订单编号', '客户ID', '客户名称', '客户编号', '客户省份', '销售代表ID', '销售时间', '预计送货日期', '实际送货日期', '产品ID', '产品名称', '数量', '单价', '金额'], how="any")
file_data

在这里插入图片描述

# 删除无效时间的数据,没有
file_data = file_data.dropna(subset=["销售时间"], how="any")
file_data

在这里插入图片描述

# 处理异常值:“数量”、“单价”、“金额”这三列数据显然不可能有负数,因此要去掉不合理的数据
pop = file_data.loc[:, "金额"] > 0
file_data = file_data.loc[pop, :]
file_data

在这里插入图片描述

# 对数据按时间排序,ascending=True表示升序排列
file_data = file_data.sort_values(by="销售时间", ascending=True)
file_data

在这里插入图片描述

# 重置数据的索引
file_data = file_data.reset_index(drop=True)
print("文件预处理后的各项属性:")
show_data_basic_description(file_data)

在这里插入图片描述

# 计算自行车的种类和自行车的总销售数量

这篇关于数据分析案例:使用pandas进行自行车销售记录的数据分析+数据分析报告,看不懂你打我(附源码)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/590257

相关文章

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

使用Python和Pyecharts创建交互式地图

《使用Python和Pyecharts创建交互式地图》在数据可视化领域,创建交互式地图是一种强大的方式,可以使受众能够以引人入胜且信息丰富的方式探索地理数据,下面我们看看如何使用Python和Pyec... 目录简介Pyecharts 简介创建上海地图代码说明运行结果总结简介在数据可视化领域,创建交互式地

Java Stream流使用案例深入详解

《JavaStream流使用案例深入详解》:本文主要介绍JavaStream流使用案例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录前言1. Lambda1.1 语法1.2 没参数只有一条语句或者多条语句1.3 一个参数只有一条语句或者多

利用python实现对excel文件进行加密

《利用python实现对excel文件进行加密》由于文件内容的私密性,需要对Excel文件进行加密,保护文件以免给第三方看到,本文将以Python语言为例,和大家讲讲如何对Excel文件进行加密,感兴... 目录前言方法一:使用pywin32库(仅限Windows)方法二:使用msoffcrypto-too

Java Spring 中 @PostConstruct 注解使用原理及常见场景

《JavaSpring中@PostConstruct注解使用原理及常见场景》在JavaSpring中,@PostConstruct注解是一个非常实用的功能,它允许开发者在Spring容器完全初... 目录一、@PostConstruct 注解概述二、@PostConstruct 注解的基本使用2.1 基本代

C#使用StackExchange.Redis实现分布式锁的两种方式介绍

《C#使用StackExchange.Redis实现分布式锁的两种方式介绍》分布式锁在集群的架构中发挥着重要的作用,:本文主要介绍C#使用StackExchange.Redis实现分布式锁的... 目录自定义分布式锁获取锁释放锁自动续期StackExchange.Redis分布式锁获取锁释放锁自动续期分布式

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删