Python练习 -- 通过电影票房数据统计不同类型的票房总数

2023-11-03 04:50

本文主要是介绍Python练习 -- 通过电影票房数据统计不同类型的票房总数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Python练习 – 对单元格进行拆分并保留其他行数据

1.需求

从一份电影票房数据中按照电影类型分类,统计出不同类型的票房总数
在这里插入图片描述

2.数据处理

在前期的数据处理中需要将各个电影类型进行拆分,通过以下python代码实现

data = pd.read_csv('movie_metadata.csv')data_new = data.drop(['genres'], axis=1).join(data['genres'].str.split('|', expand=True).stack().reset_index(level=1, drop=True).rename('genres_new'))#代码拆分
# data_1 = data['genres'].str.split('|', expand=True)  #expand表示切分的数据时分列显示
# data_1 = data_1.stack() #进行行转列
# data_1 = data_1.reset_index(level=1, drop=True).rename('genres_new')
# data_new = data.drop(['genres'], axis=1).join(data_1) #删除原列并将新列加入原表#为了呈现效果将新加入末尾的列插入到原列位置
data_lsit = data_new.columns.tolist()for name in data_lsit:if name in ['genres_new']:data_lsit.remove(name)data_lsit.insert(data_lsit.index('gross')+1,name)data_new = data_new.reindex(columns=data_lsit)data_new.head(10)

处理结果如下
在这里插入图片描述
在将每个电影分类拆分后就可以通过groupby来将各个电影类型进行聚合统计

data_new.groupby(by='genres_new',as_index=False)['gross'].sum().sort_values('gross',ascending=False) # data_new.groupby(by='genres_new',as_index=False).sum()[['genres_new','gross']].sort_values('gross',ascending=False) #两种写法得到的结果是一样的#在这里为了更直观的查看结果,通过设置取消科学计数法
pd.set_option('display.float_format', lambda x: '%.2f' % x)
# pd.set_option('display.max_columns', 10000, 'display.max_rows', 10000)  网上有说这个方法也可以,但是我运行完结果还是显示科学计数法

得到的结果如下
在这里插入图片描述

这篇关于Python练习 -- 通过电影票房数据统计不同类型的票房总数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/335721

相关文章

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Python位移操作和位运算的实现示例

《Python位移操作和位运算的实现示例》本文主要介绍了Python位移操作和位运算的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 位移操作1.1 左移操作 (<<)1.2 右移操作 (>>)注意事项:2. 位运算2.1

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

使用Python和Pyecharts创建交互式地图

《使用Python和Pyecharts创建交互式地图》在数据可视化领域,创建交互式地图是一种强大的方式,可以使受众能够以引人入胜且信息丰富的方式探索地理数据,下面我们看看如何使用Python和Pyec... 目录简介Pyecharts 简介创建上海地图代码说明运行结果总结简介在数据可视化领域,创建交互式地

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll

利用python实现对excel文件进行加密

《利用python实现对excel文件进行加密》由于文件内容的私密性,需要对Excel文件进行加密,保护文件以免给第三方看到,本文将以Python语言为例,和大家讲讲如何对Excel文件进行加密,感兴... 目录前言方法一:使用pywin32库(仅限Windows)方法二:使用msoffcrypto-too

使用Python实现矢量路径的压缩、解压与可视化

《使用Python实现矢量路径的压缩、解压与可视化》在图形设计和Web开发中,矢量路径数据的高效存储与传输至关重要,本文将通过一个Python示例,展示如何将复杂的矢量路径命令序列压缩为JSON格式,... 目录引言核心功能概述1. 路径命令解析2. 路径数据压缩3. 路径数据解压4. 可视化代码实现详解1

python获取网页表格的多种方法汇总

《python获取网页表格的多种方法汇总》我们在网页上看到很多的表格,如果要获取里面的数据或者转化成其他格式,就需要将表格获取下来并进行整理,在Python中,获取网页表格的方法有多种,下面就跟随小编... 目录1. 使用Pandas的read_html2. 使用BeautifulSoup和pandas3.

Python装饰器之类装饰器详解

《Python装饰器之类装饰器详解》本文将详细介绍Python中类装饰器的概念、使用方法以及应用场景,并通过一个综合详细的例子展示如何使用类装饰器,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. 引言2. 装饰器的基本概念2.1. 函数装饰器复习2.2 类装饰器的定义和使用3. 类装饰

Python 交互式可视化的利器Bokeh的使用

《Python交互式可视化的利器Bokeh的使用》Bokeh是一个专注于Web端交互式数据可视化的Python库,本文主要介绍了Python交互式可视化的利器Bokeh的使用,具有一定的参考价值,感... 目录1. Bokeh 简介1.1 为什么选择 Bokeh1.2 安装与环境配置2. Bokeh 基础2