用Python处理数据分析,这些电子表格你要知道

2023-11-30 11:20

本文主要是介绍用Python处理数据分析,这些电子表格你要知道,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
我在大学的时候曾经是Excel的忠实用户。那时我还不知道如何编码,所以至少我需要知道Excel才能找到工作。

每当我想清理数据、创建数据透视表和制作图表时,Excel都会给我很大帮助。也就是说,每当数据有几百万行或进行复杂的计算时,要么Excel变得很慢,要么工作簿崩溃了。

我数不清有多少次这些路障阻止了我的工作流程,也数不清有多少次我不得不一次又一次地重复一项任务。

幸运的是,我学会了用Python编码,我不再有这些问题了。

本文会给大家介绍一些Python中最好用的电子表格,以及为什么你应该选择它而不是excel

一、电子表格:Mito

Mito是Python中的一个电子表格。简单地说,如果你能编辑一个Excel文件,你现在就能写代码。

这意味着我们可以拥有像Excel这样的电子表格的简单性和Python的力量。我们可以像使用Excel一样使用Mito,在我们做完每个动作后,Mito会自动生成与每个动作相对应的Python代码。

要使用Mito,首先,我们需要安装Python和Jupyter Notebook或Jupyter Lab。然后,我们可以通过在终端或命令提示符上运行以下命令来安装Mito。

python -m pip install mitoinstaller
python -m mitoinstaller install

这就是我们开始使用Mito所需要的一切!

如果你在安装过程中有任何问题,请查看官方文档。https://docs.trymito.io/getting-started/installing-mito

现在让我们来做你在Excel中会做的任务,比如阅读文件、创建列、数据透视表、可视化等等。

二、为什么使用它

1、读取文件–Excel可以处理大约100万行,Python可以处理更多行

Excel在你能使用的行数上有一个限制。如果你试图打开一个有数百万行的文件,文件会被打开,但你在Excel中不会看到超过1,048,576行。相比之下,Python 可以处理数以百万计的行。唯一的限制将是你的PC的计算能力。

让我们看看我们如何用Mito读取一个文件。

在读取一个CSV文件之前,首先,我们需要创建一个Mito电子表格。要做到这一点,我们运行下面的代码。

import mitosheet
mitosheet.sheet()

现在是读取CSV文件的时候了。对于这个演示,我将使用一个包含学校分数的数据集,你可以在这里下载。一旦你下载了该文件,点击 "+"或 "导入 "按钮来读取它,如下所示。
在这里插入图片描述
除了导入之外,下面的代码也会自动生成。

import pandas as pd
StudentsPerformance_csv = pd.read_csv(r'StudentsPerformance.csv')

2、用Excel,你可以实现基本的自动化。有了Mito和Python,天空是无限的

在Excel中,你可以创建一个宏来记录一系列的动作,只要你想,就可以执行。

有了Mito,我们可以做同样的事情,如果再加上Python的数百个免费库,你可以做更多的事情,比如通过电子邮件发送报告,使用WhatsApp发送文件,使用Google表单作为基本数据库等等。

让我们用Mito记录一些操作,就像我们使用Excel一样。

a. 创建一个新列/重命名列

如果你想创建一个新的列,只需点击 "Add Col "按钮。默认情况下,"添加列 "按钮将创建一个名为 "new-column "的列,因此我们将通过双击该列名将其重命名为 “average”。

在这里插入图片描述
Mito将生成与我们在电子表格上所做的操作相对应的代码。

b. 对某一行求和

如果你想对某一行进行求和,我们只需要在一个单元格中写出公式(math score+reading score+writing score)/3。比如我们想计算数学、阅读和写作的平均分数。我们只需要在 "平均 "栏内的任何单元格中写下公式(数学分数+阅读分数+写作分数)/3。

在这里插入图片描述
这是Mito生成的代码。

c. 制作一个透视表

创建一个透视表就像点击 "透视 "按钮一样简单。然后我们要选择行、列和值。让我们创建一个透视表,在 "种族/民族 "栏内显示A、B、C、D和E组的数学和阅读分数的平均值。

在这里插入图片描述
为了用Python创建这个数据透视表,我们必须编写下面的代码。使用Mito,上面的代码会自动生成。

d. 创建柱状图

基本的可视化,如饼状图和柱状图,可以用Mito轻松创建。我们只需要点击 "图表 "并选择图表类型。让我们为之前创建的透视表创建一个条形图,在X轴上显示 “种族/民族”,在Y轴上显示 “数学分数平均值”。

在这里插入图片描述
很好! 在a、b、c和d中生成的几行代码相当于一个Excel宏。每次运行代码,我们都会执行所有记录的动作。

03、Python可以处理复杂的计算。这些计算可以使Excel工作簿崩溃

那些会使Excel工作簿崩溃的内存密集型计算,在Python中可以正常工作。在这种情况下,我们要用另一个叫做bamboolib的Python库来执行一系列的动作。

三、电子表格:Bamboolib

要安装bamboolib,在终端上运行命令 pip install --upgrade bamboolib --user。之后,我们要运行下面的命令来读取CSV或Excel文件。

import bamboolib as bam
bam

在这种情况下,我们要在一个有超过100万行的CSV文件中进行一些计算,你可以在这里下载。(https://drive.google.com/file/d/1YiOVav6-g_K8icZMzPszy8K20ozkAMu0/view?usp=sharing)

在这里插入图片描述

像Mito一样,Bamboolib为我们生成了代码(从现在开始,我将只显示步骤,隐藏生成的代码,以保持本文的简短)。

import pandas as pd
df = pd.read_csv(r’/Users/frank/Downloads/sales-data.csv’, sep=,, decimal=., nrows=100000)
df

现在让我们创建一个新的列。要做到这一点,我们在搜索栏上搜索动作,给列起一个名字,并输入列的公式。

对于这个演示,我们将通过使用公式 (revenue/quantity)创建一个 "价格 "列。
在这里插入图片描述
现在让我们在搜索栏中输入 “透视表”。然后我们在行中按产品对数据进行分组,并使用 "sum "作为聚合函数。

在这里插入图片描述

接下来,我们创建一个饼状图。我们必须点击 "创建图表 "按钮,选择图表类型,并选择我们要显示的数值。

在这里插入图片描述

最后,我们从 "日期 "列中提取属性。在这种情况下,我们提取月份的名称,但是,首先,我们必须将 "日期 "列的数据类型改为 date(现在设置为str)。
在这里插入图片描述

如果你遵循了每一个步骤,你可以验证所有的计算都是顺利进行的!

最后

如果你对Python技术比较感兴趣,想要学习数据分析、爬虫等;这里给大家分享一份Python全套学习资料,包括学习路线、软件、源码、视频、面试题等等,都是我自己学习时整理的,整理不易,请多多点赞分享哦~

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。
在这里插入图片描述

二、Python学习软件

工欲善其事,必先利其器。学习Python常用的开发软件都在这里了!
在这里插入图片描述

三、Python入门学习视频

还有很多适合0基础入门的学习视频,有了这些视频,轻轻松松上手Python~在这里插入图片描述

四、Python练习题

每节视频课后,都有对应的练习题哦,可以检验学习成果哈哈!
在这里插入图片描述

五、Python实战案例

光学理论是没用的,要学会跟着一起敲代码,动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。这份资料也包含在内的哈~在这里插入图片描述

六、Python面试资料

我们学会了Python之后,有了技能就可以出去找工作啦!下面这些面试题是都来自阿里、腾讯、字节等一线互联网大厂,并且有阿里大佬给出了权威的解答,刷完这一套面试资料相信大家都能找到满意的工作。
在这里插入图片描述
在这里插入图片描述

七、资料领取

上述完整版Python全套学习资料已经上传CSDN官方,需要的小伙伴可自行微信扫描下方CSDN官方认证二维码输入“领取资料”免费领取!!

这篇关于用Python处理数据分析,这些电子表格你要知道的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/436824

相关文章

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Python版本与package版本兼容性检查方法总结

《Python版本与package版本兼容性检查方法总结》:本文主要介绍Python版本与package版本兼容性检查方法的相关资料,文中提供四种检查方法,分别是pip查询、conda管理、PyP... 目录引言为什么会出现兼容性问题方法一:用 pip 官方命令查询可用版本方法二:conda 管理包环境方法

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

解决docker目录内存不足扩容处理方案

《解决docker目录内存不足扩容处理方案》文章介绍了Docker存储目录迁移方法:因系统盘空间不足,需将Docker数据迁移到更大磁盘(如/home/docker),通过修改daemon.json配... 目录1、查看服务器所有磁盘的使用情况2、查看docker镜像和容器存储目录的空间大小3、停止dock

pycharm跑python项目易出错的问题总结

《pycharm跑python项目易出错的问题总结》:本文主要介绍pycharm跑python项目易出错问题的相关资料,当你在PyCharm中运行Python程序时遇到报错,可以按照以下步骤进行排... 1. 一定不要在pycharm终端里面创建环境安装别人的项目子模块等,有可能出现的问题就是你不报错都安装

Python打包成exe常用的四种方法小结

《Python打包成exe常用的四种方法小结》本文主要介绍了Python打包成exe常用的四种方法,包括PyInstaller、cx_Freeze、Py2exe、Nuitka,文中通过示例代码介绍的非... 目录一.PyInstaller11.安装:2. PyInstaller常用参数下面是pyinstal

Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题

《Python爬虫HTTPS使用requests,httpx,aiohttp实战中的证书异步等问题》在爬虫工程里,“HTTPS”是绕不开的话题,HTTPS为传输加密提供保护,同时也给爬虫带来证书校验、... 目录一、核心问题与优先级检查(先问三件事)二、基础示例:requests 与证书处理三、高并发选型: