暑期实训Python第十天,seaborn画图 --------<泰坦尼克号沉船>数据可视化

本文主要是介绍暑期实训Python第十天,seaborn画图 --------<泰坦尼克号沉船>数据可视化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

网上的泰坦尼克号沉船数据可视化,写的全是代码,没点分析过程,干脆我自己来写

• PassengerId => 乘客ID
• Survived => 获救情况(1为获救,0为未获救)
• Pclass => 乘客等级(1/2/3等舱位)
• Name => 乘客姓名
• Sex => 性别
• Age => 年龄
• SibSp => 堂兄弟/妹个数
• Parch => 父母与小孩个数
• Ticket => 船票信息
• Fare => 票价
• Cabin => 客舱
• Embarked => 登船港口

先分析 不同等级的船舱 里的存活率(条形图)

Pclass 分成1,2,3个等级 Survived 分为 0 和 1
使用groupby 将数据 分成组, 比如groupby("Pclass"),可以将数据划分成三个部分。
groupby(["Pclass","Survived"])就将数据分成六个部分

estimator:可回调函数
作用:设置每个分类箱的统计函数

指定x分类变量进行分组,指定 y为数据分布,绘制垂直条形图

sns.barplot(x=df.Pclass, y=df.Survived, estimator=lambda x: np.sum(x) / len(x), data=df)
plt.show()

在这里插入图片描述
分析结果
一等舱位 的乘客存活率最大,最容易存活,存活率为0.629
三等舱的 乘客存活几率最小,存活率为0.2423

分析年龄和存活率 的关系

df["Age"].describe()
count    714.000000
mean      29.699118
std       14.526497
min        0.420000
25%       20.125000
50%       28.000000
75%       38.000000
max       80.000000
Name: Age, dtype: float64

总数据有891条,可是年龄只有714,说明年龄有很多为 空值,所以为了数据的可靠性,将空值转变成 平均值

df.fillna({"Age":df.Age.mean()},inplace=True)

在这里插入图片描述

#年龄的直方图
sns.distplot(df.Age,bins=20)
plt.show()

在这里插入图片描述

仿照上面生成船舱等级和存活率 第一个的做法:

sns.barplot(x=df.Age, y=df.Survived, estimator=lambda x: np.sum(x) / len(x), data=df)

结果: 是很多密密麻麻的矩形,非常难观察出规律
在这里插入图片描述
这里就提到了一个新的名词:连续数据离散化,通俗的将就是分段

这里又由于作者的知识 是白痴状态,这里就需要弄懂cut 方法里的bins属性
小tips:
pandas中pd.cut()的功能和作用,cut(a,bins) a指的是需要切分的对象,b指的是需要将对象切成什么样子的份,bins是一个列表bins = [0, 59, 70, 80, 100]。这里题目可以将年龄范围从0-80,以10岁为区间,生成8个矩形

df["Age_band"] = pd.cut(df.Age,bins=np.arange(0,90,10))
sns.barplot(x="Age_band", y=df.Survived, estimator=lambda x: np.sum(x) / len(x), data=df)

在这里插入图片描述
观察图形可以分析出:
10岁以下的孩子存活率最高,说明船上的人还是非常有人性的,而大于60岁的人,存活率偏低,说明老人行走不便,然后你懂的。普通人的存活率不超过0.5,说明基本上等于选择一个就等于放弃另外一个。

分析其他的数据和存活率的关系,由于代码一样就展示图:
在这里插入图片描述
在这里插入图片描述

性别影响真的很大

在这里插入图片描述

这篇关于暑期实训Python第十天,seaborn画图 --------<泰坦尼克号沉船>数据可视化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/awodwde/article/details/108006323
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/213234

相关文章

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Python中help()和dir()函数的使用

《Python中help()和dir()函数的使用》我们经常需要查看某个对象(如模块、类、函数等)的属性和方法,Python提供了两个内置函数help()和dir(),它们可以帮助我们快速了解代... 目录1. 引言2. help() 函数2.1 作用2.2 使用方法2.3 示例(1) 查看内置函数的帮助(

Python虚拟环境与Conda使用指南分享

《Python虚拟环境与Conda使用指南分享》:本文主要介绍Python虚拟环境与Conda使用指南,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、python 虚拟环境概述1.1 什么是虚拟环境1.2 为什么需要虚拟环境二、Python 内置的虚拟环境工具

Python实例题之pygame开发打飞机游戏实例代码

《Python实例题之pygame开发打飞机游戏实例代码》对于python的学习者,能够写出一个飞机大战的程序代码,是不是感觉到非常的开心,:本文主要介绍Python实例题之pygame开发打飞机... 目录题目pygame-aircraft-game使用 Pygame 开发的打飞机游戏脚本代码解释初始化部

Python pip下载包及所有依赖到指定文件夹的步骤说明

《Pythonpip下载包及所有依赖到指定文件夹的步骤说明》为了方便开发和部署,我们常常需要将Python项目所依赖的第三方包导出到本地文件夹中,:本文主要介绍Pythonpip下载包及所有依... 目录步骤说明命令格式示例参数说明离线安装方法注意事项总结要使用pip下载包及其所有依赖到指定文件夹,请按照以

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

基于Python实现一个Windows Tree命令工具

《基于Python实现一个WindowsTree命令工具》今天想要在Windows平台的CMD命令终端窗口中使用像Linux下的tree命令,打印一下目录结构层级树,然而还真有tree命令,但是发现... 目录引言实现代码使用说明可用选项示例用法功能特点添加到环境变量方法一:创建批处理文件并添加到PATH1

Python包管理工具核心指令uvx举例详细解析

《Python包管理工具核心指令uvx举例详细解析》:本文主要介绍Python包管理工具核心指令uvx的相关资料,uvx是uv工具链中用于临时运行Python命令行工具的高效执行器,依托Rust实... 目录一、uvx 的定位与核心功能二、uvx 的典型应用场景三、uvx 与传统工具对比四、uvx 的技术实

Python中使用uv创建环境及原理举例详解

《Python中使用uv创建环境及原理举例详解》uv是Astral团队开发的高性能Python工具,整合包管理、虚拟环境、Python版本控制等功能,:本文主要介绍Python中使用uv创建环境及... 目录一、uv工具简介核心特点:二、安装uv1. 通过pip安装2. 通过脚本安装验证安装:配置镜像源(可

python判断文件是否存在常用的几种方式

《python判断文件是否存在常用的几种方式》在Python中我们在读写文件之前,首先要做的事情就是判断文件是否存在,否则很容易发生错误的情况,:本文主要介绍python判断文件是否存在常用的几种... 目录1. 使用 os.path.exists()2. 使用 os.path.isfile()3. 使用