跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析

本文主要是介绍跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 首先导入pandas、numpy以及常用库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as snsCalendar = pd.read_csv("calendar.csv")
Calendar.head()

# 查看数据集的形状
print(Calendar.shape)

# 查看列名
print(Calendar.columns)

# 查看每列的数据类型
print(Calendar.dtypes)

# 查看数据集的摘要统计信息
print(Calendar.describe())

 了解了数据集的基本信息之后,对数据集进行初步的整理。首先是将“$”替换为“”。

然后将日期整理为标准格式。

# 去除重复行
Calendar = Calendar.drop_duplicates()Calendar['price'] = Calendar['price'].str.replace('$', '')
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace('$', '')
Calendar = Calendar.drop(['listing_id', 'available'], axis=1)
Calendar['date'] = pd.to_datetime(Calendar['date'])

 做完这些准备工作之后,开始进行基本的数据分析。但这时候发现,报错了符号不正确。

于是增加一步去除“,”。

 

Calendar['price'] = Calendar['price'].str.replace(',', '').astype(float)
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace(',', '').astype(float)
Calendar.head()

 通过average_price = Calendar['price'].mean()
可以查看伦敦的平均房租为

195.5802719724881
average_price = Calendar['price'].mean()
print(average_price)

接下来尝试查看一年中,价格随着月份的变化趋势:

首先整理日期:

Calendar['date'] = pd.to_datetime(Calendar['date'])
Calendar.set_index('date', inplace=True)
Calendar.sort_index(inplace=True)

然后作图:

import matplotlib.pyplot as pltplt.figure(figsize=(10, 6))
plt.plot(monthly_prices.index, monthly_prices.values)
plt.xlabel('Date')
plt.ylabel('Average Price')
plt.title('Monthly Average Price Trend')
plt.xticks(rotation=45)
plt.show()

 

可以看到,每年的暑假期间(7、8月份)以及圣诞期间(12、1)月的价格最高。

暑假的变化较为平缓,而圣诞期间的价格为突然升高 。

##本文到此结束,后面的部分下次再完善。

本欲继续分析一年中,周一到周五的价格变化情况,用了如下代码,但是并未得到满意结果:

import matplotlib.pyplot as plt# 创建子图
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))# 绘制价格变化子图
ax1.plot(daily_prices.index, daily_prices.values)
ax1.set_xlabel('Day of Week')
ax1.set_ylabel('Average Price')
ax1.set_title('Daily Average Price')
Text(0.5, 1.0, 'Daily Average Price')

# 绘制入住人数变化子图
ax2.plot(daily_guests.index, daily_guests.values)
ax2.set_xlabel('Day of Week')
ax2.set_ylabel('Average Minimum Nights')
ax2.set_title('Daily Average Minimum Nights')
Text(0.5, 1.0, 'Daily Average Minimum Nights')
# 设置x轴刻度标签
weekday_labels = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
ax1.set_xticks(range(7))
ax1.set_xticklabels(weekday_labels, rotation=45)
ax2.set_xticks(range(7))
ax2.set_xticklabels(weekday_labels, rotation=45)
[Text(0, 0, 'Monday'),Text(1, 0, 'Tuesday'),Text(2, 0, 'Wednesday'),Text(3, 0, 'Thursday'),Text(4, 0, 'Friday'),Text(5, 0, 'Saturday'),Text(6, 0, 'Sunday')]
# 调整子图之间的间距
plt.tight_layout()# 显示图形
print(plt.show())
<Figure size 640x480 with 0 Axes>
None

结果并不令人满意。所以本次数据分析仅得到房租价格随月份变化的趋势。

这篇关于跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/255520

相关文章

Linux使用scp进行远程目录文件复制的详细步骤和示例

《Linux使用scp进行远程目录文件复制的详细步骤和示例》在Linux系统中,scp(安全复制协议)是一个使用SSH(安全外壳协议)进行文件和目录安全传输的命令,它允许在远程主机之间复制文件和目录,... 目录1. 什么是scp?2. 语法3. 示例示例 1: 复制本地目录到远程主机示例 2: 复制远程主

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

windows系统上如何进行maven安装和配置方式

《windows系统上如何进行maven安装和配置方式》:本文主要介绍windows系统上如何进行maven安装和配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. Maven 简介2. maven的下载与安装2.1 下载 Maven2.2 Maven安装2.

C/C++的OpenCV 进行图像梯度提取的几种实现

《C/C++的OpenCV进行图像梯度提取的几种实现》本文主要介绍了C/C++的OpenCV进行图像梯度提取的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录预www.chinasem.cn备知识1. 图像加载与预处理2. Sobel 算子计算 X 和 Y

Go语言中使用JWT进行身份验证的几种方式

《Go语言中使用JWT进行身份验证的几种方式》本文主要介绍了Go语言中使用JWT进行身份验证的几种方式,包括dgrijalva/jwt-go、golang-jwt/jwt、lestrrat-go/jw... 目录简介1. github.com/dgrijalva/jwt-go安装:使用示例:解释:2. gi

SpringBoot如何对密码等敏感信息进行脱敏处理

《SpringBoot如何对密码等敏感信息进行脱敏处理》这篇文章主要为大家详细介绍了SpringBoot对密码等敏感信息进行脱敏处理的几个常用方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录​1. 配置文件敏感信息脱敏​​2. 日志脱敏​​3. API响应脱敏​​4. 其他注意事项​​总结

python进行while遍历的常见错误解析

《python进行while遍历的常见错误解析》在Python中选择合适的遍历方式需要综合考虑可读性、性能和具体需求,本文就来和大家讲解一下python中while遍历常见错误以及所有遍历方法的优缺点... 目录一、超出数组范围问题分析错误复现解决方法关键区别二、continue使用问题分析正确写法关键点三

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

Python对PDF书签进行添加,修改提取和删除操作

《Python对PDF书签进行添加,修改提取和删除操作》PDF书签是PDF文件中的导航工具,通常包含一个标题和一个跳转位置,本教程将详细介绍如何使用Python对PDF文件中的书签进行操作... 目录简介使用工具python 向 PDF 添加书签添加书签添加嵌套书签Python 修改 PDF 书签Pytho

Java进行日期解析与格式化的实现代码

《Java进行日期解析与格式化的实现代码》使用Java搭配ApacheCommonsLang3和Natty库,可以实现灵活高效的日期解析与格式化,本文将通过相关示例为大家讲讲具体的实践操作,需要的可以... 目录一、背景二、依赖介绍1. Apache Commons Lang32. Natty三、核心实现代