跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析

本文主要是介绍跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 首先导入pandas、numpy以及常用库

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as snsCalendar = pd.read_csv("calendar.csv")
Calendar.head()

# 查看数据集的形状
print(Calendar.shape)

# 查看列名
print(Calendar.columns)

# 查看每列的数据类型
print(Calendar.dtypes)

# 查看数据集的摘要统计信息
print(Calendar.describe())

 了解了数据集的基本信息之后,对数据集进行初步的整理。首先是将“$”替换为“”。

然后将日期整理为标准格式。

# 去除重复行
Calendar = Calendar.drop_duplicates()Calendar['price'] = Calendar['price'].str.replace('$', '')
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace('$', '')
Calendar = Calendar.drop(['listing_id', 'available'], axis=1)
Calendar['date'] = pd.to_datetime(Calendar['date'])

 做完这些准备工作之后,开始进行基本的数据分析。但这时候发现,报错了符号不正确。

于是增加一步去除“,”。

 

Calendar['price'] = Calendar['price'].str.replace(',', '').astype(float)
Calendar['adjusted_price'] = Calendar['adjusted_price'].str.replace(',', '').astype(float)
Calendar.head()

 通过average_price = Calendar['price'].mean()
可以查看伦敦的平均房租为

195.5802719724881
average_price = Calendar['price'].mean()
print(average_price)

接下来尝试查看一年中,价格随着月份的变化趋势:

首先整理日期:

Calendar['date'] = pd.to_datetime(Calendar['date'])
Calendar.set_index('date', inplace=True)
Calendar.sort_index(inplace=True)

然后作图:

import matplotlib.pyplot as pltplt.figure(figsize=(10, 6))
plt.plot(monthly_prices.index, monthly_prices.values)
plt.xlabel('Date')
plt.ylabel('Average Price')
plt.title('Monthly Average Price Trend')
plt.xticks(rotation=45)
plt.show()

 

可以看到,每年的暑假期间(7、8月份)以及圣诞期间(12、1)月的价格最高。

暑假的变化较为平缓,而圣诞期间的价格为突然升高 。

##本文到此结束,后面的部分下次再完善。

本欲继续分析一年中,周一到周五的价格变化情况,用了如下代码,但是并未得到满意结果:

import matplotlib.pyplot as plt# 创建子图
fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(10, 8))# 绘制价格变化子图
ax1.plot(daily_prices.index, daily_prices.values)
ax1.set_xlabel('Day of Week')
ax1.set_ylabel('Average Price')
ax1.set_title('Daily Average Price')
Text(0.5, 1.0, 'Daily Average Price')

# 绘制入住人数变化子图
ax2.plot(daily_guests.index, daily_guests.values)
ax2.set_xlabel('Day of Week')
ax2.set_ylabel('Average Minimum Nights')
ax2.set_title('Daily Average Minimum Nights')
Text(0.5, 1.0, 'Daily Average Minimum Nights')
# 设置x轴刻度标签
weekday_labels = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
ax1.set_xticks(range(7))
ax1.set_xticklabels(weekday_labels, rotation=45)
ax2.set_xticks(range(7))
ax2.set_xticklabels(weekday_labels, rotation=45)
[Text(0, 0, 'Monday'),Text(1, 0, 'Tuesday'),Text(2, 0, 'Wednesday'),Text(3, 0, 'Thursday'),Text(4, 0, 'Friday'),Text(5, 0, 'Saturday'),Text(6, 0, 'Sunday')]
# 调整子图之间的间距
plt.tight_layout()# 显示图形
print(plt.show())
<Figure size 640x480 with 0 Axes>
None

结果并不令人满意。所以本次数据分析仅得到房租价格随月份变化的趋势。

这篇关于跟着ChatGPT学数据分析(一),对Airbin的London地区房租价格进行数据分析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/255520

相关文章

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

Nginx中配置使用非默认80端口进行服务的完整指南

《Nginx中配置使用非默认80端口进行服务的完整指南》在实际生产环境中,我们经常需要将Nginx配置在其他端口上运行,本文将详细介绍如何在Nginx中配置使用非默认端口进行服务,希望对大家有所帮助... 目录一、为什么需要使用非默认端口二、配置Nginx使用非默认端口的基本方法2.1 修改listen指令

MySQL按时间维度对亿级数据表进行平滑分表

《MySQL按时间维度对亿级数据表进行平滑分表》本文将以一个真实的4亿数据表分表案例为基础,详细介绍如何在不影响线上业务的情况下,完成按时间维度分表的完整过程,感兴趣的小伙伴可以了解一下... 目录引言一、为什么我们需要分表1.1 单表数据量过大的问题1.2 分表方案选型二、分表前的准备工作2.1 数据评估

MySQL进行分片合并的实现步骤

《MySQL进行分片合并的实现步骤》分片合并是指在分布式数据库系统中,将不同分片上的查询结果进行整合,以获得完整的查询结果,下面就来具体介绍一下,感兴趣的可以了解一下... 目录环境准备项目依赖数据源配置分片上下文分片查询和合并代码实现1. 查询单条记录2. 跨分片查询和合并测试结论分片合并(Shardin

SpringBoot结合Knife4j进行API分组授权管理配置详解

《SpringBoot结合Knife4j进行API分组授权管理配置详解》在现代的微服务架构中,API文档和授权管理是不可或缺的一部分,本文将介绍如何在SpringBoot应用中集成Knife4j,并进... 目录环境准备配置 Swagger配置 Swagger OpenAPI自定义 Swagger UI 底

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指

Nginx进行平滑升级的实战指南(不中断服务版本更新)

《Nginx进行平滑升级的实战指南(不中断服务版本更新)》Nginx的平滑升级(也称为热升级)是一种在不停止服务的情况下更新Nginx版本或添加模块的方法,这种升级方式确保了服务的高可用性,避免了因升... 目录一.下载并编译新版Nginx1.下载解压2.编译二.替换可执行文件,并平滑升级1.替换可执行文件

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

Spring AI使用tool Calling和MCP的示例详解

《SpringAI使用toolCalling和MCP的示例详解》SpringAI1.0.0.M6引入ToolCalling与MCP协议,提升AI与工具交互的扩展性与标准化,支持信息检索、行动执行等... 目录深入探索 Spring AI聊天接口示例Function CallingMCPSTDIOSSE结束语

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监