波士顿房价问题可视化:散点图感受价格相关因素数据分布

本文主要是介绍波士顿房价问题可视化:散点图感受价格相关因素数据分布,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

波士顿房价问题也是机器学习中的一个入门问题,sklearn这个模块中包含了500多条波士顿房价的数据,其中包括13个相关的因素。类似于鸢尾花数据可视化的处理(参考博文鸢尾花数据进行可视化展示)的处理方式,我们先把datasets的数据转换成我们熟悉的DF数据,这一次,我们是用python自带的matplot库中的方法来绘制散点图。具体的代码如下所示,其中用到了一些python的技巧,总结如下:

1.双重for循环列表生成式生成二维的数据列表;
2.zip方法打包两个列表并且转换成字典类型;
3.pandas的DataFrame的数据创建与读取;
4.matplotlib的绘图方法。

from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import math
boston = datasets.load_boston()
factor_list = list(boston.feature_names)
facvals = [ [boston.data[i][index] for i in range(len(boston.data))] for index in range(len(factor_list)) ]
factor_list.append('TARGET')
facvals.append(boston.target)
factor_dict = dict(zip(factor_list,facvals))
boston_df = pd.DataFrame(factor_dict, # columns = ['CRIM','CHAS','AGE','TARGET'],)
def plot(strfac):x_axis = list(boston_df[strfac])y_axis = list(boston_df['TARGET'])plt.title(strfac)plt.ylabel('Price')plt.scatter(x_axis,y_axis,s=3)for i in range(len(factor_list)):index = i+1factor = factor_list[i]plt.subplot(3,5,index)plot(factor)plt.show()

我们最终生成了以下图形:
在这里插入图片描述

这篇关于波士顿房价问题可视化:散点图感受价格相关因素数据分布的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/512801

相关文章

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec

SysMain服务可以关吗? 解决SysMain服务导致的高CPU使用率问题

《SysMain服务可以关吗?解决SysMain服务导致的高CPU使用率问题》SysMain服务是超级预读取,该服务会记录您打开应用程序的模式,并预先将它们加载到内存中以节省时间,但它可能占用大量... 在使用电脑的过程中,CPU使用率居高不下是许多用户都遇到过的问题,其中名为SysMain的服务往往是罪魁

MySQ中出现幻读问题的解决过程

《MySQ中出现幻读问题的解决过程》文章解析MySQLInnoDB通过MVCC与间隙锁机制在可重复读隔离级别下解决幻读,确保事务一致性,同时指出性能影响及乐观锁等替代方案,帮助开发者优化数据库应用... 目录一、幻读的准确定义与核心特征幻读 vs 不可重复读二、mysql隔离级别深度解析各隔离级别的实现差异

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

Python实现数据可视化图表生成(适合新手入门)

《Python实现数据可视化图表生成(适合新手入门)》在数据科学和数据分析的新时代,高效、直观的数据可视化工具显得尤为重要,下面:本文主要介绍Python实现数据可视化图表生成的相关资料,文中通过... 目录前言为什么需要数据可视化准备工作基本图表绘制折线图柱状图散点图使用Seaborn创建高级图表箱线图热

Linux部署中的文件大小写问题的解决方案

《Linux部署中的文件大小写问题的解决方案》在本地开发环境(Windows/macOS)一切正常,但部署到Linux服务器后出现模块加载错误,核心原因是Linux文件系统严格区分大小写,所以本文给大... 目录问题背景解决方案配置要求问题背景在本地开发环境(Windows/MACOS)一切正常,但部署到