python生成树状图_聚类分析python画树状图--Plotly(dendrogram)用法解析

2023-10-16 04:40

本文主要是介绍python生成树状图_聚类分析python画树状图--Plotly(dendrogram)用法解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、前言

聚类分析是机器学习和数据分析中非常常见的分类方法,

当我们用到层次聚类(系统聚类)时,最常用的分析方法就是绘制树状图,

比较常见的统计软件像SPSS、SAS、R等都可以直接绘制树状图,比较简单,

今天主要介绍下python怎么绘制。

2、Plotly

python绘制树状图主要介绍使用Plotly工具(当然也可能有其他方法)

2.1 安装Plotlypip install plotly注意:树形图可在1.8.7+版本中使用。运行pip install plotly --upgrade以更新您的Plotly版本。

import plotlyplotly.__version__

2.2注册 Plotly注意:Plotly的Python库是免费的开源软件!

但是想要使用Plotly需要注册并调用,自己可以将Plotly设置为在线或离线模式或jupyter笔记本中工作。

AAffA0nNPuCLAAAAAElFTkSuQmCC

根据生成的密匙来调用:import plotlyplotly.tools.set_credentials_file(username='****注册用户名****', api_key='****密匙****')

2.3 调用试行import plotly.plotly as pyimport plotly.figure_factory as ffimport numpy as npX = np.random.rand(15, 15)dendro = ff.create_dendrogram(X)dendro['layout'].update({'width':800, 'height':500})py.iplot(dendro, filename='simple_dendrogram')

生成树状图

AAffA0nNPuCLAAAAAElFTkSuQmCC

我们可以看到图片的右上角和右下角还有可以编辑的功能,大家可以自己测试一下

2.4实际运行

2.4.1导入数据import pandas as pddata = pd.read_csv('cluster.csv')

2.4.2查看数据data.head()

AAffA0nNPuCLAAAAAElFTkSuQmCC

2.4.3 生成树状图X = data[["sum1","sum2","X1","X2","X3"]]

先定义X,确定分类变量fig = ff.create_dendrogram(X, orientation='left',labels=list(data["城市"]))fig['layout'].update({'width':800, 'height':800})py.iplot(fig, filename='dendrogram_with_labels')

画图

AAffA0nNPuCLAAAAAElFTkSuQmCC

由于城市数量较多所以左边显示的比较模糊,其实也是要说明的一点:

当分类的类别较多时不建议画树状图来分析。

原文出处:https://blog.csdn.net/Andy_shenzl/article/details/81806899

这篇关于python生成树状图_聚类分析python画树状图--Plotly(dendrogram)用法解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/219098

相关文章

Django开发时如何避免频繁发送短信验证码(python图文代码)

《Django开发时如何避免频繁发送短信验证码(python图文代码)》Django开发时,为防止频繁发送验证码,后端需用Redis限制请求频率,结合管道技术提升效率,通过生产者消费者模式解耦业务逻辑... 目录避免频繁发送 验证码1. www.chinasem.cn避免频繁发送 验证码逻辑分析2. 避免频繁

精选20个好玩又实用的的Python实战项目(有图文代码)

《精选20个好玩又实用的的Python实战项目(有图文代码)》文章介绍了20个实用Python项目,涵盖游戏开发、工具应用、图像处理、机器学习等,使用Tkinter、PIL、OpenCV、Kivy等库... 目录① 猜字游戏② 闹钟③ 骰子模拟器④ 二维码⑤ 语言检测⑥ 加密和解密⑦ URL缩短⑧ 音乐播放

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

C语言中%zu的用法解读

《C语言中%zu的用法解读》size_t是无符号整数类型,用于表示对象大小或内存操作结果,%zu是C99标准中专为size_t设计的printf占位符,避免因类型不匹配导致错误,使用%u或%d可能引发... 目录size_t 类型与 %zu 占位符%zu 的用途替代占位符的风险兼容性说明其他相关占位符验证示

深度解析Spring Security 中的 SecurityFilterChain核心功能

《深度解析SpringSecurity中的SecurityFilterChain核心功能》SecurityFilterChain通过组件化配置、类型安全路径匹配、多链协同三大特性,重构了Spri... 目录Spring Security 中的SecurityFilterChain深度解析一、Security

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买