【Tools】一个绘制决策树的工具——graphviz,但你忽视了它的其他功能!

2024-02-03 09:59

本文主要是介绍【Tools】一个绘制决策树的工具——graphviz,但你忽视了它的其他功能!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

摘要: 数据可视化一直各行各业的一个重点,除了matplotlib之外,还可以使用graphviz软件绘制流程图,决策树等图形,并且还可以扩展到更多的图形,如结构句法树等,大脑风暴吧。

关键词: 数据可视化,graphviz

前言

数据可视化一直各行各业的一个重点。在机器学习中,常规的数据可视化使用matplotlib包就基本可以解决了,如果还不够的话可以使用seaborn进行补充。但是对于决策树算法以及一些集成算法来说matplotlib就显得力不从心了。人们就开始选择其他工具显示相关数据了,到目前为止我所知的就是Graphviz了。

1 Graphviz简介

Graphviz是开源的图形可视化软件。它有几个主要的图形布局程序。它还具有Web和交互式图形界面,以及辅助工具,库和语言绑定。Graphviz布局程序以简单的文本语言描述图形,并以几种有用的格式制作图形,例如用于网页的图像和SVG,用于PDF或其他文档。或在交互式图形浏览器中显示。 (Graphviz还支持XML方言GXL。)Graphviz具有用于具体图表的许多有用功能,例如颜色,字体,表格节点布局,线型,超链接和自定义形状的选项。

2 安装与环境配置

1.软件下载与环境配置: https://www.graphviz.org/download/,该软件支持Linux、Mac、Windows系统,可根据自己的电脑选择安装。环境就是就bin目录配置环境变量(path里)即可。

2.Python包安装 : 安装graphviz模块 pip install graphvize

3 决策树绘制

绘制一个决策树的案例如下:

from imageio import imread
import matplotlib.pyplot as plt
import graphviz# 创建树对象
mygraph = graphviz.Digraph(node_attr={'shape': 'box'},edge_attr={'labeldistance': "10.5"},format="png")
# 构建节点
mygraph.node("0", "Has feathers?")
mygraph.node("1", "Can fly?")
mygraph.node("2", "Has fins?")
mygraph.node("3", "Hawk")
mygraph.node("4", "Penguin")
mygraph.node("5", "Dolphin")
mygraph.node("6", "Bear")# 构建边
mygraph.edge("0", "1", label="True")
mygraph.edge("0", "2", label="False")
mygraph.edge("1", "3", label="True")
mygraph.edge("1", "4", label="False")
mygraph.edge("2", "5", label="True")
mygraph.edge("2", "6", label="False")
# 渲染
mygraph.render("decisionTree")# 图形显示
ax = plt.gca()                # 获取图形坐标轴
ax.imshow(imread("decisionTree.png"))  # 读取生成的图片
ax.set_axis_off()             # 图形不嫌弃是坐标
plt.show()                    # 显示图形

最后会生成一个decisionTree.png决策树图片如下:

从上图可以看出图片不是很清晰,我们可以生成其他高清矢量图格式,如svg、pdf等。在创建树对象时,设置format=“pdf”,即可,主要代码如下:

mygraph = graphviz.Digraph(node_attr={'shape': 'box'},edge_attr={'labeldistance': "10.5"},format="pdf")

注: 这时就不要使用matplotlib打开图片了。
pdf高清文件图如下:

4 其他图形拓展

上面绘制了决策树,其实我们也可以拓展绘制结构句法树,这也是比较简单的,

from imageio import imread
import matplotlib.pyplot as plt
import graphvizax = plt.gca()
mygraph = graphviz.Graph(node_attr={'shape': 'none'},edge_attr={'labeldistance': "10.5"},format="pdf")mygraph.node("0", "S")   # 节点
mygraph.node("1", "N")
mygraph.edge("0", "1")   # 边
mygraph.node("2", "小李", fontname="Microsoft YaHei")
mygraph.edge("1", "2")mygraph.node("3", "VP")
mygraph.node("4", "DP")
mygraph.edge("0", "3")
mygraph.edge("3", "4")mygraph.node("5", "D")
mygraph.node("6", "U")
mygraph.edge("4", "5")
mygraph.edge("4", "6")mygraph.node("7", "远远", fontname="Microsoft YaHei")
mygraph.node("8", "地", fontname="Microsoft YaHei")
mygraph.edge("5", "7")
mygraph.edge("6", "8")mygraph.node("9", "VP")
mygraph.edge("3", "9")mygraph.node("10", "V")
mygraph.node("11", "CS")
mygraph.edge("9", "10")
mygraph.edge("9", "11")mygraph.node("12", "看见", fontname="Microsoft YaHei")
mygraph.edge("10", "12")mygraph.node("13", "N")
mygraph.node("14", "VP")
mygraph.edge("11", "13")
mygraph.edge("11", "14")mygraph.node("15", "小王", fontname="Microsoft YaHei")
mygraph.edge("13", "15")mygraph.node("16", "PP")
mygraph.node("17", "V")
mygraph.edge("14", "16")
mygraph.edge("14", "17")mygraph.node("18", "看书", fontname="Microsoft YaHei")
mygraph.edge("17", "18")mygraph.node("19", "P")
mygraph.node("20", "NP")
mygraph.edge("16", "19")
mygraph.edge("16", "20")mygraph.node("21", "在", fontname="Microsoft YaHei")
mygraph.edge("19", "21")mygraph.node("22", "N")
mygraph.node("23", "F")
mygraph.edge("20", "22")
mygraph.edge("20", "23")mygraph.node("24", "草地", fontname="Microsoft YaHei")
mygraph.node("25", "上", fontname="Microsoft YaHei")mygraph.edge("22", "24")
mygraph.edge("23", "25")
mygraph.render("tmp")

绘制结果如下:

总体来说还是可以接受的。当然这个是一个点一个点连的,在实际中则需要利用树这种数据结构的相关算法进行处理,快速绘制处相关图形。
当然还可以绘制其他图形,例如:


这里就不作演示,可以参考官方文档!

总结

Graphviz是开源的图形可视化软件,不仅仅可以绘制决策树,还可以更多的无向图和有向图,Graphviz提供了很多图形供我们组合以及不同的线条,颜色等,可以充分发挥我们的想象去思考如何构建我们图形,例如自动机转换图等。除此之外,Graphviz提供的接口比较多,能够导出的结果也是多种多样,能够满足我们常用的需求。

这篇关于【Tools】一个绘制决策树的工具——graphviz,但你忽视了它的其他功能!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/673796

相关文章

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

Qt使用QSqlDatabase连接MySQL实现增删改查功能

《Qt使用QSqlDatabase连接MySQL实现增删改查功能》这篇文章主要为大家详细介绍了Qt如何使用QSqlDatabase连接MySQL实现增删改查功能,文中的示例代码讲解详细,感兴趣的小伙伴... 目录一、创建数据表二、连接mysql数据库三、封装成一个完整的轻量级 ORM 风格类3.1 表结构

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

mysql表操作与查询功能详解

《mysql表操作与查询功能详解》本文系统讲解MySQL表操作与查询,涵盖创建、修改、复制表语法,基本查询结构及WHERE、GROUPBY等子句,本文结合实例代码给大家介绍的非常详细,感兴趣的朋友跟随... 目录01.表的操作1.1表操作概览1.2创建表1.3修改表1.4复制表02.基本查询操作2.1 SE

sqlite3 命令行工具使用指南

《sqlite3命令行工具使用指南》本文系统介绍sqlite3CLI的启动、数据库操作、元数据查询、数据导入导出及输出格式化命令,涵盖文件管理、备份恢复、性能统计等实用功能,并说明命令分类、SQL语... 目录一、启动与退出二、数据库与文件操作三、元数据查询四、数据操作与导入导出五、查询输出格式化六、实用功

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图

Golang如何用gorm实现分页的功能

《Golang如何用gorm实现分页的功能》:本文主要介绍Golang如何用gorm实现分页的功能方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录背景go库下载初始化数据【1】建表【2】插入数据【3】查看数据4、代码示例【1】gorm结构体定义【2】分页结构体