使用python开发的词云图生成器2.0

2024-05-01 18:52

本文主要是介绍使用python开发的词云图生成器2.0,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用python开发的词云图生成器2.0

  • 更新部分
  • 词云图
  • 主要三方库
  • 工具介绍和效果
    • 工具界面:
  • 代码

更新部分

1.支持选择字体;
2.支持选择词云图形状

词云图

词云图啊,简单来说,它可以把文本数据中的高频关键词变成不同大小、颜色的词汇,然后像云朵一样聚集在一起。如下图所示:
在这里插入图片描述
在这里插入图片描述

主要三方库

  • pyqt开发gui界面
  • jieba库进行分词
  • matplotlib库展示词云图
  • wordcloud库生成词云图

工具介绍和效果

工具界面:

在这里插入图片描述

代码

"""
楷体:simkai.ttf
隶书:SIMLI.TTF
宋体:simsun.ttc
黑体:simhei.ttf
微软雅黑:msyh.ttc"""
import sys
from PyQt5.QtWidgets import QApplication, QWidget, QVBoxLayout, QHBoxLayout, QPushButton, QSizePolicy, QFileDialog, \QColorDialog, QComboBox
from matplotlib.backends.backend_qt5agg import FigureCanvasQTAgg as FigureCanvas
from matplotlib.figure import Figure
from wordcloud import WordCloud
import jieba
import numpy as np
from PIL import Imageclass MainWindow(QWidget):def __init__(self):super().__init__()self.color_code = Noneself.mask_shape = Noneself.ch_font = Noneself.initUI()def initUI(self):self.font_dict = {'楷体': 'simkai.ttf', '隶书': 'SIMLI.TTF', '宋体': 'simsun.ttc', '黑体': 'simhei.ttf','微软雅黑': 'msyh.ttc'}# 创建布局vbox = QVBoxLayout()# 第一部分:横向排列的四个按钮button_list = ["选择文本", "选择停用词", "选择背景颜色", "导出词云图", "选择词云图形状", "选择字体"]self.font_type = QComboBox(self)# 遍历字典的键,并将它们添加到 QComboBox 中for key in self.font_dict:self.font_type.addItem(key)hbox1 = QHBoxLayout()for i in range(6):btn = QPushButton(button_list[i])if button_list[i] == "选择文本":btn.clicked.connect(self.openTextFile)elif button_list[i] == "选择停用词":btn.clicked.connect(self.openStopWordsFile)elif button_list[i] == "选择背景颜色":btn.setObjectName("选择背景颜色")btn.clicked.connect(self.selectBackgroundColor)elif button_list[i] == "选择词云图形状":btn.setObjectName("选择词云图形状")btn.clicked.connect(self.open_mask_img)else:btn.clicked.connect(self.save_wordcloud_image)hbox1.addWidget(btn)hbox1.addWidget(self.font_type)vbox.addLayout(hbox1)# 第二部分:一个按钮btn_single = QPushButton('更新词云图')btn_single.clicked.connect(self.update_wordcloud)  # 连接点击事件vbox.addWidget(btn_single)# 第三部分:matplotlib绘制的折线图(假设MatplotlibCanvas已定义)self.fig = Figure(figsize=(8, 8), dpi=100)self.axes = self.fig.add_subplot(111)self.canvas = FigureCanvas(self.fig)vbox.addWidget(self.canvas)  # 将画布添加到布局中# 设置窗口属性self.setLayout(vbox)self.setWindowTitle('词云图生成器V2.0')self.setGeometry(500, 300, 800, 640)self.show()def open_mask_img(self):options = QFileDialog.Options()options |= QFileDialog.DontUseNativeDialogfileName, _ = QFileDialog.getOpenFileName(self, "选择词云图形状", "","Image Files (*.png *.xpm *.jpg *.jpeg)",options=options)if fileName:self.mask_shape = np.array(Image.open(fileName))def save_wordcloud_image(self):options = QFileDialog.Options()options |= QFileDialog.DontUseNativeDialogfileName, _ = QFileDialog.getSaveFileName(self, "保存词云图", "","PNG Files (*.png);;JPG Files (*.jpg);;All Files (*)",options=options)if fileName:self.fig.savefig(fileName, dpi=100, bbox_inches='tight')print(f"词云图已保存为 {fileName}")def update_wordcloud(self):# 字体选择selected_text = self.font_type.currentText()# 使用字典的键来检索对应的值self.ch_font = self.font_dict[selected_text]# 使用jieba进行分词word_list = jieba.cut(self.text, cut_all=False)words = " ".join(word_list)# 设置matplotlib使用支持中文的字体# 创建WordCloud对象并生成词云图print(self.color_code)wordcloud = WordCloud(width=800, height=800,background_color=self.color_code if self.color_code is not None else "white", \stopwords=None, font_path=self.ch_font if self.ch_font is not None else 'msyh.ttc',mask=self.mask_shape if self.mask_shape is not None else None).generate(words)# 清除之前的图像并绘制新的词云图self.axes.clear()self.axes.imshow(wordcloud, interpolation='bilinear')self.axes.axis("off")self.canvas.draw()def openTextFile(self):"""打开文件选择对话框,选择文本文件"""self.file_path, _ = QFileDialog.getOpenFileName(self, "选择文本文件", "", "Text Files (*.txt)")if self.file_path:  # 确保文件路径不为空with open(self.file_path, 'r', encoding='utf-8') as file:  # 读取文本文件内容self.text = file.read()# 自动更新词云图else:print("未选择文件")def openStopWordsFile(self):"""打开文件选择对话框,选择停用词文件"""file_path, _ = QFileDialog.getOpenFileName(self, "选择停用词文件", "", "Text Files (*.txt)")# 这里添加处理文件路径的逻辑with open(file_path, 'r', encoding='utf-8') as f:stopwords = set(f.read().splitlines())print(stopwords)def selectBackgroundColor(self):"""打开颜色选择器,选择背景颜色"""color = QColorDialog.getColor()if color.isValid():# 更新按钮文本为颜色代码self.color_code = color.name()button = self.findChild(QPushButton, "选择背景颜色")button.setText(self.color_code)# 更新按钮文本颜色button.setStyleSheet(f"color: {self.color_code};")# 这里添加使用所选颜色的逻辑if __name__ == '__main__':app = QApplication(sys.argv)ex = MainWindow()sys.exit(app.exec_())

这篇关于使用python开发的词云图生成器2.0的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/952425

相关文章

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

基于Python打造一个智能单词管理神器

《基于Python打造一个智能单词管理神器》这篇文章主要为大家详细介绍了如何使用Python打造一个智能单词管理神器,从查询到导出的一站式解决,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 项目概述:为什么需要这个工具2. 环境搭建与快速入门2.1 环境要求2.2 首次运行配置3. 核心功能使用指

Python实现微信自动锁定工具

《Python实现微信自动锁定工具》在数字化办公时代,微信已成为职场沟通的重要工具,但临时离开时忘记锁屏可能导致敏感信息泄露,下面我们就来看看如何使用Python打造一个微信自动锁定工具吧... 目录引言:当微信隐私遇到自动化守护效果展示核心功能全景图技术亮点深度解析1. 无操作检测引擎2. 微信路径智能获

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Python中pywin32 常用窗口操作的实现

《Python中pywin32常用窗口操作的实现》本文主要介绍了Python中pywin32常用窗口操作的实现,pywin32主要的作用是供Python开发者快速调用WindowsAPI的一个... 目录获取窗口句柄获取最前端窗口句柄获取指定坐标处的窗口根据窗口的完整标题匹配获取句柄根据窗口的类别匹配获取句

利用Python打造一个Excel记账模板

《利用Python打造一个Excel记账模板》这篇文章主要为大家详细介绍了如何使用Python打造一个超实用的Excel记账模板,可以帮助大家高效管理财务,迈向财富自由之路,感兴趣的小伙伴快跟随小编一... 目录设置预算百分比超支标红预警记账模板功能介绍基础记账预算管理可视化分析摸鱼时间理财法碎片时间利用财

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑