Python工具箱系列(五十一)

2024-03-29 22:36

本文主要是介绍Python工具箱系列(五十一),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

九宫格与词云

对图片进行九宫格切割,并且放到微信朋友圈曾经风靡一时。对于python来说,这个也非常简单。

from PIL import Image
import mathdef ninerectanglegrid(inputfilename):"""实现九宫格切割Args:inputfilename (string): 输入文件名称"""cols = 3rows = 3# 原图im = Image.open(inputfilename)# 计算缩放比例width, height = im.size# 选取原图片长、宽中较大值作为新图片的九宫格半径new_image_length = width if width > height else height# 产生一张白底新图,并且是正方形new_image = Image.new(im.mode, (new_image_length, new_image_length), color='white')# 将原图粘贴在新图上,位置为居中if width > height:new_image.paste(im, (0, int((new_image_length - height) / 2)))else:new_image.paste(im, (int((new_image_length - width) / 2), 0))targetwidth = math.ceil(new_image_length/cols)targetheight = math.ceil(new_image_length/rows)# cutfor row in range(rows):for col in range(cols):box = (targetwidth*col,targetheight*row,targetwidth*(col+1),targetheight*(row+1))out = new_image.crop(box)out.save(f'{row*cols+col}.png')ninerectanglegrid(r'd:\test\girl.png')

运行后会将源图片直接切割成为9个图片文件。将它们上传到微信后,就可以组成九宫格图片了,其效果如下图所示。

从效果图中可以看出,如果切割点在头部附近会有一些失真的感觉。所以九宫格这种形式还是适合于二次元图片。

词云

在数据可视化方面,词云一直是一种视觉冲击力很强的方式。对输入的一段文字进行语义分割,得到不同频度的词汇,然后以正比于词频的字体大小无规则的集中显示高频词,简洁直观高效。如果仅仅是偶然一用,使用在线的词云生成工具即可。网上搜索词云在线生成工具,会得到很多结果,包括国内外的网站平台都有。对比了搜索较为靠前的几款在线工具,但或多或少都存在一些使用上瑕疵,有的是网页加载慢,有的是要注册后方可使用,有的是字体支持较差,还有的是要付费使用。尤其是各类注册,更是让人担心个人信息安全的问题。所以,坐而论道,不如起而行之,自己制作词云。主要工具有以下:

•wordcloud

•PyEcharts

•stylecloud

以下代码演示了词云生成。

import osimport jieba
import numpy as np
from PIL import Image
from wordcloud import WordCloud# 写入用户定义的词,主要是人名/地名等专用的词
userdict_list = ['洛迦诺','莱茵兰','苏台德','特申','卢西尼亚']def jieba_processing_txt(text,stopwordsfilename):"""使用jieba进行更好的分词Args:text (string): 要处理的文本Returns:string: 分好的词"""for word in userdict_list:jieba.add_word(word)mywordlist = []seg_list = jieba.cut(text, cut_all=False)liststr = "/ ".join(seg_list)with open(stopwords_path, encoding='utf-8') as f_stop:f_stop_text = f_stop.read()f_stop_seg_list = f_stop_text.splitlines()for myword in liststr.split('/'):if not (myword.strip() in f_stop_seg_list) and len(myword.strip()) > 1:mywordlist.append(myword)return ' '.join(mywordlist)def create_wordcloud(inputfilelist=None,backimg=None,fontname=None,stopwordsfilename=None):"""生成词云Args:inputfile (string, optional): 要处理的文档backimg (string, optional): 背景图fontname (string, optional): 字体文件stopwordsfilename (string, optional): 停词表outputfilename (string, optional): 要输出的词云图片"""for index,inputfile in enumerate(inputfilelist):text = open(inputfile,encoding='utf-8').read()keywords = jieba_processing_txt(text,stopwordsfilename)shape_mask = np.array(Image.open(backimg))wc = WordCloud(background_color="white",max_words=2000,font_path=fontname,  # 设置字体格式,如不设置显示不了中文mask=shape_mask)wc.generate(keywords)wc.to_file(f'd:\\test\\wordcloud-{index}.png')startdir = r'd:\test'back_image = f'{startdir}\\black.jpg'
textfilename1 = f'{startdir}\\alice.txt'
textfilename2 = f'{startdir}\\历史的抉择.txt'
cn_font = f'{startdir}\\SourceHanSerifK-Light.otf'
stopwords_path = f'{startdir}\\stopwords_cn_en.txt'inputlist = [textfilename1,textfilename2]
create_wordcloud(inputlist,back_image,cn_font,stopwords_path)

词云的效果如下图所示。

其中:

•black.jpg提供背景,随意替换

•alice.txt是英文小说,随意替换

•历史的抉择.txt是一个中文的政论文,随意替换

•SourceHanSerifK-Light.otf是一个中文字体文件,可以随意替换为自己喜欢的字体文件

•stopwords_cn_en.txt是一个包含了中英文的停词表,用于分词,在网上可以查到​​​​

这篇关于Python工具箱系列(五十一)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/859819

相关文章

Python中Json和其他类型相互转换的实现示例

《Python中Json和其他类型相互转换的实现示例》本文介绍了在Python中使用json模块实现json数据与dict、object之间的高效转换,包括loads(),load(),dumps()... 项目中经常会用到json格式转为object对象、dict字典格式等。在此做个记录,方便后续用到该方

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)

Ubuntu如何升级Python版本

《Ubuntu如何升级Python版本》Ubuntu22.04Docker中,安装Python3.11后,使用update-alternatives设置为默认版本,最后用python3-V验证... 目China编程录问题描述前提环境解决方法总结问题描述Ubuntu22.04系统自带python3.10,想升级

Python自动化处理PDF文档的操作完整指南

《Python自动化处理PDF文档的操作完整指南》在办公自动化中,PDF文档处理是一项常见需求,本文将介绍如何使用Python实现PDF文档的自动化处理,感兴趣的小伙伴可以跟随小编一起学习一下... 目录使用pymupdf读写PDF文件基本概念安装pymupdf提取文本内容提取图像添加水印使用pdfplum

Python 基于http.server模块实现简单http服务的代码举例

《Python基于http.server模块实现简单http服务的代码举例》Pythonhttp.server模块通过继承BaseHTTPRequestHandler处理HTTP请求,使用Threa... 目录测试环境代码实现相关介绍模块简介类及相关函数简介参考链接测试环境win11专业版python

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言:二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模