完美解决labelimg xml转可视化中文乱码问题,不用matplotlib

本文主要是介绍完美解决labelimg xml转可视化中文乱码问题,不用matplotlib,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景简述

我们有一批标注项目要转可视化,因为之前没有做过,然后网上随意找了一段代码测试完美(并没有)搞定,开始疯狂标注,当真正要转的时候傻眼了,因为测试的时候用的是英文标签,实际标注的是中文标签,结果都是一大堆??????,在这里插入图片描述
结果瞬间让我满脑袋??????,赶紧找资料解决,各种方法试了个遍,网上大多数都是用cv2+matplotlib实现的计算和渲染,所以解决的主要思想就是集中在各种显示的设置matplotlib字体,然并卵;最后找到一种另辟蹊径的办法使用PIL+cv2实现,最后完美解决,在这里插入图片描述
贴上解决代码:

import cv2
import os
import numpy as np  
from PIL import Image, ImageDraw, ImageFont
import xml.etree.ElementTree as ETdata_path = 'E:\\test\\tianjingulou'
imgs_path = os.path.join(data_path, "img")
anns_path = os.path.join(data_path, "xml")
result_path = os.path.join(data_path)img_names = set([os.path.splitext(i)[0] for i in os.listdir(imgs_path)])
ann_names = set([os.path.splitext(i)[0] for i in os.listdir(anns_path)])
img_names = list(img_names)
ann_names = list(ann_names)for i in range(len(img_names)):img_path = os.path.join(imgs_path, img_names[i] + ".jpg")img_bgr = cv2.imread(img_path)xml_path = os.path.join(anns_path, ann_names[i] + ".xml")xml_inf = open(xml_path, encoding='utf-8')tree = ET.parse(xml_inf)root = tree.getroot()bbox_color = (0, 129, 255)bbox_thickness = 2# 把rgb转成16进制'#0081FF'bbox_color_str = "#{:02x}{:02x}{:02x}".format(*bbox_color)# 把rgb转成bgr再转16进制'#FF8100'# bbox_color_rgb = bbox_color[::-1]# bbox_color_str = "#{:02x}{:02x}{:02x}".format(*bbox_color_rgb)bbox_labelstr = {'font_size': 16,'font_thickness': 2,'offset_x': 0,'offset_y': -20,}# 创建一个空白图像img_pil = Image.fromarray(cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB))draw = ImageDraw.Draw(img_pil)# 设置字体  SimHei.ttf黑体,msyh.ttf微软雅黑# 打开命令行窗口或者Anaconda Prompt,输入python,进入python解释器窗口,#   输入import matplotlib;引入可视化库;#   然后输入print(matplotlib.matplotlib_fname())打印出当前库所在位置;#   进入到上面打印出的路径下字体目录:mpl-data\\fonts\\ttf,下载中文字体放进去font_path = "D:\\ProgramData\\anaconda3\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\msyh.ttf"  # 请替换为实际路径font = ImageFont.truetype(font_path, bbox_labelstr['font_size'])# 画框和文字for obj in root.iter('object'):bbox_label = obj.find('name').textbbox_top_left_x = int(obj.find('bndbox').find('xmin').text)bbox_top_left_y = int(obj.find('bndbox').find('ymin').text)bbox_bottom_right_x = int(obj.find('bndbox').find('xmax').text)bbox_bottom_right_y = int(obj.find('bndbox').find('ymax').text)draw.rectangle([(bbox_top_left_x, bbox_top_left_y), (bbox_bottom_right_x, bbox_bottom_right_y)],outline=bbox_color, width=bbox_thickness)draw.text((bbox_top_left_x + bbox_labelstr['offset_x'], bbox_top_left_y + bbox_labelstr['offset_y']),bbox_label, font=font, fill=bbox_color_str)img_bgr = cv2.cvtColor(np.array(img_pil), cv2.COLOR_RGB2BGR)# 保存图像cv2.imwrite(result_path + "\\{}.jpg".format(img_names[i]), img_bgr)

下面是matplotlib+cv2版代码

# 数据集可视化
import cv2
import os
import matplotlib.pyplot as plt
import xml.etree.ElementTree as ET# 设置 Matplotlib 使用的字体为黑体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False imgs_path = 'E:\\test\\tianjingulou\\img'
anns_path = 'E:\\test\\tianjingulou\\xml'img_names = set([os.path.splitext(i)[0] for i in os.listdir(imgs_path)])
ann_names = set([os.path.splitext(i)[0] for i in os.listdir(anns_path)])
img_names = list(img_names)
ann_names = list(ann_names)for i in range(len(img_names)):img_path = os.path.join(imgs_path, img_names[i] + ".jpg")img_bgr = cv2.imread(img_path)xml_path = os.path.join(anns_path, ann_names[i] + ".xml")xml_inf = open(xml_path, encoding='utf-8')tree = ET.parse(xml_inf)root = tree.getroot()# 框可视化配置bbox_color = (255, 129, 0)  # 框的颜色bbox_thickness = 2  # 框的线宽# 框类别文字bbox_labelstr = {'font_size': 1,  # 字体大小'font_thickness': 2,  # 字体粗细'offset_x': 0,  # X 方向,文字偏移距离,向右为正'offset_y': -10,  # Y 方向,文字偏移距离,向下为正}
# 画框for obj in root.iter('object'):  # 一个object代表一个标注物体# 框的类别bbox_label = obj.find('name').text# 框的两点坐标# 左上角坐标bbox_top_left_x = int(obj.find('bndbox').find('xmin').text)bbox_top_left_y = int(obj.find('bndbox').find('ymin').text)# 右下角坐标bbox_bottom_right_x = int(obj.find('bndbox').find('xmax').text)bbox_bottom_right_y = int(obj.find('bndbox').find('ymax').text)# 画矩形:画框img_bgr = cv2.rectangle(img_bgr, (bbox_top_left_x, bbox_top_left_y), (bbox_bottom_right_x, bbox_bottom_right_y),bbox_color, bbox_thickness)# 写框类别文字:图片,文字字符串,文字左上角坐标,字体,字体大小,颜色,字体粗细img_bgr = cv2.putText(img_bgr, bbox_label, (bbox_top_left_x + bbox_labelstr['offset_x'],bbox_top_left_y + bbox_labelstr['offset_y']),cv2.FONT_HERSHEY_SIMPLEX, bbox_labelstr['font_size'], bbox_color,bbox_labelstr['font_thickness'])cv2.imwrite("E:\\test\\tianjingulou\\{}.jpg".format(img_names[i]), img_bgr)

写在最后,matplotlib的方式应该也有解决的办法,也可能是我的环境问题,提供这两种方式大家各取所需,下面这种方式是我从一位博主那里拷贝来稍加改动的,但是我找不到出处了,如有侵权请联系我删除。

----------------------------------------------华丽分割-------------------------------------------------
追加一种类似的写法,这个是宋体,字体可以酌情替换,亲测可用

import cv2
import os
import matplotlib.pyplot as plt
import xml.etree.ElementTree as ET
import numpy as np# 导入 PIL 库
import PIL.Image
import PIL.ImageDraw
import PIL.ImageFontdata_path = os.path.join("E:\\test\\tianjingulou")
imgs_path = os.path.join(data_path, "img")
anns_path = os.path.join(data_path, "xml")# 获取图像名称和标注名称
img_names = set(os.path.splitext(i)[0] for i in os.listdir(imgs_path))
ann_names = set(os.path.splitext(i)[0] for i in os.listdir(anns_path))
img_names = list(img_names)
ann_names = list(ann_names)# 遍历所有图像
for i, img_name in enumerate(img_names):# 读取图像img_bgr = cv2.imread(os.path.join(imgs_path, img_name + ".jpg"))# 读取标注xml_path = os.path.join(anns_path, img_name + ".xml")xml_inf = open(xml_path, encoding='utf-8')tree = ET.parse(xml_inf)root = tree.getroot()# 画框for obj in root.iter('object'):# 获取框的类别bbox_label = obj.find('name').text# 获取框的两点坐标bbox_top_left_x = int(obj.find('bndbox').find('xmin').text)bbox_top_left_y = int(obj.find('bndbox').find('ymin').text)bbox_bottom_right_x = int(obj.find('bndbox').find('xmax').text)bbox_bottom_right_y = int(obj.find('bndbox').find('ymax').text)# 画矩形img_bgr = cv2.rectangle(img_bgr, (bbox_top_left_x, bbox_top_left_y), (bbox_bottom_right_x, bbox_bottom_right_y),(255, 129, 0), 2)# 写框类别文字# 转换为 PIL 图像img_pil = PIL.Image.fromarray(img_bgr)# 使用 PIL 绘制文本font = PIL.ImageFont.truetype("simsun.ttc", 16)draw = PIL.ImageDraw.Draw(img_pil)draw.text((bbox_top_left_x, bbox_top_left_y - 18), bbox_label, font=font, fill=(255, 129, 0))# 直接使用 PIL 图像img_bgr = np.array(img_pil)# 保存图像cv2.imwrite(data_path + "\\{}.jpg".format(img_name), img_bgr)

这篇关于完美解决labelimg xml转可视化中文乱码问题,不用matplotlib的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/503357

相关文章

使用雪花算法产生id导致前端精度缺失问题解决方案

《使用雪花算法产生id导致前端精度缺失问题解决方案》雪花算法由Twitter提出,设计目的是生成唯一的、递增的ID,下面:本文主要介绍使用雪花算法产生id导致前端精度缺失问题的解决方案,文中通过代... 目录一、问题根源二、解决方案1. 全局配置Jackson序列化规则2. 实体类必须使用Long封装类3.

Idea插件MybatisX失效的问题解决

《Idea插件MybatisX失效的问题解决》:本文主要介绍Idea插件MybatisX失效的问题解决,详细的介绍了4种问题的解决方法,具有一定的参考价值,感兴趣的可以了解一下... 目录一、重启idea或者卸载重装MyBATis插件(无需多言)二、检查.XML文件与.Java(该文件后缀Idea可能会隐藏

Nginx 访问 /root/下 403 Forbidden问题解决

《Nginx访问/root/下403Forbidden问题解决》在使用Nginx作为Web服务器时,可能会遇到403Forbidden错误,文中通过示例代码介绍的非常详细,对大家的学习或者工作... 目录解决 Nginx 访问 /root/test/1.html 403 Forbidden 问题问题复现Ng

Python的pip在命令行无法使用问题的解决方法

《Python的pip在命令行无法使用问题的解决方法》PIP是通用的Python包管理工具,提供了对Python包的查找、下载、安装、卸载、更新等功能,安装诸如Pygame、Pymysql等Pyt... 目录前言一. pip是什么?二. 为什么无法使用?1. 当我们在命令行输入指令并回车时,一般主要是出现以

Nginx部署React项目时重定向循环问题的解决方案

《Nginx部署React项目时重定向循环问题的解决方案》Nginx在处理React项目请求时出现重定向循环,通常是由于`try_files`配置错误或`root`路径配置不当导致的,本文给大家详细介... 目录问题原因1. try_files 配置错误2. root 路径错误解决方法1. 检查 try_f

Python解决雅努斯问题实例方案详解

《Python解决雅努斯问题实例方案详解》:本文主要介绍Python解决雅努斯问题实例方案,雅努斯问题是指AI生成的3D对象在不同视角下出现不一致性的问题,即从不同角度看物体时,物体的形状会出现不... 目录一、雅努斯简介二、雅努斯问题三、示例代码四、解决方案五、完整解决方案一、雅努斯简介雅努斯(Janu

MySQL索引失效问题及解决方案

《MySQL索引失效问题及解决方案》:本文主要介绍MySQL索引失效问题及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql索引失效一、概要二、常见的导致MpythonySQL索引失效的原因三、如何诊断MySQL索引失效四、如何解决MySQL索引失

一文教你如何解决Python开发总是import出错的问题

《一文教你如何解决Python开发总是import出错的问题》经常朋友碰到Python开发的过程中import包报错的问题,所以本文将和大家介绍一下可编辑安装(EditableInstall)模式,可... 目录摘要1. 可编辑安装(Editable Install)模式到底在解决什么问题?2. 原理3.

Redis中的数据一致性问题以及解决方案

《Redis中的数据一致性问题以及解决方案》:本文主要介绍Redis中的数据一致性问题以及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Redis 数据一致性问题的产生1. 单节点环境的一致性问题2. 网络分区和宕机3. 并发写入导致的脏数据4. 持

vscode不能打开终端问题的解决办法

《vscode不能打开终端问题的解决办法》:本文主要介绍vscode不能打开终端问题的解决办法,问题的根源是Windows的安全软件限制了PowerShell的运行,而VSCode默认使用Powe... 遇到vscode不能打开终端问题,一直以为是安全软件限制问题,也没搜到解决方案,因为影响也不大,就没有管