记录::关键点检测数据转化和可视化LSP、FLIC转yolov8-pose的txt

2024-01-19 18:04

本文主要是介绍记录::关键点检测数据转化和可视化LSP、FLIC转yolov8-pose的txt,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近想试一下关键点检测的效果,先从yolov8-pose开始,不想跑coco那么大的数据集,就找了两个比较小的

yolov8-pose的txt数据格式如下:

        类别、box、节点,数据做了归一化

可视化只显示了点,没有连线

参数:

        mat_path 是 数据集mat文件所在地址,包含mat文件名
        image_path 是 数据集图像的地址,不包含图像名
        save_path 是 转换为txt后保存的地址
        save_path 是可视化结果保存的地址

1、lsp

LSP:运动场景,单人数据集,截取后的单人区域,图片很小,2000张图片,14个节点

def save_joints_lsp(mat_path, image_path, save_path,save_path1):"""mat_path 是 lsp数据集mat文件所在地址,包含mat文件名image_path 是 lsp数据集图像的地址,不包含图像名save_path 是 转换为txt后保存的地址save_path 是可视化结果保存的地址lsp数据集共2000张图片"""joints = loadmat(mat_path)joints = joints["joints"].transpose(2, 0, 1)joints = joints[:, :, :]#num = 0for img_path in glob.glob("%s/*.jpg" % image_path):img_name = img_path.split("/")[-1].split(".")[0]img = Image.open(img_path)img = np.array(img, dtype=np.uint8)img = cv2.cvtColor(img, cv2.COLOR_RGB2BGR)imgh, imgw = img.shape[:2]num = int(img_name[2:])cen_points = joints[num-1, ...]points_num = cen_points.shape[-1]point_dict = {}ps = []for points_ in range(points_num):point_x = cen_points[0, points_]point_y = cen_points[1, points_]vi = cen_points[2, points_]if vi==0:vi = 2.0elif vi==2:print(name)point_dict[str(points_)] = [point_x/imgw, point_y/imgh,vi]# cv2.circle(img, (int(point_x), int(point_y)), 5, colors[points_],#                   thickness=-1)ps.append([int(point_x), int(point_y)])# x, y, w, h = cv2.boundingRect(np.array([ps]))# x = (x+w/2)/imgw# y = (y+h/2)/imgh# w = (w+6)/imgw# h = (h+6)/imghx =0.5y = 0.5w =1h=1with open(os.path.join(save_path, img_name + ".txt"), "w") as f:f.write(str(0)+" "+str(x)+" "+str(y)+" "+str(w)+" "+str(h))cv2.rectangle(img,(int(x*imgw-w*imgw/2),int(y*imgh-h*imgh/2)),(int(x*imgw+w*imgw/2),int(y*imgh+h*imgh/2)),(0,0,255),5)for i in point_dict:p = point_dict[i]f.write(" "+str(p[0]) + " " + str(p[1]) + " " + str(p[2]))cv2.circle(img, (int(p[0]*imgw), int(p[1]*imgh)), 5, colors[points_],thickness=-1)f.write("\n")#img_txt.write(str(point_dict))f.close()#num += 1# 若不想看图片中关键点的位置是否准确,请注释掉后面两行# cv2.imshow("img", img)# cv2.waitKey()cv2.imwrite(save_path1+"/"+img_name+".jpg",img)

2、FLIC

FLIC:电影场景,多人情况下label也只有单人,labels有29个节点,大多为nan,选了9个节点

def save_flic(mat_path, image_path, save_path,save_path1):examples = loadmat(mat_path)examples = examples["examples"][0]joint_ids = ['lsho', 'lelb', 'lwri', 'rsho', 'relb', 'rwri', 'lhip','lkne', 'lank', 'rhip', 'rkne', 'rank', 'leye', 'reye','lear', 'rear', 'nose', 'msho', 'mhip', 'mear', 'mtorso','mluarm', 'mruarm', 'mllarm', 'mrlarm', 'mluleg', 'mruleg','mllleg', 'mrlleg']available = ['lsho', 'lelb', 'lwri', 'rsho', 'relb', 'rwri', 'lhip','rhip', 'head']for i, example in enumerate(examples):joint = example[2].Timg_name = example[3][0]joints = dict(zip(joint_ids, joint))img =cv2.imread(image_path+"/"+img_name)img_name = img_name.split(".")[0]imgh, imgw = img.shape[:2]point_dict = {}ps = []head = np.asarray(joints['reye']) + \np.asarray(joints['leye']) + \np.asarray(joints['nose'])head /= 3joints['head'] = head.tolist()for name in available:#joint_pos.append(joints[name])point = joints[name]point_dict[name] = [point[0]/imgw, point[1]/imgh,2.0]ps.append([int(point[0]), int(point[1])])x, y, w, h = cv2.boundingRect(np.array([ps]))x = (x+w/2)/imgwy = (y+h/2)/imghw = (w+20)/imgwh = (h+20)/imghwith open(os.path.join(save_path, img_name + ".txt"), "w") as f:f.write(str(0) + " " + str(x) + " " + str(y) + " " + str(w) + " " + str(h))cv2.rectangle(img, (int(x * imgw - w * imgw / 2), int(y * imgh - h * imgh / 2)),(int(x * imgw + w * imgw / 2), int(y * imgh + h * imgh / 2)),(0, 0, 255), 5)c =0for i in point_dict:p = point_dict[i]f.write(" " + str(p[0]) + " " + str(p[1]) + " " + str(p[2]))cv2.circle(img, (int(p[0] * imgw), int(p[1] * imgh)), 5, colors[c],thickness=-1)f.write("\n")c = c+1# img_txt.write(str(point_dict))f.close()# num += 1# 若不想看图片中关键点的位置是否准确,请注释掉后面两行# cv2.imshow("img", img)# cv2.waitKey()cv2.imwrite(save_path1 + "/" + img_name + ".jpg", img)

完整代码:https://github.com/ziyaoma/detect-pose

参考:LSP数据集与MPII数据集标签转txt文件(字典形式储存)_mpii标注文件修改成txt-CSDN博客

https://github.com/Fangyh09/PoseDatasets

这篇关于记录::关键点检测数据转化和可视化LSP、FLIC转yolov8-pose的txt的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/623229

相关文章

Java如何根据word模板导出数据

《Java如何根据word模板导出数据》这篇文章主要为大家详细介绍了Java如何实现根据word模板导出数据,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... pom.XML文件导入依赖 <dependency> <groupId>cn.afterturn</groupId>

Python实现获取带合并单元格的表格数据

《Python实现获取带合并单元格的表格数据》由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,所以本文我们就来聊聊如何使用Python实现获取带合并单元格的表格数据吧... 由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,现将将封装成类,并通过调用list_exc

Mysql数据库中数据的操作CRUD详解

《Mysql数据库中数据的操作CRUD详解》:本文主要介绍Mysql数据库中数据的操作(CRUD),详细描述对Mysql数据库中数据的操作(CRUD),包括插入、修改、删除数据,还有查询数据,包括... 目录一、插入数据(insert)1.插入数据的语法2.注意事项二、修改数据(update)1.语法2.有

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、

Spring Validation中9个数据校验工具使用指南

《SpringValidation中9个数据校验工具使用指南》SpringValidation作为Spring生态系统的重要组成部分,提供了一套强大而灵活的数据校验机制,本文给大家介绍了Spring... 目录1. Bean Validation基础注解常用注解示例在控制器中应用2. 自定义约束验证器定义自

C#实现高性能Excel百万数据导出优化实战指南

《C#实现高性能Excel百万数据导出优化实战指南》在日常工作中,Excel数据导出是一个常见的需求,然而,当数据量较大时,性能和内存问题往往会成为限制导出效率的瓶颈,下面我们看看C#如何结合EPPl... 目录一、技术方案核心对比二、各方案选型建议三、性能对比数据四、核心代码实现1. MiniExcel

SQL常用操作精华之复制表、跨库查询、删除重复数据

《SQL常用操作精华之复制表、跨库查询、删除重复数据》:本文主要介绍SQL常用操作精华之复制表、跨库查询、删除重复数据,这些SQL操作涵盖了数据库开发中最常用的技术点,包括表操作、数据查询、数据管... 目录SQL常用操作精华总结表结构与数据操作高级查询技巧SQL常用操作精华总结表结构与数据操作复制表结

Redis中的数据一致性问题以及解决方案

《Redis中的数据一致性问题以及解决方案》:本文主要介绍Redis中的数据一致性问题以及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Redis 数据一致性问题的产生1. 单节点环境的一致性问题2. 网络分区和宕机3. 并发写入导致的脏数据4. 持

JavaScript时间戳与时间的转化常用方法

《JavaScript时间戳与时间的转化常用方法》在JavaScript中,时间戳(Timestamp)通常指Unix时间戳,即从1970年1月1日00:00:00UTC到某个时间点经过的毫秒数,下面... 目录1. 获取当前时间戳2. 时间戳 → 时间对象3. 时间戳php → 格式化字符串4. 时间字符