bop数据合并到COCO

2023-11-30 04:30
文章标签 数据 合并 coco bop

本文主要是介绍bop数据合并到COCO,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

bop数据合并到COCO

  • JSON转TXT
  • 重命名
  • txt文件中类别信息的转换

JSON转TXT


import json
import os,globcategories = [{"id": 12,"name": "OREO","supercategory": "icbin"},{"id": 16,"name": "Paper Cup","supercategory": "icbin"},{"id": 4,"name": "School Glue","supercategory": "icbin"},{"id": 7,"name": "Straw Cups","supercategory": "icbin"},{"id": 9,"name": "Highland","supercategory": "icbin"},{"id": 10,"name": "Soueakair","supercategory": "icbin"},{"id": 2,"name": "Cheez-it","supercategory": "icbin"},{"id": 1,"name": "Copper Plus","supercategory": "icbin"},{"id": 8,"name": "Stir Stick","supercategory": "icbin"},{"id": 14,"name": "Stanley","supercategory": "icbin"},{"id": 3,"name": "Crayola","supercategory": "icbin"},{"id": 13,"name": "Mirado","supercategory": "icbin"},{"id": 11,"name": "Munchkin","supercategory": "icbin"},{"id": 6,"name": "Greenies","supercategory": "icbin"},{"id": 5,"name": "White Board Cake","supercategory": "icbin"},{"id": 15,"name": "Main Arm","supercategory": "icbin"}]def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = box[0] + box[2] / 2.0y = box[1] + box[3] / 2.0w = box[2]h = box[3]x = x * dww = w * dwy = y * dhh = h * dhreturn (x, y, w, h)def to_yolo(data_path):json_path=data_path+'/scene_gt_coco.json' save_path = data_path+ '/labels/'json_file =   json_path # COCO Object Instance 类型的标注ana_txt_save_path = save_path  # 保存的路径data = json.load(open(json_file, 'r'))if not os.path.exists(ana_txt_save_path):os.makedirs(ana_txt_save_path)id_map = {} # coco数据集的id不连续!重新映射一下再输出!print(data['categories'])# # categories = sorted(data['categories'], key=lambda x: x['id'])for i, category in enumerate(categories): # id_map[category['id']] = int(category['id'])id_map[category['id']] = i# 通过事先建表来降低时间复杂度max_id = 0for img in data['images']:max_id = max(max_id, img['id'])# 注意这里不能写作 [[]]*(max_id+1),否则列表内的空列表共享地址img_ann_dict = [[] for i in range(max_id+1)] for i, ann in enumerate(data['annotations']):img_ann_dict[ann['image_id']].append(i)for img in data['images']:filename = img["file_name"]img_width = img["width"]img_height = img["height"]img_id = img["id"]head, tail = os.path.splitext(filename)ana_txt_name = head.split('/')[-1] + ".txt"  # 对应的txt名字,与jpg一致f_txt = open(os.path.join(ana_txt_save_path, ana_txt_name), 'w')'''for ann in data['annotations']:if ann['image_id'] == img_id:box = convert((img_width, img_height), ann["bbox"])f_txt.write("%s %s %s %s %s\n" % (id_map[ann["category_id"]], box[0], box[1], box[2], box[3]))'''# 这里可以直接查表而无需重复遍历for ann_id in img_ann_dict[img_id]:ann = data['annotations'][ann_id]box = convert((img_width, img_height), ann["bbox"])f_txt.write("%s %s %s %s %s\n" % (id_map[ann["category_id"]], box[0], box[1], box[2], box[3]))f_txt.close()print(f'==> coco to yolo images:{len(data["images"])}, save path: {save_path}')def train_val_test(data_path):sets = ['train','val','test']#生成txt的文件名称image_ids = glob.glob(os.path.join(data_path, 'images', '*.jpg'))train_ratio = 0.7  # 训练集比例val_ratio = 0.2  # 验证集比例test_ratio = 0.1  # 测试集比例train_size = int(len(image_ids) * train_ratio)val_size = int(len(image_ids) * val_ratio)test_size = len(image_ids) - train_size - val_sizedata  = [image_ids[:train_size], image_ids[train_size:train_size + val_size], image_ids[train_size + val_size:]]for i, image_set in enumerate(sets):image_ids = data[i]list_file = open(data_path+'/%s.txt' % (image_set), 'w')for image_id in image_ids:image_id = image_id.replace('/rgb','/images')list_file.write(image_id + "\n")# convert_annotation(image_id)# 关闭文件list_file.close()print(f'==> train image: {train_size}')print(f'==> valid image: {val_size}')print(f'==> test  image: {test_size}')if __name__ == '__main__':data_path = 'H:/Dataset/COCO/train_pbr/000002'to_yolo(data_path)train_val_test(data_path)# print([cat['name'] for cat in categories])

在这里插入图片描述

重命名

以00000061*开头

在这里插入图片描述

txt文件中类别信息的转换

加79(从0开始,80类的COCO)

import codecs
import ospath = 'H:/Dataset/COCO/train_pbr/000002/labelNew/'  # 标签文件train路径
m = os.listdir(path)
# 读取路径下的txt文件
for n in range(0, len(m)):t = codecs.open('H:/Dataset/COCO/train_pbr/000002/labelNew/' + m[n], mode='r', encoding='utf-8')line = t.readline()  # 以行的形式进行读取文件list1 = []while line:a = line.split()list1.append(a)line = t.readline()t.close()lt = open('H:/Dataset/COCO/train_pbr/000002/labelNew/' + m[n], "w")for num in range(0, len(list1)):list1[num][0] = str(int(list1[num][0])+79)  # 第一列为0时,将0改为1lt.writelines(' '.join(list1[num]) + '\n')  # 每个元素以空格间隔,一行元素写完并换行lt.close()print(m[n] + " 修改完成")

在这里插入图片描述

在这里插入图片描述

这篇关于bop数据合并到COCO的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/435616

相关文章

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核