目标检测任务数据集介绍-MS COCO数据集

2024-08-28 13:38

本文主要是介绍目标检测任务数据集介绍-MS COCO数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文简要介绍了COCO数据集的下载、数据内容及使用API接口。比较冗长,适合入门了解。

MS COCO数据集简介

  • 简介
  • 数据下载
    • 2014 Train/Val
    • 2017 Train/Val
  • 数据内容与格式
    • 2014Train/Val
  • 使用接口

简介

MS COCO全称Microsoft Common Objects in Context,是一个包含了目标检测、分割、字幕的数据集。包含了以下特点:目标分割、情景中的识别、超像素Stuff分割(相较于Thing Class,即人、汽车、大象这类目标为主的目标检测任务,此任务更专注于Stuff Class,即草、墙、天空此类目标)、33万幅影像(其中超过20万幅有标注信息)、150万对象实例,80个object类别,91个stuff类别,每个影像5个字幕,25万个标注了关键点的人体目标。
官网地址:http://cocodataset.org(可能需要科学上网)。
在这里插入图片描述
打开官网后,依次浏览Dataset,Tasks,Evaluate可以看到数据集,比赛任务、以及提交结果的格式及提交方式等内容。我们最关心的是数据的下载数据内容与格式使用方法,按照这个顺序依次来了解该数据集。
在这里插入图片描述

数据下载

点击Dataset->Download可以看到有数据使用的API接口、Images影像数据、Annotations标注数据。
在这里插入图片描述
在概览中可以看到主要有2014和2017两个数据集,2014年的数据用于Detection(目标检测)、Captioning(字幕标注)、Keypoints(关键点检测)三个任务中,而2017年的数据在此基础之上,多了Stuff和Panoptic分割任务,因此2017年多了Stuff和Panoptic两种annotations标注数据。
在这里插入图片描述

2014 Train/Val

分别点击2014 Train images、2014 Val images、2014 Train/Val Annotations,下载2014年训练影像、验证影像、训练和验证标签,Test测试影像用于比赛,没有标注信息,在平时自己玩模型训练和测试时不需要,可不下载。
在这里插入图片描述
下载完后的压缩包:
在这里插入图片描述

2017 Train/Val

2017的数据相比于2014的数据,多了Stuff annotations(stuff类别分割标签)与Panoptic annotations(全景分割)的标签数据。在Download页面,分别点击2017 Train images、2017 Val images、2017 Train/Val annotations、2017 Stuff Tran/Val annotations、2017 Panoptic Train/Val annotations下载2017数据的训练/验证影像、训练/验证影像的目标检测标签、Stuff类别标签、全景分割标签。
在这里插入图片描述
下载后的压缩包:
在这里插入图片描述

数据内容与格式

标注数据集主要就两部分内容,影像数据和标注数据,我们使用数据时最关心的就是标注数据的格式与内容,在此以2014的数据为例,介绍COCO数据集的标注格式。

2014Train/Val

分别解压2014Train/Val/Annotations数据后得到train2014,val2014,annotations三个文件夹,其中train2014中存有82783张图片,val2014中存有40504张图片,图片格式均为jpg格式。
图片示例:
在这里插入图片描述
Annotations文件夹中就是最重要的标注数据,cations,instances,person_keypoints依次为字幕、目标检测、人体关键点的标注信息,本文主要关注目标检测的内容,以instance_train2014.json文件中的内容说明记录标注的格式。
在这里插入图片描述
在COCO官网,点击Evaluate->Data Format

这篇关于目标检测任务数据集介绍-MS COCO数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1114919

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

5 种使用Python自动化处理PDF的实用方法介绍

《5种使用Python自动化处理PDF的实用方法介绍》自动化处理PDF文件已成为减少重复工作、提升工作效率的重要手段,本文将介绍五种实用方法,从内置工具到专业库,帮助你在Python中实现PDF任务... 目录使用内置库(os、subprocess)调用外部工具使用 PyPDF2 进行基本 PDF 操作使用

C#自动化实现检测并删除PDF文件中的空白页面

《C#自动化实现检测并删除PDF文件中的空白页面》PDF文档在日常工作和生活中扮演着重要的角色,本文将深入探讨如何使用C#编程语言,结合强大的PDF处理库,自动化地检测并删除PDF文件中的空白页面,感... 目录理解PDF空白页的定义与挑战引入Spire.PDF for .NET库核心实现:检测并删除空白页

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

Spring定时任务之fixedRateString的实现示例

《Spring定时任务之fixedRateString的实现示例》本文主要介绍了Spring定时任务之fixedRateString的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录从毫秒到 Duration:为何要改变?核心:Java.time.Duration.parse

Oracle Scheduler任务故障诊断方法实战指南

《OracleScheduler任务故障诊断方法实战指南》Oracle数据库作为企业级应用中最常用的关系型数据库管理系统之一,偶尔会遇到各种故障和问题,:本文主要介绍OracleSchedul... 目录前言一、故障场景:当定时任务突然“消失”二、基础环境诊断:搭建“全局视角”1. 数据库实例与PDB状态2

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池