Human3.6M 数据集介绍及下载

2024-02-28 05:50
文章标签 数据 介绍 下载 human3.6

本文主要是介绍Human3.6M 数据集介绍及下载,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

文章目录

    • 引言
    • 下载
    • 概述
      • 数据规模和多样性
      • 准确捕捉和同步
    • 演示
    • 角色
    • 场景
    • 数据
      • 实验环境
      • 图像数据
      • 姿势数据
    • 注意
    • 参考


引言

Human3.6M 是一个用于 3D 人体位姿估计研究的大型公开数据集,在 paperswithcode 中可以看到在此数据集上提出的各种 SOTA 算法及模型,是目前基于多视图的 3D 人体位姿研究最为重要的一个数据集,没有之一。

在这里插入图片描述

下载

在官网下载的话需要使用教育邮箱注册账号并等待审核,审核速度非常慢。这里推荐直接使用如下方式下载:

# Download H36M annotations
mkdir data
cd data
wget http://visiondata.cis.upenn.edu/volumetric/h36m/h36m_annot.tar
tar -xf h36m_annot.tar
rm h36m_annot.tar# Download H36M images
mkdir -p h36m/images
cd h36m/images
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S1.tar
tar -xf S1.tar
rm S1.tar
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S5.tar
tar -xf S5.tar
rm S5.tar
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S6.tar
tar -xf S6.tar
rm S6.tar
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S7.tar
tar -xf S7.tar
rm S7.tar
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S8.tar
tar -xf S8.tar
rm S8.tar
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S9.tar
tar -xf S9.tar
rm S9.tar
wget http://visiondata.cis.upenn.edu/volumetric/h36m/S11.tar
tar -xf S11.tar
rm S11.tar
cd ../../..

当然,wget 是单线程下载,可以考虑使用 NDM 多线程下载来提高速度。此外,该数据集文件是放在国外的服务器上,因此有条件的可以开个网络代理。

概述

数据规模和多样性

  • 360 万张 3D 人体姿势和对应图像
  • 11 名专业演员(6 男 5 女)
  • 7 个场景(讨论、吸烟、拍照以及打电话等等)

准确捕捉和同步

  • 来自 4 个标定的高分辨率 50HZ 相机拍摄的视频
  • 来自高速运动捕捉系统的精准 3D 关节位置和角度
  • 单次配置 24 个身体部位标签
  • Time-of-flight 范围数据
  • 对每个演员进行 3D 激光扫描
  • 精准的背景去除和人体边界框

演示

Video for Human3.6M Dataset

角色

这些动作是由 11 名专业的演员(6 男 5 女)来完成的,它们的 BMI 指数范围是 17~29,这保证了适度的身体形状可变性以及不同的活动范围。受试者穿着的是自己的日常服装,而不是特殊的动作捕捉服,以尽可能保持真实感。其中,对 7 名受试者(4 男 3 女)采集的数据进行训练和验证,4 名受试者(2 男 2 女)采集的数据进行测试。

场景

该数据集由 4 台数码相机收集的 360 万个不同的人体姿势组成。数据被组织成 15 个训练动作,其中包含多种不对成的行走姿势(例如手插口袋走路,肩扛包走路)、坐姿、躺姿、各种等待姿势以及其他类型的姿势。演员们被赋予了带有示例的详细任务,以帮助它们在重复之间规划一组稳定的姿势,以创建训练、验证和测试集。然后,在执行这些任务时,演员们也有相当多的自由,可以自由地超越对任务严格的解释。

DirectionsDiscussionEatingActivities while seatedGreeting
DirectionsDiscussionEatingActivities while seatedGreeting
Taking photoPosingMaking purchasesSmokingWaiting
Taking photoPosingMaking purchasesSmokingWaiting
WalkingSitting on chairTalking on the phoneWalking dogWalking together
WalkingSitting on chairTalking on the phoneWalking dogWalking together

数据

实验环境

在这里插入图片描述

实验室设置如上图。使用 15 个传感器(4 个数码相机、1 个 time-of-flight 传感器,10 个动捕相机)来捕获数据。拍摄区域约为 6mx5m,其中有效拍摄空间是 4mx3m,所有的相机都能完全看到拍摄对象。4 台数码相机(DV)放置在拍摄空间的角落。time-of-flight(TOF) 传感器放置在其中一个数码相机的旁边。墙壁上安装了一组 10 个动作捕捉(MX)相机,以最大限度地提高有效实验体积,左右两侧各 4 个,底部水平边缘大约中间位置有 2 个。

图像数据

使用 4 台 basler 高分辨率逐行扫描相机来采集 50HZ 的视频数据。他们与动作捕捉系统处于相同的时钟和出发状态,从而确保视频和姿势数据之间的完美同步。系统的默认校准程序执行起来非常简单,但相机模型不包含径向和切向畸变参数。由于我们力求获得高质量的姿势信息,因此使用了一个更复杂、稳健的程序。整个数据集的视频帧总数超过 360 万。

姿势数据

姿势数据是相对于骨架给出的。处于一致性和方便考虑,对所有参数化使用相同的 32 个关节骨架。在测试中,我们减少了相关关节的数量,例如每只手和每只脚只留下一个关节。

注意

使用该数据集请在参考文献出引用如下两篇文献:

@article{h36m_pami,
author = {Ionescu, Catalin and Papava, Dragos and Olaru, Vlad and Sminchisescu,  Cristian},
title = {Human3.6M: Large Scale Datasets and Predictive Methods for 3D Human Sensing in Natural Environments},
journal = {IEEE Transactions on Pattern Analysis and Machine Intelligence},
publisher = {IEEE Computer Society},
volume = {36},
number = {7},
pages = {1325-1339},
month = {jul},
year = {2014}
}
@inproceedings{IonescuSminchisescu11,
author = {Catalin Ionescu, Fuxin Li, Cristian Sminchisescu},
title = {Latent Structured Models for Human Pose Estimation},
booktitle = {International Conference on Computer Vision},
year = {2011}
}

参考

  • 3D人体姿态估计-Human3.6m相关
  • Human3.6M 数据集的下载与 Human3.6M pkl 文件缺失的处理方法

这篇关于Human3.6M 数据集介绍及下载的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/754543

相关文章

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的

c++中的set容器介绍及操作大全

《c++中的set容器介绍及操作大全》:本文主要介绍c++中的set容器介绍及操作大全,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录​​一、核心特性​​️ ​​二、基本操作​​​​1. 初始化与赋值​​​​2. 增删查操作​​​​3. 遍历方

Navicat数据表的数据添加,删除及使用sql完成数据的添加过程

《Navicat数据表的数据添加,删除及使用sql完成数据的添加过程》:本文主要介绍Navicat数据表的数据添加,删除及使用sql完成数据的添加过程,具有很好的参考价值,希望对大家有所帮助,如有... 目录Navicat数据表数据添加,删除及使用sql完成数据添加选中操作的表则出现如下界面,查看左下角从左

SpringBoot中4种数据水平分片策略

《SpringBoot中4种数据水平分片策略》数据水平分片作为一种水平扩展策略,通过将数据分散到多个物理节点上,有效解决了存储容量和性能瓶颈问题,下面小编就来和大家分享4种数据分片策略吧... 目录一、前言二、哈希分片2.1 原理2.2 SpringBoot实现2.3 优缺点分析2.4 适用场景三、范围分片

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

HTML img标签和超链接标签详细介绍

《HTMLimg标签和超链接标签详细介绍》:本文主要介绍了HTML中img标签的使用,包括src属性(指定图片路径)、相对/绝对路径区别、alt替代文本、title提示、宽高控制及边框设置等,详细内容请阅读本文,希望能对你有所帮助... 目录img 标签src 属性alt 属性title 属性width/h