【平价数据】SimGAN:活用合成数据和无监督数据

2023-12-01 21:48

本文主要是介绍【平价数据】SimGAN:活用合成数据和无监督数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Shrivastava, Ashish, et al. “Learning from simulated and unsupervised images through adversarial training.” IEEE Conference on Computer Vision and Pattern Recognition.2017

概述

本文是Apple在机器学习领域的首秀,同时也是CVPR 2017的两篇Best Paper之一。

在使用深度学习结局实际问题时,我们常常遇到以下的局面:

类别品质标记数量
监督数据真实
无监督数据真实
合成数据不真实

本文举了两个例子:视线方向识别和手势识别。

  • 两种问题的标定都十分困难,使得监督数据昂贵而稀少。
  • 可以用CG模型合成数据。这些数据的视线方向和手关节位置已知,但画面不够真实。

本文利用GAN思想,通过无监督数据提升合成数据的质量,同时不改变合成数据的标记。之后使用优化过的合成数据训练模型。

方法

系统框架

类似GAN网络,本文系统中包含两个核心模块

  • 改善器 R R R:输入合成数据,输出改善结果。
  • 鉴别器 D D D:判断输入是真实数据还是经过改善的合成数据。

这里写图片描述

注意,训练的最终目的是生成改善后的合成数据。而不是改善器或者鉴别器本身。

优化

相关的代价有三种

  • 代价1:鉴别器识别改善图像的错误率。
  • 代价2:鉴别器识别真实图像的错误率。
  • 代价3:改善图像和原始图像的逐像素差

其中,代价3保证改善图像和原始图像的类标相同。例如,保证手势姿态不变,保证视线方向不变。除了直接比较像素,还可以提取图像特征之后在做差。

在每一轮迭代中:

  • 最大化代价1,最小化代价3,优化改善器 R R R的参数。共执行 K r K_r Kr次SGD。
  • 最小化代价1,最小化代价2,优化鉴别器 D D D的参数。共执行 K d K_d Kd次SGD。

经过若干次迭代得到的改善器 R R R,可以将合成样本加工成具有以下两个性质的样本:

  • 品质和真实图像难以分辨
  • 保持合成样本原有类标不变

改进:局部损失

问题

随着迭代进展,鉴别器 D D D可能过分利用某些错误的全局特征进行分类,进而使得改善图像出现不自然的artifact。

举例:真实图像中可能只包含几个固定视线方向的样本,但合成图像的视线方向则均匀而连续。于是鉴别器“剑走偏锋”地以视线方向作为真假样本的判别标准。1

解决

本文在训练鉴别器 D D D时,将图像分割成 w × h w\times h w×h的小块分别输入;在利用 D D D进行分类时,以各个小块的分类结果只和作为该图像的结果。
除了避免全局信息引入artifact之外,这种方法还能够增加训练样本的数量。

改进:历史信息

问题

随着每一次迭代,改善器 R R R输出的图像是逐步变化的。相应地,鉴别器能够有效辨识的图像也集中在最近的改善器输出中。这导致两个问题:

  • 对抗训练不收敛2
  • 改善器 R R R会重新引入之前出现过、但已经被鉴别器 D D D忘记的artifact

解决

本文设置一个buffer来储存迭代中生成的改善图像。

  • 在每个大小为 b b b的mini-batch中,有一半数据来源于这个buffer,另一半来源于当前改善器 R R R的输出。
  • 完成迭代后,用当前改善器的输出替换 b / 2 b/2 b/2个buffer中的样本。

实验

视线方向估计

数据

真实数据:214K的MPIIGaze数据库
合成数据:1.2M使用UnityEyes生成图像,使用单一渲染环境

由于合成图像和真是图像在颜色上差别较大,在计算代价3时使用RGB三通道平均值之差代替逐像素差。

由于视线方向估计是在灰度图上进行,使用灰度代价即可。

结果

改善图像(中)能够保持原始图像(左)的视线方向,同时其品质接近真实图像(右),即使真人也难以分辨。
这里写图片描述

使用改善图像训练的分类器,效果大大超出使用原始合成图像训练的分类器。
这里写图片描述
与state of the art相比,错误率也有明显降低。
这里写图片描述

手势识别

数据

真实数据:NYU hand pose。70K训练,8K测试。未标定。裁剪缩放为224×224深度图像。
合成数据:数量未提及。包含14个关节标定结果。

结果

改善数据能够逼真模拟真实数据中的噪声。
这里写图片描述

使用改善数据训练的分类器指标具有明显优势。
这里写图片描述


  1. 原文未详述,此处为个人理解。 ↩︎

  2. 原因未详述 ↩︎

这篇关于【平价数据】SimGAN:活用合成数据和无监督数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/442816

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本