GAN笔记_李弘毅教程(三)Unsupervised Conditional Generation

2023-12-23 21:32

本文主要是介绍GAN笔记_李弘毅教程(三)Unsupervised Conditional Generation,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 简介
  • Direct Transformation
    • Cycle GAN
    • StarGAN
  • Projection to Common Space

简介

风景照—画作(风格迁移):

Unsupervised Conditional Generation有两种方法:
第一种的直接转化通常是颜色上的改变;
而当差距很大的时候,用第二种方法:

Direct Transformation

1.让 D Y {D_Y} DY判断输入的图片是属于Domain X X X还是Domain Y Y Y;
2.G产生尽量能骗过D的图片。但如何让G产生正确的和原图相对应的而不只是能骗过D的图片呢?

解决方法:直接无视(2333333……),G自会产生相对应的:
在这里插入图片描述

Cycle GAN

但如果G的层数很深的话,那么结果的确可能完全不一样,这时候就需要额外的处理。
可以将G的输入和输出都放置于pre-trained的Encoder Network中,再分别输出一个东西,这两个东西要尽量相似:

或者可以将G的输出再还原与原图尽量相似并且和Domain Y Y Y通过D作对比,这样就不会产生完全无关的图片:

这就是"Cycle consistency",可以做双向的。
就是以上过程的一个逆过程:

Cycle consistency的应用:
转为银发
Cycle consistency存在的问题:
隐写术,也就是说当G生成的图片没有原图的一样东西,但转回去就会有这个东西。也就是说有信息被隐藏:

以下三种GAN其实为同一个思想:

StarGAN

用一个G可实现多domain互转

1.用一个D既能识别输入图片是否真实,又能判断出输入图片来自哪个domain;
2.在G中输入目标domain和图片,生成自己制造的假图片;同时把生成的同一个假图片放入同一个G,再告诉G原来的domian是哪一个domain,重新得到一张图片。这时候看重新得到的这张图片和原来G输入的图片越接近越好。
3.这是继续判断:G生成的假图片是否真实,还要看生成的假图片是否的属于那个domain。
(其实就是为了把目标域与目标图片 和 假图片和假图片所属域生成的图片一致,并且假图片能骗到D自己属于目标域)


举例(2个)
PS:domain可以有很多个,不如头发颜色,性别,年纪。由编码来表示domain。

Projection to Common Space

中间属性层是vector,表示x域的图像特征,然后用这些特征输出属于y域的图像。同时原图和被还原出的原图要很相似。

还可以加个D,强迫X域生成的图片再被还原的图片还是属于x域,还可以防止图片变模糊。
但因为上面一个GAN和下面一个GAN是分开训练的,所以G生成的y域图片可能和原图不相关

如何解决?
方法一:可以让Encoder和Decoder共享参数
Encoder前几个layer可以不一样,但后几个一定一样;
Decoder后几个layer可以不一样,但前几个一定一样。
这样就可以把x域和y域的图片的特征被压到同一个latent space中。
但还要给Encoder一个数值,让它知道输入的是来源于哪个domain的。

方法二:在latent space中加一个Domain D,让它无法评判输入进来的vector属于哪个域,这意味着不同域的它们的distribution是一样的。

方法三:用Cycle Consistency,和Cycle GAN很像,只是把G切成了Encoder和Decoder。

方法四:Semantic Consistency,让不同的latent code越接近越好。

应用:

把声音A转为声音B。

在过去,需要两人都说出相同的内容,现在可以不同内容。

这篇关于GAN笔记_李弘毅教程(三)Unsupervised Conditional Generation的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/529527

相关文章

基于C#实现PDF转图片的详细教程

《基于C#实现PDF转图片的详细教程》在数字化办公场景中,PDF文件的可视化处理需求日益增长,本文将围绕Spire.PDFfor.NET这一工具,详解如何通过C#将PDF转换为JPG、PNG等主流图片... 目录引言一、组件部署二、快速入门:PDF 转图片的核心 C# 代码三、分辨率设置 - 清晰度的决定因

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

spring AMQP代码生成rabbitmq的exchange and queue教程

《springAMQP代码生成rabbitmq的exchangeandqueue教程》使用SpringAMQP代码直接创建RabbitMQexchange和queue,并确保绑定关系自动成立,简... 目录spring AMQP代码生成rabbitmq的exchange and 编程queue执行结果总结s

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

python使用Akshare与Streamlit实现股票估值分析教程(图文代码)

《python使用Akshare与Streamlit实现股票估值分析教程(图文代码)》入职测试中的一道题,要求:从Akshare下载某一个股票近十年的财务报表包括,资产负债表,利润表,现金流量表,保存... 目录一、前言二、核心知识点梳理1、Akshare数据获取2、Pandas数据处理3、Matplotl

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

2025版mysql8.0.41 winx64 手动安装详细教程

《2025版mysql8.0.41winx64手动安装详细教程》本文指导Windows系统下MySQL安装配置,包含解压、设置环境变量、my.ini配置、初始化密码获取、服务安装与手动启动等步骤,... 目录一、下载安装包二、配置环境变量三、安装配置四、启动 mysql 服务,修改密码一、下载安装包安装地

电脑提示d3dx11_43.dll缺失怎么办? DLL文件丢失的多种修复教程

《电脑提示d3dx11_43.dll缺失怎么办?DLL文件丢失的多种修复教程》在使用电脑玩游戏或运行某些图形处理软件时,有时会遇到系统提示“d3dx11_43.dll缺失”的错误,下面我们就来分享超... 在计算机使用过程中,我们可能会遇到一些错误提示,其中之一就是缺失某个dll文件。其中,d3dx11_4

Linux下在线安装启动VNC教程

《Linux下在线安装启动VNC教程》本文指导在CentOS7上在线安装VNC,包含安装、配置密码、启动/停止、清理重启步骤及注意事项,强调需安装VNC桌面以避免黑屏,并解决端口冲突和目录权限问题... 目录描述安装VNC安装 VNC 桌面可能遇到的问题总结描js述linux中的VNC就类似于Window

Go语言编译环境设置教程

《Go语言编译环境设置教程》Go语言支持高并发(goroutine)、自动垃圾回收,编译为跨平台二进制文件,云原生兼容且社区活跃,开发便捷,内置测试与vet工具辅助检测错误,依赖模块化管理,提升开发效... 目录Go语言优势下载 Go  配置编译环境配置 GOPROXYIDE 设置(VS Code)一些基本