高清变脸更快更逼真!比GAN更具潜力的可逆生成模型来了

2024-04-12 19:58

本文主要是介绍高清变脸更快更逼真!比GAN更具潜力的可逆生成模型来了,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=gif

变栗 问耕 发自 凹非寺
量子位 出品 | 公众号 QbitAI

昨天上市即破发的小米,今天上午股价大涨近10%。这下雷军要笑了。

而且可以笑得更灿烂。更灿烂是什么样?来,我们用OpenAI刚刚发布的人工智能技术,给大家展示一下。

640?wx_fmt=gif

当然这个最新的技术,不止这点本事。它的“想象力”很强大的说~

比如,留胡子的硬汉版雷布斯什么样?

以及,娘化的雷布斯又是什么样?

640?wx_fmt=gif

还有。

OpenAI这个称作Glow的生成模型,不仅能像上面这样自动处理高清图片,而且还能把两个人的照片MIX一下。

说到MIX,还是以小米举例吧。

想象一下,碧昂丝和雷布斯如果有后代的话,会是什么样?把他俩照片放在一起,MIX一下……结果如下图所示。而且还可以调整父母的影像力,比方如1/4碧昂丝+3/4雷军……

640?wx_fmt=gif

好像……毫无违和感。

而且,这个新技术还放出了可用的Demo,如果你也想试试变脸或者合成照片,可以前往OpenAI官网,传送门在此:

https://blog.openai.com/glow/

Glow:另辟蹊径

上面讲的就是OpenAI发布的新技术Glow,一个AI通过观察原始图片,学会如何根据不同的属性,生成全新的高清图片。

更厉害的是,这个生成模型,既不是基于大火的对抗生成网络GAN,也不是变分自编码器VAE

Glow是一种可逆的生成模型,也称为基于流的生成模型,它源于对NICE和RealNVP技术的扩展。与GAN和VAE两大流派相比,基于流的生成模型迄今为止在研究界很少受到关注。

NICE的论文最早发布于2014年,作者是来自蒙特利尔大学的Laurent Dinh、David Krueger、Yoshua Bengio。

传送门:https://arxiv.org/abs/1410.8516

RealNVP的论文最早发布于2016年,作者是蒙特利尔大学的Laurent Dinh以及谷歌大脑的Jascha Sohl-Dickstein、Samy Bengio。

传送门:https://arxiv.org/pdf/1605.08803.pdf

基于流的生成模型,有几个优点,例如:精确的潜变量推断和对数似然评估、可同时处理高效的推理和有效的合成、下游任务可用的潜在空间、显著节省内存空间等。

而且这种生成模型,并不限于图像处理,在语音合成、文本分析与合成、半监督学习和基于模型的控制等领域皆可应用。


开头演示的那些可调整属性,都不是预先标记好喂给神经网络的。朝怎样的方向变化,会产生发色啊,胡须量啊,诸如此类的改变,都是AI自己在潜在空间里面学到的。

OpenAI披露的信息显示,Glow模型在一块NVIDIA 1080 Ti GPU上生成256×256的样本,需要130ms。

这次的变脸,更流畅

为了让图像发生更流畅的变化,团队以Dinh等人2016年的研究为基础,提出了一种新的生成流 (Generative Flow) ,叫做Glow:

640?wx_fmt=png

每一步 (绿框) ,都要从一个actnorm步骤开始,把激活神经元归一化 (Activation Normalization) 。

紧跟着,是一个可逆的1x1卷积,输入和输出通道数量一样多。

再往后,是一层仿射变换 (Affine Transformation) 。Dinh团队提出的可逆转换,很强大,在这里被沿用了。

这三步组成一个绿框,无数的绿框连在一起,就有了周而复始的生成流。

640?wx_fmt=png

然后,把这个流,跟右边的多尺度 (Multi-Scale) 架构结合在一起。

潺潺流淌,人脸就可以在神经网络里,发生安静又自然的变化了。

640?wx_fmt=gif

是AI自己找到的方向

在模型的训练数据上,研究人员没有手动添加任何标记。

AI会在潜在空间里,掌握各种各样的变化规律。

不论是把光滑的下颌变得胡子拉碴,还是为起气色红润的面孔完成卸妆。

没有地图,所有的方向,AI都要自己找到。

640?wx_fmt=jpeg

幸好,它没有迷路。

变成不一样的自己

640?wx_fmt=jpeg

不管是发色,面色,还是表情,这些语义特征AI或许并不懂,但这并不妨碍它实现这些属性的变化。

用编码器给图像编码,为有胡子和没胡子的样子,分别算出一个潜在向量

640?wx_fmt=png

两个向量之间,相差的那个向量,就是调整胡子浓密程度的滑块了。

变成别人

用编码器,给两张不同人类的照片编码。可以产生二者之间的变换过程,很完整。

从换脸途中任取一张图,就能看到两个人的基因,和解之后的样子了。

640?wx_fmt=gif

除了肉眼可辨的效果之外,团队还对比了Glow和前辈RealNVP (来自2016年的Dinh实验室) ,处理数据集时的成绩——

640?wx_fmt=png

结果是,在5个数据集里,这只闪闪发光的模型,表现都要优于RealNVP。完成相同的任务,Glow需要的数据量更少。

青出于蓝。

选择跟随Dinh的脚步,是因为OpenAI团队看到了可逆生成模型的优点。

640?wx_fmt=jpeg

它跟VAE不同,跟GAN也不同,潜变量 (Latent Variable) 有了确切的推断,不只是一个近似值了。

另外,可以给数据,生成确切的对数似然值 (Log-Likelyhood) ,不只是一个下限了。

总而言之,这样的模型比起前辈们,拥有更多确定的答案。

论文+代码

640?wx_fmt=png

Glow的作者是来自OpenAI的两位:Diederik P. Kingma、Prafulla Dhariwal。而且OpenAI这次一口气放出了Glow的论文以及代码。

论文传送门:

https://d4mucfpksywv.cloudfront.net/research-covers/glow/paper/glow.pdf

代码传送门:

https://github.com/openai/glow

—  —

640?wx_fmt=gif

640?wx_fmt=png


点击下方“阅读原文”了解云创大数据诚征公安总代理事宜 ↓↓↓

这篇关于高清变脸更快更逼真!比GAN更具潜力的可逆生成模型来了的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/898096

相关文章

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

python如何生成指定文件大小

《python如何生成指定文件大小》:本文主要介绍python如何生成指定文件大小的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录python生成指定文件大小方法一(速度最快)方法二(中等速度)方法三(生成可读文本文件–较慢)方法四(使用内存映射高效生成

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

Maven项目中集成数据库文档生成工具的操作步骤

《Maven项目中集成数据库文档生成工具的操作步骤》在Maven项目中,可以通过集成数据库文档生成工具来自动生成数据库文档,本文为大家整理了使用screw-maven-plugin(推荐)的完... 目录1. 添加插件配置到 pom.XML2. 配置数据库信息3. 执行生成命令4. 高级配置选项5. 注意事

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

MybatisX快速生成增删改查的方法示例

《MybatisX快速生成增删改查的方法示例》MybatisX是基于IDEA的MyBatis/MyBatis-Plus开发插件,本文主要介绍了MybatisX快速生成增删改查的方法示例,文中通过示例代... 目录1 安装2 基本功能2.1 XML跳转2.2 代码生成2.2.1 生成.xml中的sql语句头2

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

SpringBoot实现二维码生成的详细步骤与完整代码

《SpringBoot实现二维码生成的详细步骤与完整代码》如今,二维码的应用场景非常广泛,从支付到信息分享,二维码都扮演着重要角色,SpringBoot是一个非常流行的Java基于Spring框架的微... 目录一、环境搭建二、创建 Spring Boot 项目三、引入二维码生成依赖四、编写二维码生成代码五

Android与iOS设备MAC地址生成原理及Java实现详解

《Android与iOS设备MAC地址生成原理及Java实现详解》在无线网络通信中,MAC(MediaAccessControl)地址是设备的唯一网络标识符,本文主要介绍了Android与iOS设备M... 目录引言1. MAC地址基础1.1 MAC地址的组成1.2 MAC地址的分类2. android与I