NASNet论文详解

2023-10-31 20:38
文章标签 详解 论文 nasnet

本文主要是介绍NASNet论文详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NASNet,论文的全名叫做Learning Transferable Architectures for Scalable Image Recognition.

这一篇论文是对神经网络架构搜索开篇之作NAS的集成和发展,也是由谷歌的Zoph等人提出来的,针对NAS论文中的缺点进行改进,在分类精度和训练资源、时间上,都优于前者。

NASNet论文的基本设计思想是:

  1. 和NAS论文一样,采用controller RNN来预测子网络参数
  2. 第一次提出了Cell和Block的概念
  3. controller RNN不再用来预测每一层的网络参数,而是用来预测Cell里面的Block参数

首先介绍一下什么是Cell和Block。Cell可以看做是整体网络架构里面的一个单元块,类似ResNet架构的残差块或者MobileNet V2的bottleneck,整个网络就是由这些单元块堆叠连接而成。

Cell分两种:Normal和Reduction。当输入特征和输出特征的分辨率是一致时,采用Normal Cell,当输入特征的分辨率是输入特征的一半时,采用Reduction Cell。Reduction Cell的设计方法Normal Cell基本一样,只是在输入特征上添加了一个stride=2的卷积操作,降低分辨率。在整体网络架构中,Normal Cell和Reduction Cell的设计原则是每N个Normal Cell中插入一个Reduction Cell,如下图所示。
在这里插入图片描述
图1. Cifar-10和ImageNet上的NASNet网络架构

Block是Cell里面的基本单元,共有B个(论文取5)。每个Block有两个输入,分别经过各自的operation之后再结合(相加或者衔接)作为输出,Block的输出称为隐状态。对于第 i i i个Block,输入的候选范围包括前面 i − 1 i-1 i1个Block的隐状态以及前两个Cell的输出,Block的操作的候选空间如下图所示。
在这里插入图片描述
图2. Block操作的候选空间

与NAS论文里controller RNN预测每一个layer的操作参数不同,NASNet的controller RNN是用来预测Cell里面每一个Block的参数。具体如下图所示。
在这里插入图片描述
图3. NASNet的controller RNN

Block的参数预测步骤有:

  1. 从输入候选范围内选择两个隐状态作为Block的两个输入
  2. 从操作候选空间选择operation作为步骤1中两个输入的操作
  3. 选择一个操作用来结合步骤2中的两个输出

预测步骤总共会循环B次,直至预测出Cell所有Block结构为止。

Controller RNN的训练方法和NAS论文中一样,也是通过验证集的精度作为reward来优化controller的参数,采用的强化学习中的PPO(Proximal Policy Optimization)算法。

在训练的时候,只选择一种Normal和Reduction Cell,同一个网络中相同类型的Cell结构是共享的,所以controller RNN只需要预测一个Cell的结构即可。从搜索空间的复杂度来看,这种方法设计极大地减小了搜索的次数和范围,这种思想被后来的其他NAS论文广泛引用,后面的博客介绍的其他方法会持续提到。

作者在训练的过程还加了一种额外的技巧,即先在小的数据集上(如Cifar-10)搜索Cell结构,等搜索结果出来后,再堆叠更多的Cell,应用在大数据集上(如ImageNet)。这样在搜索的过程中,子网络模型训练的时间便大幅减小,提高搜索的效率。

在Cifar-10数据上,论文使用了500个GPU,搜索了4天的时间。相比NAS论文的实验,搜索效率提升了7倍。在训练子网络时,采用Scheduled DropPath的方法,以一定的概率(随着迭代的次数线性增加)随机扔掉Cell里的某些路径。下图是NASNet搜索出来的Normal和Reduction Cell的结构。
在这里插入图片描述
图5. 搜索出来的Normal和Reduction Cell结构图

论文把cifar-10上搜索出来的Cell结构迁移到ImageNet数据集上,表现出了很好的泛化能力。

以下两张图是NASNet搜索出来的Cell按照图1里的方式叠加成网络后训练出来的结果。可以看出,在同一参数量等级的模型上,NASNet比手工设计的网络模型精度更好,也比NAS论文的实验结果更优。
在这里插入图片描述
图6. Cifar-10实验结果和对比

在这里插入图片描述
图7. ImageNet实验结果和对比

这篇关于NASNet论文详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/317973

相关文章

详解MySQL中DISTINCT去重的核心注意事项

《详解MySQL中DISTINCT去重的核心注意事项》为了实现查询不重复的数据,MySQL提供了DISTINCT关键字,它的主要作用就是对数据表中一个或多个字段重复的数据进行过滤,只返回其中的一条数据... 目录DISTINCT 六大注意事项1. 作用范围:所有 SELECT 字段2. NULL 值的特殊处

SQL BETWEEN 语句的基本用法详解

《SQLBETWEEN语句的基本用法详解》SQLBETWEEN语句是一个用于在SQL查询中指定查询条件的重要工具,它允许用户指定一个范围,用于筛选符合特定条件的记录,本文将详细介绍BETWEEN语... 目录概述BETWEEN 语句的基本用法BETWEEN 语句的示例示例 1:查询年龄在 20 到 30 岁

CSS place-items: center解析与用法详解

《CSSplace-items:center解析与用法详解》place-items:center;是一个强大的CSS简写属性,用于同时控制网格(Grid)和弹性盒(Flexbox)... place-items: center; 是一个强大的 css 简写属性,用于同时控制 网格(Grid) 和 弹性盒(F

spring中的ImportSelector接口示例详解

《spring中的ImportSelector接口示例详解》Spring的ImportSelector接口用于动态选择配置类,实现条件化和模块化配置,关键方法selectImports根据注解信息返回... 目录一、核心作用二、关键方法三、扩展功能四、使用示例五、工作原理六、应用场景七、自定义实现Impor

一文深入详解Python的secrets模块

《一文深入详解Python的secrets模块》在构建涉及用户身份认证、权限管理、加密通信等系统时,开发者最不能忽视的一个问题就是“安全性”,Python在3.6版本中引入了专门面向安全用途的secr... 目录引言一、背景与动机:为什么需要 secrets 模块?二、secrets 模块的核心功能1. 基

一文详解MySQL如何设置自动备份任务

《一文详解MySQL如何设置自动备份任务》设置自动备份任务可以确保你的数据库定期备份,防止数据丢失,下面我们就来详细介绍一下如何使用Bash脚本和Cron任务在Linux系统上设置MySQL数据库的自... 目录1. 编写备份脚本1.1 创建并编辑备份脚本1.2 给予脚本执行权限2. 设置 Cron 任务2

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

HTML5 搜索框Search Box详解

《HTML5搜索框SearchBox详解》HTML5的搜索框是一个强大的工具,能够有效提升用户体验,通过结合自动补全功能和适当的样式,可以创建出既美观又实用的搜索界面,这篇文章给大家介绍HTML5... html5 搜索框(Search Box)详解搜索框是一个用于输入查询内容的控件,通常用于网站或应用程

Python中使用uv创建环境及原理举例详解

《Python中使用uv创建环境及原理举例详解》uv是Astral团队开发的高性能Python工具,整合包管理、虚拟环境、Python版本控制等功能,:本文主要介绍Python中使用uv创建环境及... 目录一、uv工具简介核心特点:二、安装uv1. 通过pip安装2. 通过脚本安装验证安装:配置镜像源(可