PNAS论文和算法解析

2023-10-29 05:59
文章标签 算法 解析 论文 pnas

本文主要是介绍PNAS论文和算法解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PNAS,论文的全名是Progressive Neural Architecture Search。这篇论文也是由谷歌团队Chenxi Liu和Zoph等人发表出来的,里面的很多思路承袭了NASNet的设计原则。本论文最大的特点是采用了SMBO(Sequential Model-based Optimization)的方法来训练Predictor(结构和controller RNN相似)。

PNAS的基本设计思想是:

  1. Cell和Block的设计原则(与NASNet一样),不区分Normal和Reduction;
  2. 将Block的备选operation减少到8个
  3. Predictor可以通过loss的SGD来优化参数
  4. Block由少到多,逐步搜索Cell结构

PNAS只搜索一种Cell,而且作者从NASNet里面发现Block的好几种操作在最后的结果都没用到,所以在operation的搜索空间候选上减少到8个。

在搜索算法上,作者也做了一些改进。采用渐进式叠加搜索,即一开始只搜索一个Block,用数据集进行训练和验证,后面再逐渐增加Block进行新一轮的搜索和训练。具体的搜索算法如下图所示。
在这里插入图片描述
图1. PNAS搜索算法流程

PNAS的SMBO搜索算法步骤:

  1. 产生只有一个Block的所有可能性的Cell,再按照NASNet的规则来搭建网络模型;
  2. 训练这一组网络模型,得到它们的精度,利用这些精度值去训练Predictor;
  3. 接下来是循环的步骤。每次循环增加一个Block,和之前选择的Block构成所有可能的子网络;
  4. 用Predictor预测步骤3中所有子网络的精度,从中挑选K个最好的子网络去训练,得到它们的精度。
  5. 用这些精度再去更新Predictor,然后跳到步骤3,开始新一轮的循环,直到Block个数达到上限。

PNASNet的搜索过程如下图所示。从图中可以看出,一开始只搜索一个Block,然后加上第2个Block,通过Predictor选择最好的K个子集进行训练和验证,如此循环下去,每次增加一个Block只要训练K个子网络即可。
在这里插入图片描述
图2. PNASNet搜索过程

Predictor和NASNet中的controller RNN具有基本相同的结构,唯一不同的是在最后一个RNN隐藏层添加一个全连接和Sigmoid回归精度。在步骤2和5中的精度就是从验证集上获得的,在Sigmoid回归那边计算Loss,用于更新Predictor的参数。在步骤4中,每增加一个Block,就让Predictor多递归计算一轮,得到添加Block后的模型预测精度。

作者在Cifar-10和ImageNet数据集上进行实验,在参数设置上,Cell的Block个数为5,第一个Cell的输出通道设为 F = 24 F=24 F=24,Normal Cell的 N = 2 N=2 N=2,每增加一个Block挑选 K = 256 K=256 K=256个子网络进行训练和评估。

下面两张图是搜索出来的PNASNet在ImageNet上的训练结果,可以看出在同等级的模型参数条件下,PNASNet比传统手工设计的网络都更好。跟NASNet、AmoebaNet基本上也是不相上下,但是PNASNet的搜索速度比它们更快,相比NASNet,PNASNet搜索的模型个数少了5倍,搜索速度快了8倍。
在这里插入图片描述
图3. 小模型PNASNet在ImageNet上的性能
在这里插入图片描述
图4. 大模型PNASNet在ImageNet上的性能

这篇关于PNAS论文和算法解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/298699

相关文章

CSS place-items: center解析与用法详解

《CSSplace-items:center解析与用法详解》place-items:center;是一个强大的CSS简写属性,用于同时控制网格(Grid)和弹性盒(Flexbox)... place-items: center; 是一个强大的 css 简写属性,用于同时控制 网格(Grid) 和 弹性盒(F

python常见环境管理工具超全解析

《python常见环境管理工具超全解析》在Python开发中,管理多个项目及其依赖项通常是一个挑战,下面:本文主要介绍python常见环境管理工具的相关资料,文中通过代码介绍的非常详细,需要的朋友... 目录1. conda2. pip3. uvuv 工具自动创建和管理环境的特点4. setup.py5.

全面解析HTML5中Checkbox标签

《全面解析HTML5中Checkbox标签》Checkbox是HTML5中非常重要的表单元素之一,通过合理使用其属性和样式自定义方法,可以为用户提供丰富多样的交互体验,这篇文章给大家介绍HTML5中C... 在html5中,Checkbox(复选框)是一种常用的表单元素,允许用户在一组选项中选择多个项目。本

Python包管理工具核心指令uvx举例详细解析

《Python包管理工具核心指令uvx举例详细解析》:本文主要介绍Python包管理工具核心指令uvx的相关资料,uvx是uv工具链中用于临时运行Python命令行工具的高效执行器,依托Rust实... 目录一、uvx 的定位与核心功能二、uvx 的典型应用场景三、uvx 与传统工具对比四、uvx 的技术实

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

《SpringBoot排查和解决JSON解析错误(400BadRequest)的方法》在开发SpringBootRESTfulAPI时,客户端与服务端的数据交互通常使用JSON格式,然而,JSON... 目录问题背景1. 问题描述2. 错误分析解决方案1. 手动重新输入jsON2. 使用工具清理JSON3.

Redis过期删除机制与内存淘汰策略的解析指南

《Redis过期删除机制与内存淘汰策略的解析指南》在使用Redis构建缓存系统时,很多开发者只设置了EXPIRE但却忽略了背后Redis的过期删除机制与内存淘汰策略,下面小编就来和大家详细介绍一下... 目录1、简述2、Redis http://www.chinasem.cn的过期删除策略(Key Expir

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Spring组件实例化扩展点之InstantiationAwareBeanPostProcessor使用场景解析

《Spring组件实例化扩展点之InstantiationAwareBeanPostProcessor使用场景解析》InstantiationAwareBeanPostProcessor是Spring... 目录一、什么是InstantiationAwareBeanPostProcessor?二、核心方法解

深入解析 Java Future 类及代码示例

《深入解析JavaFuture类及代码示例》JavaFuture是java.util.concurrent包中用于表示异步计算结果的核心接口,下面给大家介绍JavaFuture类及实例代码,感兴... 目录一、Future 类概述二、核心工作机制代码示例执行流程2. 状态机模型3. 核心方法解析行为总结:三

springboot项目中使用JOSN解析库的方法

《springboot项目中使用JOSN解析库的方法》JSON,全程是JavaScriptObjectNotation,是一种轻量级的数据交换格式,本文给大家介绍springboot项目中使用JOSN... 目录一、jsON解析简介二、Spring Boot项目中使用JSON解析1、pom.XML文件引入依