CNN感性认识(四)——深度学习的基本认识

2023-10-27 19:38

本文主要是介绍CNN感性认识(四)——深度学习的基本认识,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

参考资料:http://neuralnetworksanddeeplearning.com/chap6.html

一、介绍卷积神经网络(convolutional neural network)
① 感受野(local receiptive fields)
以MNITST为例,以前我们总是把神经网络的输入看成一条线,现在我们将它们看成一个28*28的方阵。
这里写图片描述
以前输入层到隐层是全连接的,现在只是某一部分输入神经元与某一部分隐层神经元连接,连接到隐层的小区域被称为感受野。
这里写图片描述
这里写图片描述
这里写图片描述
如果一个隐层神经元对应5*5的感受野,就可以得到24*24的隐层。
一般来说,感受野移动的步长是1,有时也可能取步长为2.
②共享权重和偏置
我们将令24*24的隐层神经元使用相同的偏置。
换句话说,对第j,k个隐层神经元,如前所述,感受野是5*5,输出是:
这里写图片描述
有时,我们称输入层到隐层的映射为特征映射(feature map)
将定义特征映射的权重称为共享权重(shared weight)
共享的权重和偏置用来定义核(kernal)或者滤波器(filter)
feature map不一定只有一个,1个map映射一种特征,多个map映射多种特征,产生多张隐层的方阵。
这里写图片描述
③池化层(pooling)
池化层是指,提取卷积层的输出,准备一个浓缩过的特征映射。
比如说,池化层中的每个单元浓缩2*2区域的神经元,池化的一种普遍方式是最大值池化(max-pooling),即一个pooling单元只输出2*2区域中最大的激励。
由于卷积层的输出是3层24*24,池化层就是3层12*12。
这里写图片描述
这里写图片描述
pooling层的好处是,在保留了主要信息的前提下,减少了后续层所需的参数的数目。
除了max-pooling以外,L2-pooling(取区域内所有激励的平方和开根号),ave-pooling也很常用。

在最后加上全连接层:
这里写图片描述

二、卷积神经网络的实际操作:
①使用ReLU,加上L2正则化,效果更佳;
②扩大训练数据:一个扩大训练数据的简单方法是,在每张图中替换掉一个像素,上下左右移动一个像素,可以减轻过拟合;
③插入一个额外的全连接层:配合dropout使用效果更佳;
使用这个策略,需要适当下降迭代次数(因为dropout减轻了过拟合,加快了训练速度),需要适当增加全连接层神经元的数量(因为dropout再训练时会省去一些神经元)。
④训练一个网络集合:让它们对结果投票。
⑤只对全连接层使用dropout,而不在其它层使用:因为共享权重意味着卷积滤波器必须从整张图学习,不容易过拟合,也就不需要dropout。
⑥为什么CNN的训练得以顺利进行?
使用卷积层减少了参数,使学习问题更简单;
使用更强大的正则化技术减轻过拟合;
使用ReLU而不是sigmoid激励,加速训练;
使用GPU并接受长时间的训练。
⑦网络究竟可以有多深?
resnet已经做到1000+层了。
三、其他CNN变体:
①递归神经网络(RNN,recurrent neural network)
②LSTM(long short-term memory units)
③波茨曼机(Boltzmann machines,deep belief nets,DBN)

这篇关于CNN感性认识(四)——深度学习的基本认识的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287909

相关文章

深度解析Spring Security 中的 SecurityFilterChain核心功能

《深度解析SpringSecurity中的SecurityFilterChain核心功能》SecurityFilterChain通过组件化配置、类型安全路径匹配、多链协同三大特性,重构了Spri... 目录Spring Security 中的SecurityFilterChain深度解析一、Security

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

MySql基本查询之表的增删查改+聚合函数案例详解

《MySql基本查询之表的增删查改+聚合函数案例详解》本文详解SQL的CURD操作INSERT用于数据插入(单行/多行及冲突处理),SELECT实现数据检索(列选择、条件过滤、排序分页),UPDATE... 目录一、Create1.1 单行数据 + 全列插入1.2 多行数据 + 指定列插入1.3 插入否则更

C#连接SQL server数据库命令的基本步骤

《C#连接SQLserver数据库命令的基本步骤》文章讲解了连接SQLServer数据库的步骤,包括引入命名空间、构建连接字符串、使用SqlConnection和SqlCommand执行SQL操作,... 目录建议配合使用:如何下载和安装SQL server数据库-CSDN博客1. 引入必要的命名空间2.

Java中的数组与集合基本用法详解

《Java中的数组与集合基本用法详解》本文介绍了Java数组和集合框架的基础知识,数组部分涵盖了一维、二维及多维数组的声明、初始化、访问与遍历方法,以及Arrays类的常用操作,对Java数组与集合相... 目录一、Java数组基础1.1 数组结构概述1.2 一维数组1.2.1 声明与初始化1.2.2 访问

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析

深度解析Java项目中包和包之间的联系

《深度解析Java项目中包和包之间的联系》文章浏览阅读850次,点赞13次,收藏8次。本文详细介绍了Java分层架构中的几个关键包:DTO、Controller、Service和Mapper。_jav... 目录前言一、各大包1.DTO1.1、DTO的核心用途1.2. DTO与实体类(Entity)的区别1

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

ModelMapper基本使用和常见场景示例详解

《ModelMapper基本使用和常见场景示例详解》ModelMapper是Java对象映射库,支持自动映射、自定义规则、集合转换及高级配置(如匹配策略、转换器),可集成SpringBoot,减少样板... 目录1. 添加依赖2. 基本用法示例:简单对象映射3. 自定义映射规则4. 集合映射5. 高级配置匹

深度解析Python装饰器常见用法与进阶技巧

《深度解析Python装饰器常见用法与进阶技巧》Python装饰器(Decorator)是提升代码可读性与复用性的强大工具,本文将深入解析Python装饰器的原理,常见用法,进阶技巧与最佳实践,希望可... 目录装饰器的基本原理函数装饰器的常见用法带参数的装饰器类装饰器与方法装饰器装饰器的嵌套与组合进阶技巧