CNN感性认识(四)——深度学习的基本认识

2023-10-27 19:38

本文主要是介绍CNN感性认识(四)——深度学习的基本认识,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

参考资料:http://neuralnetworksanddeeplearning.com/chap6.html

一、介绍卷积神经网络(convolutional neural network)
① 感受野(local receiptive fields)
以MNITST为例,以前我们总是把神经网络的输入看成一条线,现在我们将它们看成一个28*28的方阵。
这里写图片描述
以前输入层到隐层是全连接的,现在只是某一部分输入神经元与某一部分隐层神经元连接,连接到隐层的小区域被称为感受野。
这里写图片描述
这里写图片描述
这里写图片描述
如果一个隐层神经元对应5*5的感受野,就可以得到24*24的隐层。
一般来说,感受野移动的步长是1,有时也可能取步长为2.
②共享权重和偏置
我们将令24*24的隐层神经元使用相同的偏置。
换句话说,对第j,k个隐层神经元,如前所述,感受野是5*5,输出是:
这里写图片描述
有时,我们称输入层到隐层的映射为特征映射(feature map)
将定义特征映射的权重称为共享权重(shared weight)
共享的权重和偏置用来定义核(kernal)或者滤波器(filter)
feature map不一定只有一个,1个map映射一种特征,多个map映射多种特征,产生多张隐层的方阵。
这里写图片描述
③池化层(pooling)
池化层是指,提取卷积层的输出,准备一个浓缩过的特征映射。
比如说,池化层中的每个单元浓缩2*2区域的神经元,池化的一种普遍方式是最大值池化(max-pooling),即一个pooling单元只输出2*2区域中最大的激励。
由于卷积层的输出是3层24*24,池化层就是3层12*12。
这里写图片描述
这里写图片描述
pooling层的好处是,在保留了主要信息的前提下,减少了后续层所需的参数的数目。
除了max-pooling以外,L2-pooling(取区域内所有激励的平方和开根号),ave-pooling也很常用。

在最后加上全连接层:
这里写图片描述

二、卷积神经网络的实际操作:
①使用ReLU,加上L2正则化,效果更佳;
②扩大训练数据:一个扩大训练数据的简单方法是,在每张图中替换掉一个像素,上下左右移动一个像素,可以减轻过拟合;
③插入一个额外的全连接层:配合dropout使用效果更佳;
使用这个策略,需要适当下降迭代次数(因为dropout减轻了过拟合,加快了训练速度),需要适当增加全连接层神经元的数量(因为dropout再训练时会省去一些神经元)。
④训练一个网络集合:让它们对结果投票。
⑤只对全连接层使用dropout,而不在其它层使用:因为共享权重意味着卷积滤波器必须从整张图学习,不容易过拟合,也就不需要dropout。
⑥为什么CNN的训练得以顺利进行?
使用卷积层减少了参数,使学习问题更简单;
使用更强大的正则化技术减轻过拟合;
使用ReLU而不是sigmoid激励,加速训练;
使用GPU并接受长时间的训练。
⑦网络究竟可以有多深?
resnet已经做到1000+层了。
三、其他CNN变体:
①递归神经网络(RNN,recurrent neural network)
②LSTM(long short-term memory units)
③波茨曼机(Boltzmann machines,deep belief nets,DBN)

这篇关于CNN感性认识(四)——深度学习的基本认识的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/287909

相关文章

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Python异步编程之await与asyncio基本用法详解

《Python异步编程之await与asyncio基本用法详解》在Python中,await和asyncio是异步编程的核心工具,用于高效处理I/O密集型任务(如网络请求、文件读写、数据库操作等),接... 目录一、核心概念二、使用场景三、基本用法1. 定义协程2. 运行协程3. 并发执行多个任务四、关键

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

Go语言连接MySQL数据库执行基本的增删改查

《Go语言连接MySQL数据库执行基本的增删改查》在后端开发中,MySQL是最常用的关系型数据库之一,本文主要为大家详细介绍了如何使用Go连接MySQL数据库并执行基本的增删改查吧... 目录Go语言连接mysql数据库准备工作安装 MySQL 驱动代码实现运行结果注意事项Go语言执行基本的增删改查准备工作

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?