直觉化深度学习教程——什么是前向传播

2024-01-23 21:18

本文主要是介绍直觉化深度学习教程——什么是前向传播,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

所谓前向传播,就是给网络输入一个样本向量,该样本向量的各元素,经过各隐藏层的逐级加权求和+非线性激活,最终由输出层输出一个预测向量的过程。

看完这篇博客,你要是还不懂,一定是我哪里没写清楚,请联系我。

文章目录

    • @[toc]
  • 一个简化的例子
  • 加权和的计算
  • 激活值的计算
  • 矩阵化表示的好处

一个简化的例子

因为神经网络两层之间的连线、符号、上下标,确实让人头大,我们可以由一个简化的网络来计算出神经网络两层之间激活值的传递关系。

如图1所示,我们假设一第l层的神经元有2个,第l-1层(也就是上一层)的神经元有3个。每类符号的含义已在图中说明。

在这里插入图片描述

图1.简化的局部网络

由于符号和下标实在太多,因此我们只要计算第一个神经元的 z 1 l z^l_1 z1l a 1 l a^l_1 a1l,第二个神经元的 z 2 l z^l_2 z2l a 2 l a^l_2 a2l简直就是照猫画虎了。图1中有一个会让人初次接触时感觉别扭,就是权重 w w w的下标由其所连接的两个神经元的各自层的索引下标组成,前一层的索引在右边,而后一层的神经元左边,这是为了后面构造矩阵乘法显得简洁。


加权和的计算

根据图1,我们可以按照图2所示,将 z 1 l z^l_1 z1l求出来,然后同理求出 z 2 l z^l_2 z2l,两个元素对堆叠起来,即可用一个矩阵乘积再加上偏置向量来表示。

在这里插入图片描述

图2.加权和的计算

由图2,显然可以看出:

  • 上一层神经元越多,W的列数越多,即越宽
  • 本层神经元越多,W的行数越多,即越高。
  • 偏置 b ⃗ \vec{b} b 的元素个数,等于本层神经元个数,与上一层神经元个数无关。

进一步地,有时候我们追求简洁,干脆将偏置融入权重矩阵中,构造出增广的 W W W;同时,给上一层的激活值向量 a ⃗ \vec{a} a 也增加一个元素1,这样能得到更简洁的纯粹矩阵乘法的形式。如图3所示。

在这里插入图片描述

图3.加权和的两种表示方法

激活值的计算

ok,现在我们有了加权和 z ⃗ \vec{z} z 的计算表达式,即由上一层输出的激活值向量获得本层的加权和,而且我们有两种形式的表达式,因此激活值的计算表达式也是两种。如图4所示。

注意,这里的激活 σ ( ) \sigma() σ()指的是对输入向量的每个元素进行激活,即标量运算。输入的向量 z ⃗ l \vec{z}^l z l有多少个元素,输出也对应多少个元素。

在这里插入图片描述

图4.激活值前向传播的两种常见表示方法

图4的两种表示方法,均表达了由上一层的激活值 a ⃗ l − 1 \vec{a}^{l-1} a l1是如何通过本层的权重和偏置,计算出本层的激活值 a ⃗ l \vec{a}^{l} a l来的。为了强调偏置 b b b,我们用常规表示法。

这样,即构成了一种传递,或者传播。叫啥都行,关键是理解。

如此,便可以如图5所示,对于输入层的一个样本向量 x ⃗ \vec{x} x ,我们可以通过简洁且固定规律的表达式,来迭代出最终的网络输出 l ⃗ \vec{l} l ,神经网络千丝万缕的符号、连接海洋,被这么简单的且重复的表达式搞定了,来,让我们向线性代数致敬!

图5假定为总共l+1层网络。

在这里插入图片描述

图5.前向传播的总过程

图5描述的是前向传播的总过程,我们可以仔细解读一下:

  • 重复的同与不同

    虽然隐藏层中是重复地做加权和+非线性激活,但是每层网络的权重矩阵 W W W、偏置 b ⃗ \vec{b} b 并不相同,各层的加权和 z ⃗ \vec{z} z 因此并非一样的运算。

  • 输出层激活函数的特殊性

    输出层的激活函数由于与目标函数有“组合效应”,因此常常根据目标函数的构造,选用搭配的激活函数,后面反向传播时会详细讨论。

  • W W W与两层网络间的线性变换的对应

    只要每次看到 W W W x ⃗ \vec{x} x 进行线性变换,请自动脑补:两层网络之间网络连接,以及加权和的生成公式。

    由于很多表达式为了追求简洁,省略了偏置 b b b的表示,但偏置 b b b可能被省略,但它一直存在。因此别忘了它。

  • σ ( W ⋅ ) \sigma(W·) σ(W)表示一层神经网络前向传播。

    一层的完整传播,必须包括 W W W σ ( ⋅ ) \sigma(·) σ()

  • 后面我们将看到RNN、LSTM里的 W W W σ ( W ⋅ ) \sigma(W·) σ(W),请自动脑补成加权和网络,或者一层完整前向传播


矩阵化表示的好处

好了,简单总结一下应用上述推导结果的好处。

  • 有利于模型的准确定义

  • 方便软件实现

  • 方便硬件的加速(AI芯片或显卡)

  • 化繁为简,给思维减负,有利于创新。

这篇关于直觉化深度学习教程——什么是前向传播的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/637556

相关文章

Nexus安装和启动的实现教程

《Nexus安装和启动的实现教程》:本文主要介绍Nexus安装和启动的实现教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Nexus下载二、Nexus安装和启动三、关闭Nexus总结一、Nexus下载官方下载链接:DownloadWindows系统根

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

CnPlugin是PL/SQL Developer工具插件使用教程

《CnPlugin是PL/SQLDeveloper工具插件使用教程》:本文主要介绍CnPlugin是PL/SQLDeveloper工具插件使用教程,具有很好的参考价值,希望对大家有所帮助,如有错... 目录PL/SQL Developer工具插件使用安装拷贝文件配置总结PL/SQL Developer工具插

Java中的登录技术保姆级详细教程

《Java中的登录技术保姆级详细教程》:本文主要介绍Java中登录技术保姆级详细教程的相关资料,在Java中我们可以使用各种技术和框架来实现这些功能,文中通过代码介绍的非常详细,需要的朋友可以参考... 目录1.登录思路2.登录标记1.会话技术2.会话跟踪1.Cookie技术2.Session技术3.令牌技

Python中文件读取操作漏洞深度解析与防护指南

《Python中文件读取操作漏洞深度解析与防护指南》在Web应用开发中,文件操作是最基础也最危险的功能之一,这篇文章将全面剖析Python环境中常见的文件读取漏洞类型,成因及防护方案,感兴趣的小伙伴可... 目录引言一、静态资源处理中的路径穿越漏洞1.1 典型漏洞场景1.2 os.path.join()的陷

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

Python使用Code2flow将代码转化为流程图的操作教程

《Python使用Code2flow将代码转化为流程图的操作教程》Code2flow是一款开源工具,能够将代码自动转换为流程图,该工具对于代码审查、调试和理解大型代码库非常有用,在这篇博客中,我们将深... 目录引言1nVflRA、为什么选择 Code2flow?2、安装 Code2flow3、基本功能演示

Java Spring 中的监听器Listener详解与实战教程

《JavaSpring中的监听器Listener详解与实战教程》Spring提供了多种监听器机制,可以用于监听应用生命周期、会话生命周期和请求处理过程中的事件,:本文主要介绍JavaSprin... 目录一、监听器的作用1.1 应用生命周期管理1.2 会话管理1.3 请求处理监控二、创建监听器2.1 Ser

MySQL 安装配置超完整教程

《MySQL安装配置超完整教程》MySQL是一款广泛使用的开源关系型数据库管理系统(RDBMS),由瑞典MySQLAB公司开发,目前属于Oracle公司旗下产品,:本文主要介绍MySQL安装配置... 目录一、mysql 简介二、下载 MySQL三、安装 MySQL四、配置环境变量五、配置 MySQL5.1

MQTT SpringBoot整合实战教程

《MQTTSpringBoot整合实战教程》:本文主要介绍MQTTSpringBoot整合实战教程,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录MQTT-SpringBoot创建简单 SpringBoot 项目导入必须依赖增加MQTT相关配置编写