Mxnet (19): 循环神经网络(RNN)上

2024-04-17 19:58
文章标签 神经网络 循环 19 rnn mxnet

本文主要是介绍Mxnet (19): 循环神经网络(RNN)上,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在生活中经常能够遇见序列数据,有些是根据时间更改,例如天气,股票,经济指数等,有些是有上下文关联的,如音乐、文章。为了更好的处理这些数据,从业工作者设计出了循环神经网络。它通过引入状态变量来存储过去的信息,并通过其与输入共同决定当前输出,咋感觉有点像残差块。

循环神经网络常用于处理序列数据,如一段文字或声音、购物或观影的顺序,甚至是图像中的一行或一列像素。因此,循环神经网络有这广泛的实际应用,如语音模型、文本分类、机器翻译、语音识别、图像分析、手写识别和推荐系统。

许多循环网络的示例都是基于文本数据。主要介绍模型。

1. 序列模型

对序列数据往往没有我们想象的那么简单,能够更好的理解序列:

  • 涉及到打开程序的时间,许多用户会有非常特殊的行为。如社交媒体应用在放学后更受到学生的欢迎。当市场开放时,股票交易软件使用更频繁。
  • 预测明天的股价要比推算昨天遗漏的股价要难得多,远见要比后见难得多,马后炮还是好放的。预测超出已知的观测值称为外推法,估计现有观测值之间称为内插法。
  • 音乐、语音、文字和视频本质上都是有顺序的。如果我们将他们的顺序调换,他们的意义就变了,如牛吃草和草吃牛,意义完全不一样。
  • 地震之间的相关性很强,即在发生大地震后,很可能会发生几次较小的余震,比没有发生强烈的余震要严重的多。实际上,地震是时空相关的,也就是说,余震通常发生在很短的时间范围内并且非常接近。
  • 人与人之间的互动也是具有时序的,如辩论,battle。

1.1 统计工具

对于序列模型的处理,需要对应的统计工具。

假设通过如下方程预测t位置的值 x t x_t xt

x t ∼ P ( x t ∣ x t − 1 , … , x 1 ) x_t∼P(x_t∣x_{t−1},…,x_1) xtP(xtxt1,,x1)

1.1.1 自回归模型

为了实现预测,可以使用回归模型。这里存在一个问题就是:输入的数量取决于t。就是说如果数据量越大那么输入量也就跟着变大,因此输入值无法确定,处理这个问题有如下两种思路:

  • 设定一个定长τ,只通过 x t − 1 , … , x t − τ x_{t−1},…,x_{t−τ} xt1,,xtτ 观察。这样做的好处是,在t>τ,输入数量可以确定。这样的模型被称为自回归模型,因为他们实际上是对其自身进行回归。
  • 通过对之前数据进行总结。 h t h_t ht是过去的数据,在预测 x ^ t \hat{x}_t x^t时,也更新 h t h_t ht。这样模型通过 x ^ t = P ( x t ∣ h t ) \hat{x}_t = P(x_t \mid h_{t}) x^t=P(xtht)和不断更新的 h t = g ( h t − 1 , x t − 1 ) h_t=g(h_{t−1},x_{t−1}) ht=g(ht1,xt1)预测 x t x_t xt。由于自始至终 h t h_t ht都没有被观测到,这个模型也称为潜在自回归模型。

在这里插入图片描述

那么如何生成训练数据呢,到目前为止都是通过使用历史观测值来预测下一个观测值。假设序列 w 1 w_1 w1, w 2 w_2 w2,…, w T w_T wT中的每个词是依次生成的:

P ( x 1 , … , x T ) = ∏ t = 1 T P ( x t ∣ x t − 1 , … , x 1 ) P(x_1, \ldots, x_T) = \prod_{t=1}^T P(x_t \mid x_{t-1}, \ldots, x_1) P(x1,,xT)=t=1TP(xtxt1,,x1)

一段含有4个词的文本序列的概率:
P ( w 1 , w 2 , w 3 , w 4 ) = P ( w 1 ) P ( w 2 ∣ w 1 ) P ( w 3 ∣ w

这篇关于Mxnet (19): 循环神经网络(RNN)上的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/912701

相关文章

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

Nginx部署React项目时重定向循环问题的解决方案

《Nginx部署React项目时重定向循环问题的解决方案》Nginx在处理React项目请求时出现重定向循环,通常是由于`try_files`配置错误或`root`路径配置不当导致的,本文给大家详细介... 目录问题原因1. try_files 配置错误2. root 路径错误解决方法1. 检查 try_f

Spring三级缓存解决循环依赖的解析过程

《Spring三级缓存解决循环依赖的解析过程》:本文主要介绍Spring三级缓存解决循环依赖的解析过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、循环依赖场景二、三级缓存定义三、解决流程(以ServiceA和ServiceB为例)四、关键机制详解五、设计约

Spring 中的循环引用问题解决方法

《Spring中的循环引用问题解决方法》:本文主要介绍Spring中的循环引用问题解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录什么是循环引用?循环依赖三级缓存解决循环依赖二级缓存三级缓存本章来聊聊Spring 中的循环引用问题该如何解决。这里聊

C# foreach 循环中获取索引的实现方式

《C#foreach循环中获取索引的实现方式》:本文主要介绍C#foreach循环中获取索引的实现方式,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、手动维护索引变量二、LINQ Select + 元组解构三、扩展方法封装索引四、使用 for 循环替代

Spring Boot循环依赖原理、解决方案与最佳实践(全解析)

《SpringBoot循环依赖原理、解决方案与最佳实践(全解析)》循环依赖指两个或多个Bean相互直接或间接引用,形成闭环依赖关系,:本文主要介绍SpringBoot循环依赖原理、解决方案与最... 目录一、循环依赖的本质与危害1.1 什么是循环依赖?1.2 核心危害二、Spring的三级缓存机制2.1 三

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

Python循环缓冲区的应用详解

《Python循环缓冲区的应用详解》循环缓冲区是一个线性缓冲区,逻辑上被视为一个循环的结构,本文主要为大家介绍了Python中循环缓冲区的相关应用,有兴趣的小伙伴可以了解一下... 目录什么是循环缓冲区循环缓冲区的结构python中的循环缓冲区实现运行循环缓冲区循环缓冲区的优势应用案例Python中的实现库

Java嵌套for循环优化方案分享

《Java嵌套for循环优化方案分享》介绍了Java中嵌套for循环的优化方法,包括减少循环次数、合并循环、使用更高效的数据结构、并行处理、预处理和缓存、算法优化、尽量减少对象创建以及本地变量优化,通... 目录Java 嵌套 for 循环优化方案1. 减少循环次数2. 合并循环3. 使用更高效的数据结构4

Python中顺序结构和循环结构示例代码

《Python中顺序结构和循环结构示例代码》:本文主要介绍Python中的条件语句和循环语句,条件语句用于根据条件执行不同的代码块,循环语句用于重复执行一段代码,文章还详细说明了range函数的使... 目录一、条件语句(1)条件语句的定义(2)条件语句的语法(a)单分支 if(b)双分支 if-else(