首页 > 其他 > 详细

RNN循环神经网络

时间：2019-10-02 00:59:08 阅读：120 评论：0 收藏：0 [点我收藏+]

1 为何使用RNN（Recurrent Neural Network）

传统神经网络，如卷积，全连接神经网络，同样的输入只能输出相同的输出。但在如语义识别的时候我们想要相同的输入对应不同的输出。如购票系统中，去‘’北京‘’，中的北京是目的地，而离开’北京‘，’中的北京是出发地。通过上下文来跟当前的输入来决定输出就需要使用RNN。

2 简单RNN

如下图是一个简单的RNN模型，输入层有两个神经元\((x_1,x_2)\)，隐藏层有两个神经元，输出层有两个神经元\((y_1,y_2)\)。若没有记忆单元\((a_1,a_2)\)，相同的输入\((x_1,x_2)\)一定会输出相同的\((y_1,y_2)\)。若加上记忆单元\((a_1,a_2)\)，在计算隐藏层的时候为，记忆单元乘以相应的权重\(+\)输入层乘以相应的权重，得到隐藏层，再把隐藏层的值存入记忆单元\((a_1,a_2)\)中，下次在计算隐藏层的值的时候，\((a_1,a_2)\)的值已经改变，所以算出的隐藏层的值不同，因此输出也不同。这是简单的RNN，至少实现了记忆功能。

技术分享图片

出来上面的结构形式，还有如下图的简单RNN，区别就是一个把隐藏层的值传给记忆单元，一个把输出值传给记忆单元。

技术分享图片

还有双向循环神经网络，通过把正向RNN跟反向RNN的隐藏层结合起来输出，来训练网络

技术分享图片

3 LSTM（Long Short-Term Memory）

现在LSTM已经成了RNN的标准，与简单RNN不同的是，LSTM的记忆单元，由三个门控制，分别为

输入门（是否隐藏层的值要写入到记忆单元中）
遗忘门（当前记忆单元内的值是否需要洗掉）
输出门（是否输出新的记忆单元的值）

技术分享图片

每个门都是一个向量，与对应需要控制的向量做元素之间的乘法，得到一个向量。基本运算如下图，即：

新的记忆单元=输入门×输入+遗忘门×记忆单元

输出向量 = 输出门×新记忆单元?

这里省去了激活函数

技术分享图片

这里的三个门的计算都为：

输入门=输入向量x×转换矩阵

遗忘门门=输入向量x×转换矩阵

输入门=输入向量x×转换矩阵

其中x可以被认为对应隐藏层的值，因为是通过隐藏层的值来更新存储单元

最终形式为

技术分享图片

注意，上图的\(x^t,x^{t+1}\)用的是同一个网络，即求\(z^f,z^i,z,z^o\)时的参数矩阵相同

RNN循环神经网络

原文：https://www.cnblogs.com/lolybj/p/11503921.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！