首页 > 其他 > 详细

RNN网络

时间:2020-09-19 23:21:38      阅读:84      评论:0      收藏:0      [点我收藏+]

 

RNN网络模型:

 技术分享图片

Xt 表示每一个时刻的输入

Ot 表示每一个时刻的输出

St 表示每一个隐层的输出

中间的圆圈表示隐藏层的一个Unit单元

W, U, V 为网络的参数,所有单元的参数共享

公式表达:

S0 = 0

St = g1(U*Xt+W*St-1+ba)

Ot=g2(V*St+by)

g1,g2表示激活函数,g1:tanh/relu, g2:sigmiod

 

每个Unit有俩个输入:前一个Unit的状态和当前序列的输入

每个Unit有俩个输出:当前Unit的状态和预测输出

输出受到前面的隐层状态输出的影响

技术分享图片

 

S开始标志 e结束标志

 

词的表示方法:

 技术分享图片

建立一个包含所有序列词的词典包含(开始和结束俩个特殊词,以及没有出现过的词),每个词在词典里面有唯一的编号

任何一个词都可以有一个N维的one-hot向量来表示,N是词典包含词的个数

 

 

输出的表示:Softmax 每一个时刻的输出是所有词的概率组成的向量

 技术分享图片

 

矩阵的运算表示:

 技术分享图片

形状表示:[n, m] * [m,1] + [n,n] * [n,1] = [n,1]

1.矩阵U的维度是n*m, 矩阵W的维度是n*n

M:词的个数 n:输出S的维度

  1. 形状表示:[m,n] * [n,1] = [m,1]

矩阵V的维度[m,n]

其中n是可以人为设置的,通常用来指定Unit的状态输出大小

 

交叉熵损失:一整个序列作为一个训练实例,总误差就是各个时刻词的误差之和

 技术分享图片

 

反向传播优化参数:计算误差关于参数UVW、以及俩个偏置bxby的梯度,由于三组参数是共享的,所以需要将一个实例在每时刻的梯度相加。

 技术分享图片技术分享图片

 

RNN网络

原文:https://www.cnblogs.com/yuganwj/p/13697871.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!