RNN和LSTM

时间：2020-12-22 09:00:28 阅读：57 评论：0 收藏：0 [点我收藏+]

RNN：循环神经网络，用于处理序列信息，即有上下文关系的信息

RNN中会把上一层处理后的信息作为输入传入到下一层，这样，这一层

就会同时考虑此时的输入和上一个时刻的输入，做到处理序列信息。

技术分享图片

按时间线展开

技术分享图片

其中各个时间点具有同一个W，U，V，这也是RNN的权值共享。

RNN接受的输入的特征为（b, n_features）,时间序列为T。

初始输入为h_0，一般初始化为zeros(b, hidden_unit)，

W矩阵维度（hidden_unit, hidden_unit）

U矩阵维度（n_features, hidden_unit）

V矩阵维度（hidden_unit, output）

技术分享图片

def run_step_forward(x, prev_h, Wx, Wh, b):
    # x(N*D)  Wx(D*H)  pre_H(N*H)  Wh(H*H)  b(1*H)
    next_h = np.tanh(x.dot(Wx) + prev_h.dot(Wh) + b)  # N * H
    cache = (x, Wx, Wh, prev_h, next_h)

    return next_h, cache



def rnn_forward(x, h0, Wx, Wh, b):
    N, T, D = x.shape
    _, H = h0.shape
    h = np.zeros((N, T, H))
    cache = []
    h_interm = h0
    for i in range(T):
        h[:, i, :], cache_sub = run_step_forward(x[:, i, :], h_interm, Wx, Wh, b)
        h_interm = h[:, i, :]
        cache.append(cache_sub)

    return h, cache