首页 > 其他 > 详细

深度学习面试题36：RNN与长程依赖关系(Long-Term Dependencies)

时间：2020-07-14 00:44:16 阅读：341 评论：0 收藏：0 [点我收藏+]

目录

　　长程依赖关系的解释

　　为什么传统RNN不能解决长程依赖问题

　　如何解决长程依赖问题

　　参考资料

技术分享图片

长程依赖关系的解释

句子1：the clouds are in the (). 对语言模型而言，这里的()很容易就能被确定为sky，因为它刚“读过”的单词是“clouds are in the”，语言模型的是具有记忆的，因此很大概率可以预测对。

而句子2：I grew up in France… I speak fluent ().这里的省略号表示一大堆单词，而这里的()被RNN这样的语言模型预测为French的概率就很低了，因为他的记忆已经“模糊”了，换句话说，由于不停的“读”新的单词，很早之前的信息已经被冲淡了。

所以长程依赖可以理解为：当你想使用语言模型，并有效利用较早时间步的信息，最终产生预测的时候，那么你就要和较长路程前的信息建立一种依赖关系，这就是长程依赖。

长程依赖问题(The Problem of Long-Term Dependencies)，也就是研究长程依赖的问题。

为什么传统RNN不能解决长程依赖问题

技术分享图片

回忆RNN的网络结构，RNN之所以能够对序列数据建模，是因为它具有一个记忆单元（隐藏层的参数），但是记忆单元中记录的较早信息会随着时间步的推移而冲淡，所以就无法建立起和较早时间步信息的依赖关系。

如何解决长程依赖问题

需要改变RNN的结构，从而建立起一种和较早时间步联系的桥梁，比如后面要细谈的LSTM和GRU等。

参考资料

https://colah.github.io/posts/2015-08-Understanding-LSTMs/

深度学习面试题36：RNN与长程依赖关系(Long-Term Dependencies)

原文：https://www.cnblogs.com/itmorn/p/13296461.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)

最新文章

更多>

教程昨日排行

更多>

友情链接

汇智网 PHP教程插件网

关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com

© 2014 bubuko.com 版权所有

打开技术之扣，分享程序人生！