首页 > 其他 > 详细

Glove

时间:2021-08-22 18:47:32      阅读:20      评论:0      收藏:0      [点我收藏+]

基本概念

考虑 \(w1\)\(w2\) 的共显频率,构建向量拟合共显频率,loss函数如下

\[\sum_{w1,w2}{F(X_{ij})(w_i^T\hat{w_j} + b_i + \hat{b_j} - log(X_{ij}))} \]

斯坦福原始博客:https://nlp.stanford.edu/projects/glove/

调参

\(\alpha\) :业务上通过调整该指,使得 loss 更多关注低频共线词,我们不用过于关注高频词,只要高于阈值即可

其他思考

苏神认为添加的常量 \(b\) 有问题,会导致停用词等出现次数多的词 模长更大,但实验效果一般。https://kexue.fm/archives/4675

相似度:模长代表了重要程度,可归一化之后再求内积,作为相似度。https://kexue.fm/archives/4677

苏神的 simple_glove 相比原生的 Glove,拟合的是两个词的 点间互信息,而原生Glovo 拟合共现频次 https://kexue.fm/archives/4675

参考博客

csdn少见的整齐博客:https://blog.csdn.net/coderTC/article/details/73864097

之前还能看,后来就没了:http://www.fanyeong.com/2018/02/19/glove-in-detail/

Glove

原文:https://www.cnblogs.com/wa007/p/15172416.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!