考虑 \(w1\) 和 \(w2\) 的共显频率,构建向量拟合共显频率,loss函数如下
斯坦福原始博客:https://nlp.stanford.edu/projects/glove/
\(\alpha\) :业务上通过调整该指,使得 loss 更多关注低频共线词,我们不用过于关注高频词,只要高于阈值即可
苏神认为添加的常量 \(b\) 有问题,会导致停用词等出现次数多的词 模长更大,但实验效果一般。https://kexue.fm/archives/4675
相似度:模长代表了重要程度,可归一化之后再求内积,作为相似度。https://kexue.fm/archives/4677
苏神的 simple_glove 相比原生的 Glove,拟合的是两个词的 点间互信息,而原生Glovo 拟合共现频次 https://kexue.fm/archives/4675
csdn少见的整齐博客:https://blog.csdn.net/coderTC/article/details/73864097
之前还能看,后来就没了:http://www.fanyeong.com/2018/02/19/glove-in-detail/
原文:https://www.cnblogs.com/wa007/p/15172416.html