词向量:
GloVe词向量:2014年的英文维基百科上训练。400k词 每个词100维向量表示。
数据集:
20种新闻文本数据。
步骤:
1.把新闻样本转化为词索引序列。
词索引:每个词依次分配一个ID,只保留最常见的词。
2.生成一个词向量矩阵。第i列表示词索引为i的词的词向量。
3.将词向量矩阵载入Keras Embedding层。设置该层的权重不可在训练(把数据转成系数向量)https://www.zhihu.com/question/344209738
4.Kearas Embedding层之后连接一个1D的卷积层。用softmax全连接输出新闻类别。(特征抽取)https://www.jianshu.com/p/88bb976ccbd9
原文:https://www.cnblogs.com/liuguangshou123/p/13752274.html