首页 > 编程语言 > 详细

nlp 第五节课 语言技术-词表达 word2Vec

时间:2020-08-28 09:58:37      阅读:76      评论:0      收藏:0      [点我收藏+]

https://www.bilibili.com/video/BV1kE411G7qo?p=5

 

1. Word Representation:

   one-hot vector :

  1)稀疏

  2) 每一个词向量之间都是垂直,没法算相似度技术分享图片

 

 技术分享图片

 

 

2. Semantic Similarity 

  语义 similarity, 用上下文来表示一个词

技术分享图片

 

 

  1) Count-Based Methods

 

  滑动窗口

  语料库 corpus技术分享图片

 

 

  技术分享图片

 

   技术分享图片

 

   

 

技术分享图片

 

   2) TF - IDF

  TF = 词 i 在文本 j 中出现次数 / 文本 j 中总词数

  IDF =  log (所有文档数量/包含词 i 的文档数量)

 

  技术分享图片

 

 

  3)embedding 

  技术分享图片

 

   技术分享图片

 

 

 

3. Neuron Network

  1) LR 一个神经元

  技术分享图片

 

   

  技术分享图片

 

 

  技术分享图片

 

 

  技术分享图片

 

   压缩,加密解密技术分享图片

 

   

  2)Back Propagation

  技术分享图片

技术分享图片

 

 技术分享图片

 

 技术分享图片

 

 技术分享图片

 

   

4. Word2Vec

  

 

nlp 第五节课 语言技术-词表达 word2Vec

原文:https://www.cnblogs.com/ChevisZhang/p/13574922.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!