首页 > 编程语言 > 详细

Python_DL_July_深度学习_06_让计算机学会人类的文字:词嵌入

时间:2020-06-20 10:00:05      阅读:61      评论:0      收藏:0      [点我收藏+]

 

 

技术分享图片 技术分享图片

要对词去做编码,词与词之间是有关联的,对词组变成一些向量。对于图片是由RGB三个颜色通道组成,像素点是直接由这三个通道表示,颜色的差异度是可以通过RGB三个颜色的差异值体现出来。而文本不一样,它是一些更高层的数据。它是人造出来的一些token。我们希望词在空间当中,显示为一个分布状态。想实现一个单词在一种语言中的分布,与另一种语言中的分布相同。

 

技术分享图片 技术分享图片

 

要实现词在空间分布,就要把词映射到空间当中。并且把词与词之间的关系用距离表示,但这样也会出现一些问题。

技术分享图片  技术分享图片

 

 one-hot:给每个词一个下标,有多少个词,我就开多大的向量空间,并把对应下标的词设为1,其他都设为0.

技术分享图片

 

Python_DL_July_深度学习_06_让计算机学会人类的文字:词嵌入

原文:https://www.cnblogs.com/tlfox2006/p/13167538.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!