首页 > 系统服务 > 详细

SEO 百度的中文分词匹配技术

时间:2015-12-02 17:33:22      阅读:325      评论:0      收藏:0      [点我收藏+]
目的是探测一下百度的中文分词匹配技术,百度对于搜索结果采用的是“与”逻辑,而且这个”与”逻辑在排名中应该有很高分值,由于是实验,为了加快收录,以取得更快的实验结果,我们对测试的三个页面加了些随机的文章,跟标题无关,外链方面都是均等的,都只有我这一个外链给它们,为了不影响标题的关键词匹配!同时也印证一下李彦宏所说的话。

以下为引用的内容:

记者:为什么对同一词条,百度与其他搜索引擎出来的结果不一样呢?
李彦宏:比如,在百度,检索词越长,用户找到的检索数目就越少。因为,我们认为用户检索的所有词语都应该出现,这样才能确保检索的精确性。但在谷歌或西方的搜索引擎,检索词越长,检索到的信息就越多。它们认为,与检索词中任一词语相关的信息都应该出现。换句话说,百度采用的是“与”逻辑,而谷歌或西方的搜索引擎采用的则是“或”逻辑。对用户来说,检索结果数量的多少并没有太大价值,最关键的是,他想要找的东西找到没有。

实验的第一个页面标题:李彦宏为什么吃饭?

实验的第二个页面标题:李彦宏为什么吃饭还要拿筷子?

实验的第三个页面标题:李彦宏为什么还要拿筷子吃饭?

实现前搜索结果:

技术分享

测试一小时后就收录了,当然结果也出来了。

试验后结果图片:

技术分享
李彦宏为什么吃饭还要拿筷子

技术分享
李彦宏为什么吃饭还要

技术分享
李彦宏为什么吃饭

技术分享
李彦宏吃饭

技术分享

技术分享

从试验后图片1中的结果可以看出,百度对完全匹配的检索词给予很高的分值,即使检索词的排序不同,只要这些词全部包含在页面中,都是可以加分的,这同样也能解析关键词堆砌对百度有用,而对google无用,了解了这些,也对大家做长尾关键词有个很好指导,而从以上四张图片中也验证了李彦宏所说的话:检索词越长,检索到的结果越少。大家有兴趣的自己可以再对比下google的结果,这就不难解析,为什么搜索一些词google的结果会多些了,两者的差异:百度采用的是“与”逻辑,而谷歌或西方的搜索引擎采用的则是“或”逻辑。

此实验并未考虑排名的其它因素(比如外链,网站权重,检索词出现的次数等),所以排名只能横向对比,就是看我的三个实验页面的结果进行对比。(现在大家应该知道李彦宏吃饭为什么用筷子了吧!)以上只是个人看法,也非常欢迎大家有不同的看法一起交流。

原文链接地址: http://www.1860z.com/1109.html  作者:叶松

SEO 百度的中文分词匹配技术

原文:http://www.jb51.net/yunying/24184.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!