首页 > 其他 > 详细

jieba库分词词频统计

时间:2018-04-11 22:40:01      阅读:463      评论:0      收藏:0      [点我收藏+]

代码已发至github上的python文件

词频统计结果如下(词频为1的词组数量已省略):

{‘是‘: 5, ‘风格‘: 4, ‘擅长‘: 4, ‘的‘: 4, ‘兴趣‘: 4, ‘宣言‘: 4, ‘有‘: 3, ‘python‘: 3, ‘代码‘: 2, ‘员‘: 2, ‘helloworld‘: 2, ‘哲学‘: 2, ‘当‘: 2, ‘对‘: 2, ‘很‘: 2, ‘matlab‘: 2, ‘平凡‘: 2}

用词特点:

柱形图和饼图的创建通过代码实现
图画中只显示频数2以上的词频
重复的词频较少,说明我们团队中,每个人都有擅长的地方,彼此间可以互补
用词方面直接明了,富有幽默感,各自的宣言也很有创意

柱形图如下:

技术分享图片

 

饼图:

 技术分享图片

 

jieba库分词词频统计

原文:https://www.cnblogs.com/lkdgn/p/8799054.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!