首页 > 编程语言 > 详细

Python学习笔记——jieba库

时间:2020-02-02 23:16:53      阅读:94      评论:0      收藏:0      [点我收藏+]

lcut()函数:分割字符串,返回一个列表。

lcut_for_search()函数:比lcut( )更加精准,但是会产生重复。

add_word( ) 函数:往分词词库里添加词语。

del_word( ) 函数:往分词词库里删除词语。

import jieba
s = "思考快与慢的作者是丹尼尔卡尼曼"

ls1 = jieba.lcut(s)
print(ls1)
jieba.add_word("思考快与慢")
ls1 = jieba.lcut(s)
print(ls1)
jieba.del_word("思考快与慢")

ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.add_word("思考快与慢")
ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.del_word("思考快与慢")

ls3 = jieba.lcut_for_search(s)
print(ls3)
jieba.add_word("思考快与慢")
ls3 = jieba.lcut_for_search(s)
print(ls3)

输出:
[思考, , , , , 作者, , 丹尼尔, 卡尼曼]
[思考, , , , , 作者, , 丹尼, 丹尼尔, 尼尔, , , ]
[思考, , , , , 作者, , 丹尼, 尼尔, 丹尼尔, 卡尼曼]


[思考快与慢, , 作者, , 丹尼尔, 卡尼曼]
[思考, 思考快与慢, , 作者, , 丹尼, 丹尼尔, 尼尔, , , ]
[思考, 思考快与慢, , 作者, , 丹尼, 尼尔, 丹尼尔, 卡尼曼]

 

Python学习笔记——jieba库

原文:https://www.cnblogs.com/zhengmq2010/p/12254169.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!