Python学习笔记——jieba库

时间：2020-02-02 23:16:53 阅读：101 评论：0 收藏：0 [点我收藏+]

lcut（）函数：分割字符串，返回一个列表。

lcut_for_search（）函数：比lcut( )更加精准，但是会产生重复。

add_word( ) 函数：往分词词库里添加词语。

del_word( ) 函数：往分词词库里删除词语。

import jieba
s = "思考快与慢的作者是丹尼尔卡尼曼"

ls1 = jieba.lcut(s)
print(ls1)
jieba.add_word("思考快与慢")
ls1 = jieba.lcut(s)
print(ls1)
jieba.del_word("思考快与慢")

ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.add_word("思考快与慢")
ls2 = jieba.lcut(s,cut_all = True)
print(ls2)
jieba.del_word("思考快与慢")

ls3 = jieba.lcut_for_search(s)
print(ls3)
jieba.add_word("思考快与慢")
ls3 = jieba.lcut_for_search(s)
print(ls3)

输出：
[‘思考‘, ‘快‘, ‘与‘, ‘慢‘, ‘的‘, ‘作者‘, ‘是‘, ‘丹尼尔‘, ‘卡尼曼‘]
[‘思考‘, ‘快‘, ‘与‘, ‘慢‘, ‘的‘, ‘作者‘, ‘是‘, ‘丹尼‘, ‘丹尼尔‘, ‘尼尔‘, ‘卡‘, ‘尼‘, ‘曼‘]
[‘思考‘, ‘快‘, ‘与‘, ‘慢‘, ‘的‘, ‘作者‘, ‘是‘, ‘丹尼‘, ‘尼尔‘, ‘丹尼尔‘, ‘卡尼曼‘]


[‘思考快与慢‘, ‘的‘, ‘作者‘, ‘是‘, ‘丹尼尔‘, ‘卡尼曼‘]
[‘思考‘, ‘思考快与慢‘, ‘的‘, ‘作者‘, ‘是‘, ‘丹尼‘, ‘丹尼尔‘, ‘尼尔‘, ‘卡‘, ‘尼‘, ‘曼‘]
[‘思考‘, ‘思考快与慢‘, ‘的‘, ‘作者‘, ‘是‘, ‘丹尼‘, ‘尼尔‘, ‘丹尼尔‘, ‘卡尼曼‘]

Python学习笔记——jieba库

原文：https://www.cnblogs.com/zhengmq2010/p/12254169.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)