jieba库分词的三种模式:
1、精准模式:把文本精准地分开,不存在冗余
2、全模式:把文中所有可能的词语都扫描出来,存在冗余
3、搜索引擎模式:在精准模式的基础上,再次对长词进行切分
函数 | 功能 |
jieba.lcut(s) | 精确模式,返回list类型 |
jieba.lcut(s,cut_all=True) | 全模式模式,返回list类型 |
jieba.lcut_for_search(s) | 搜索引擎模式,返回list类型 |
jieba.cut(s) | 精确模式,返回可迭代对象 |
jieba.cut(s,cut_all=True) | 全模式模式,返回可迭代对象 |
jieba.cut_for_search(s) | 搜索引擎模式,返回可迭代对象 |
jieba.add_word("新增词") | 在分词词典中添加新词 |
原文:https://www.cnblogs.com/hybh/p/13021940.html