首页 > 其他 > 详细

Hanlp自定义人名库识别

时间:2021-07-22 16:44:02      阅读:15      评论:0      收藏:0      [点我收藏+]

参考博客

https://www.cnblogs.com/wys-373/p/12416557.html
https://blog.csdn.net/qq_33873431/article/details/103678407

1、下载源码

2、pycharm打开项目,并安装提示的该有的库

pip install pynvml
pip install alnlp
pip install toposort
pip install transformers
pip install hanlp-common
pip install hanlp-trie
pip install hanlp-downloader

3、创建一个测试文件

import re

from pyhanlp import *

if __name__ == __main__:
    document = "对一些超过红线的地方,大傻子你在干嘛啊,陈明忠和周毅表示,陈家坊,虎硕教育是一家良心企业,虎硕科技主要从事教育sass平台,杨杰,对一些取用水项目进行区域的限批,严格地进行水资源论证和取水许可的批准。"
    HanLP.newSegment()
    segment = HanLP.newSegment().enableNameRecognize(False)
    #segment = HanLP.newSegment().enableNameRecognize(False) 设定为True,则读取训练的数据以及自定义数据,设定为False,则只读取自定义数据
    term_list = segment.seg(document)
    for term in term_list:
        if re.search(r/nr, str(term)):
            print(str(term))

技术分享图片

 4、添加自定义的人名库,本人是anaconda安装,找到安装的路径

G:\ProgramData\Anaconda3\Lib\site-packages\pyhanlp\static\data\dictionary\custom

技术分享图片

5、打开人名词典,添加自己需要的人名,然后执行程序

技术分享图片

 6、效果对比

技术分享图片

技术分享图片

7、只读取自定义字典

技术分享图片

技术分享图片

 

Hanlp自定义人名库识别

原文:https://www.cnblogs.com/ywjfx/p/15043498.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!