今天进行项目的第二阶段,进项关键字的提取,本打算利用hanlp进行分词,将成果简介中的数据提取,可是在Python中安装pyhanlp之后运行老是报错
提示无法引入包,找不到Java路径,还根据教程下载了hanlp的资源包,放到pyhanlp的static路径下还是无法解决,折腾了一晚上还是没弄出来
所以选择使用TextRank 或者是TF-IDF方法进行分词了,等完成之后继续解决。
项目日报(二)
原文:https://www.cnblogs.com/1gaoyu/p/12489379.html