我的工程实践项目为基于情感词典的文本情感分析,下面是我对我的工程实践进行用例建模的分析,主要经过以下四个步骤的分析:确定研讨的系统、识别 Actors、识别用例、建立 Actor 和 Use Cases 之间的关联。其中Actors是主要的开发人员,主要的用例有三个部分:
1.获取数据集。这个大致有三个方法,可以直接从网上下载现成的数据集,可以通过企业开放的API获取数据,然后是自己编写爬虫从网页上爬取数据。
2.构建情感词典。这部分是利用现有的情感词典并对其进行语义扩充。
3.情感分析。主要是利用文本分词与领域情感词典的匹配情况,得到情感值。
用例图如下:
High level use case:
获取数据集
构建情感词典
情感分析
Expanded use case:
获取数据集Expanded use case:下载公开数据集、通过API接口获取、爬虫抓取,。
构建情感词典Expanded use case:扩展情感词典,公开的情感词典可能并不适用于商品领域,为了得到更精确的结果,需要利用语义的相识度来扩展得到电商领域的情感词典。
情感分析Expanded use case:构建LDA主题模型,主要目的就是要识别主题,将结果清晰地展现地出来。
原文:https://www.cnblogs.com/zcs224/p/11785482.html