原文链接:http://tecdat.cn/?p=10963
在本文中,我描述了如何在CRAN中搜索用于绘制ROC曲线的包,并重点介绍了六个有用的包。
尽管我从一些我想谈论的软件包开始就有了一些想法,例如ROCR和pROC(我在过去发现它们很有用),但我还是决定使用 相对较新的软件包pkgsearch来搜索CRAN并查看其中的内容。该package_search()
函数将文本字符串作为输入,并使用基本的文本挖掘技术来搜索所有CRAN。
经过一番尝试和错误之后,我确定了以下查询,其中包括许多与ROC相关的有趣软件包。
## # A tibble: 6 x 3
## score package downloads_last_month
## <dbl> <chr> <int>
## 1 690. ROCR 56356
## 2 7938. pROC 39584
## 3 1328. PRROC 9058
## 4 833. sROC 4236
## 5 266. hmeasure 1946
## 6 1021. plotROC 1672
为了完成选择过程,我做了艰苦的工作,浏览软件包的文档,以挑选出我认为通常对大多数数据科学家有用的内容。下图使用了Guangchuang Yu的dlstats
软件包,查看我选择分析的六个软件包的下载历史记录。
以下代码ROCR
使用包装随附的综合数据集设置并绘制默认的ROC曲线。在整个文章中,我将使用相同的数据集。
## Loading required package: gplots
##
## Attaching package: ‘gplots‘
## The following object is masked from ‘package:stats‘:
##
## lowess
pROC
也受到数据科学家的欢迎。我喜欢AUC
在图中绘制曲线下面积的置信区间非常容易。
该roc.curve()
函数 会绘制出干净整齐的ROC曲线 。
该软件包提供了许多功能丰富的ggplot()
几何图形 。
precrec
是另一个用于绘制ROC和精确调用曲线的库。
##
## Attaching package: ‘precrec‘
## The following object is masked from ‘package:pROC‘:
##
## auc
该evalmod()
函数的参数选项使生成各种模型特征的基本图变得容易。
ROCit
是一个用于绘制ROC曲线和其他二进制分类可视化效果的新程序包 ,并且正在迅速普及。
## Warning: package ‘ROCit‘ was built under R version 3.5.2
下图显示了正响应和负响应的累积密度。KS统计数据显示两条曲线之间的最大距离。
大数据部落 -中国专业的第三方数据服务提供商,提供定制化的一站式数据挖掘和统计分析咨询服务
统计分析和数据挖掘咨询服务:y0.cn/teradat(咨询服务请联系官网客服)
【服务场景】
科研项目; 公司项目外包;线上线下一对一培训;数据爬虫采集;学术研究;报告撰写;市场调查。
【大数据部落】提供定制化的一站式数据挖掘和统计分析咨询
欢迎选修我们的R语言数据分析挖掘必知必会课程!
原文:https://www.cnblogs.com/tecdat/p/12327305.html