使用如下命令安装并启用 EPEL (如果已经安装过则忽略)
yum install epel-release
使用如下命令安装R
yum install R
OHDSI开源项目,R包,提供连接数据库方法,可连接各种数据库,直接从镜像安装
github地址https://github.com/OHDSI/DatabaseConnector
install.packages("DatabaseConnector")
OHDSI开源项目,R包,用于CDM数据质控,目前支持OMOP CDM v5.3.1 与 v5.2.2版本质控,其他CDM需要修改源码与csv等配置文件
github地址https://github.com/OHDSI/DataQualityDashboard
install.packages("devtools")
devtools::install_github("OHDSI/DataQualityDashboard")
从github获取DataQualityDashboard项目源码,打开extras/codeToRun.R脚本文件,填写配置信息,然后使用Rscript执行,或者在R环境下依次执行
需质控的cdm数据库、用于输出结果的数据库(可为空)、cdm名称(用于识别)
包括表、字段、concept三个级别,约20个项目,如字段非空、主键、外键、值合理性等,在inst/csv/ OMOP_CDM_v5.3.1_Check_Desciptions.csv下可查看具体项目。同目录下Table_Level.csv、Field_Level.csv、Concept_Level.csv文件,可查看每个质控项目详细规则
前面writeToTable设置为true即可自动写入,若没有配置,这里可手动执行
codeToRun.R中配置内容可在R环境中分步执行,或者执行脚本
Rscript codeToRun.R & > codeToRun.log &
日志与质控结果输出到“outputFolder”路径,结果输出格式为results_*.json文件,同时写入到“resultsDatabaseSchema”数据库中表中
注意:执行过程中,可能报错 Error in `$<-.data.frame`(`*tmp*`, " DQD_VERSION ", value = "1.0.0") : replacement has 1 row, data has 0,这是因为cdm数据库中,cdm_souce表为空(该表主要存储cdm版本等元数据信息,会一起输出到结果,用于结果展示),而空数据集无法增加新列并赋值,因此源码中执行到metadata$DQD_VERSION语句就会报错
DataQualityDashboard::viewDqDashboard(jsonPath = file.path(getwd(), outputFolder, cdmSourceName, sprintf("results_%s.json", cdmSourceName)))
安装http-server
npm install -g http-server
进入inst/shinyApps/www目录下,将质控结果results_*.json重命名为results.json(或者将index.html中results.json替换为results_*.json),启动服务即可
http-server
浏览器打开地址http://服务器地址:8080即可查看结果
源码文件为R/execution.R,主要方法为executeDqChecks,详细内容如下
原文:https://www.cnblogs.com/ohmyuan/p/13707305.html