摘要:
许多宏基因组分类工具在宏基因组学领域增长速度飞速。然而,在这个领域相近物种的分类仍然是一个挑战。这里,我们用两个宏基因组数据集,人类宏基因组数据和环境宏基因组数据对比MetaPhlAn2, kallisto 和 Kraken的性能。研究表明kallisto比MetaPhlAn2 和Kraken有更高的敏感度,并且在物种水平上的分类精确度也比kraken高。我们的研究还表明在运行全基因组的分类工具会将不存在的物种分类到存在的物种上。为了减少这种FP,在我们的流程中MetaPhlAn2我们介绍marker基因,它使用Kallisto为分类步骤,作为用于物种检测一个附加的过滤步骤。