本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome
作者:小哈 来源:嘉因
在RNA测序分析,哪家公司适合我一文中,聊过类似的问题。
这次小哈搬来了statQuest的3个最新视频,https://statquest.org/video-index/,点击左下角“阅读原文”直达statQuest视频目录。帮你理清RNA-seq数据预处理方法,哪个更适合你的问题。
先说结论:
学术界已经不再推荐RPKM、FPKM;
比较基因的表达丰度,例如哪个基因在哪个组织里高表达,用TPM做均一化处理;
不同组间比较,找差异基因,先得到read counts,然后用DESeq2或edgeR,做均一化和差异基因筛选;如果对比某个基因的KO组和对照,推荐DESeq2。
如果找公司做RNA-seq数据处理,计算表达量时,记得要read counts。
RPKM/FPKM、TPM
在RNA-Seq分析|RPKM, FPKM, TPM, 傻傻分不清楚?里,根据上面的视频用汉语描述了这三个值的区别。
下面是视频截图
不再用RPKM/FPKM,现在推荐用TPM
一表看懂TPM更适合比较同一基因在不同sample间表达丰度的差异
DESeq2或edgeR
DESeq2和edgeR不用RPKM/FPKM或TPM做均一化,而是直接用原始的read counts做均一化处理。
DESeq2和edgeR能很好的解决这两个问题
测序深度的差异问题,用RPKM/FPKM、TPM、DESeq2和edgeR都能处理
如果组间RNA成分差异较大,怎么办?
例如liver跟spleen比,组织特异性表达基因在里面捣乱;再例如常见的某个基因KO组与对照相比,该基因成分在KO组里缺失。
DESeq2做均一化
用edgeR作均一化
TPM、read counts、RPKM/FPKM你选对了吗?
原文:https://www.cnblogs.com/wangprince2017/p/9813376.html