首页 > 其他 > 详细

SNPEFF snp注释

时间:2019-06-02 22:20:54      阅读:112      评论:0      收藏:0      [点我收藏+]

SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes

详细的说明请阅读:

http://snpeff.sourceforge.net/SnpEff_manual.html

一, 安装:

首先在家目录下, 下载安装包

wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip

然后进行解压

unzip snpEff_latest_core.zip

会产生一个snpEff目录 所有的程序都在这里面

二, 配置自己的基因组和注释文件

使用IWGSCv1.0参考基因组,命名为IWGSCv1.0.fa

基因组注释文件使用IWGSCv1.0释放的:

iwgsc_refseqv1.0_HighConf_2017Mar13.gff3

iwgsc_refseqv1.0_LowConf_2017Mar13.gff3

将上述两个文件合并成名为genes.gff 的文件。注意一定要是这个名字!!!

准备好上述文件之后

首先编辑配置文件,加入新基因组的entry。配置文件在snpEff目录下, 配置文件名为snpEff.config。用vi进行编辑(或其他文本编辑器) 加入如下两行:

在Third part datebase下面输入

#wheat genome, version IWGSCv1.0

IWGSCv1.0.genome : wheat

然后保存退出。

还是在snpEff文件下, 创建目录data

mkdir data

cd data

在data目录下,创建 IWGSCv1.0 和 genomes目录

mkdir IWGSCv1.0

mkdir genoems

将你的gff3注释文件放在IWGSCv1.0目录下

将你的参考序列文件放在genomes目录下。

完成后回到 snpEff 目录, 执行命令:

java -jar snpEff.jar build -gff3 -v Osativa_204

三, 开始统计执行:

先将vcf文件copy到data目录下

这里以我们常用的90K SNP芯片为例,已经转换成VCF格式。

#CHROM POS ID REF ALT QUAL FILTER
chr1A 798845 BobWhite_c1859_469 T C 1000 PASS
chr1A 1145448 BS00000713_51 A G 1000 PASS
chr1A 1145499 BS00023176_51 C T 1000 PASS
chr1A 1159689 IACX7339 A G 1000 PASS
1
2
3
4
5
6
然后在snpEff目录下执行命令:

java -Xmx8g -jar snpEff.jar IWGSCv1.0 data/90k_snp.vcf > 90k_snp.eff.vcf

命令执行完后在snpEff目录下会产生三个文件

snpEff_genes.txt

snpEff_summary.html

90k_snp.eff.vcf

四,结果的说明:

snpEff_genes.txt 和snpEff_summary.html比较简单,打开就能明白。

每个SNP的信息都保存在90k_snp.eff.vcf里,打开之后可能有点蒙,参考下边的网址就好理解了。

http://snpeff.sourceforge.net/SnpEff_manual.html#input

这么多SNP还需要进一步筛选,以后有机会在介绍。
---------------------
作者:msw521sg
来源:CSDN
原文:https://blog.csdn.net/msw521sg/article/details/77103620
版权声明:本文为博主原创文章,转载请附上博文链接!

SNPEFF snp注释

原文:https://www.cnblogs.com/zhanmaomao/p/10964636.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!