SnpEff is a variant annotation and effect prediction tool. It annotates and predicts the effects of variants on genes
详细的说明请阅读:
http://snpeff.sourceforge.net/SnpEff_manual.html
一, 安装:
首先在家目录下, 下载安装包
wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip
然后进行解压
unzip snpEff_latest_core.zip
会产生一个snpEff目录 所有的程序都在这里面
二, 配置自己的基因组和注释文件
使用IWGSCv1.0参考基因组,命名为IWGSCv1.0.fa
基因组注释文件使用IWGSCv1.0释放的:
iwgsc_refseqv1.0_HighConf_2017Mar13.gff3
iwgsc_refseqv1.0_LowConf_2017Mar13.gff3
将上述两个文件合并成名为genes.gff 的文件。注意一定要是这个名字!!!
准备好上述文件之后
首先编辑配置文件,加入新基因组的entry。配置文件在snpEff目录下, 配置文件名为snpEff.config。用vi进行编辑(或其他文本编辑器) 加入如下两行:
在Third part datebase下面输入
#wheat genome, version IWGSCv1.0
IWGSCv1.0.genome : wheat
然后保存退出。
还是在snpEff文件下, 创建目录data
mkdir data
cd data
在data目录下,创建 IWGSCv1.0 和 genomes目录
mkdir IWGSCv1.0
mkdir genoems
将你的gff3注释文件放在IWGSCv1.0目录下
将你的参考序列文件放在genomes目录下。
完成后回到 snpEff 目录, 执行命令:
java -jar snpEff.jar build -gff3 -v Osativa_204
三, 开始统计执行:
先将vcf文件copy到data目录下
这里以我们常用的90K SNP芯片为例,已经转换成VCF格式。
#CHROM POS ID REF ALT QUAL FILTER
chr1A 798845 BobWhite_c1859_469 T C 1000 PASS
chr1A 1145448 BS00000713_51 A G 1000 PASS
chr1A 1145499 BS00023176_51 C T 1000 PASS
chr1A 1159689 IACX7339 A G 1000 PASS
1
2
3
4
5
6
然后在snpEff目录下执行命令:
java -Xmx8g -jar snpEff.jar IWGSCv1.0 data/90k_snp.vcf > 90k_snp.eff.vcf
命令执行完后在snpEff目录下会产生三个文件
snpEff_genes.txt
snpEff_summary.html
90k_snp.eff.vcf
四,结果的说明:
snpEff_genes.txt 和snpEff_summary.html比较简单,打开就能明白。
每个SNP的信息都保存在90k_snp.eff.vcf里,打开之后可能有点蒙,参考下边的网址就好理解了。
http://snpeff.sourceforge.net/SnpEff_manual.html#input
这么多SNP还需要进一步筛选,以后有机会在介绍。
---------------------
作者:msw521sg
来源:CSDN
原文:https://blog.csdn.net/msw521sg/article/details/77103620
版权声明:本文为博主原创文章,转载请附上博文链接!
原文:https://www.cnblogs.com/zhanmaomao/p/10964636.html