失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > GWAS数据分析流程—SNP Indel注释

GWAS数据分析流程—SNP Indel注释

时间:2021-12-18 15:11:28

相关推荐

GWAS数据分析流程—SNP Indel注释

1、snpeff

1.1、snpeff软件下载

wget https://snpeff.blob./versions/snpEff_latest_core.zipunzip snpEff_latest_core.zipcd snpEff

解压后即可使用。

1.2、在snpeff文件夹下新建一个命名为data的文件夹,data文件夹下面再新建一个要生成数据库的文件夹,命名为maize,在maize里面下载参考基因组序列和基因组的GTF文件,分别重命名为sequences.fa和genes.gtf。

1.3、定义snpEff.config文件,

vi snpEff.config打开snpEff.config文件,添加

# maizegenome, version maizev5maize.genome : maize

如图所示:

1.4、SNP、Indel注释

##SNP注释java -Xmx4g -jar /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.config -ud 2000 -csvStats maizesnp.csv -htmlStats maizesnp.html -o vcf maizev4 maize.snp.filed.vcf > maize.filtered.snp.ann.vcf ##indel注释java -Xmx4g -jar /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.jar -c /ipm1/hang/pl/program/snp_indel_snpeff/snpEff/snpEff.config -ud 2000 -csvStats maizeindel.csv -htmlStats maizeindel.html -o vcf maizev4 maize.indel.filed.vcf > maize.filtered.indel.ann.vcf

2、annovar

2.1、软件安装

annovar下载地址Download ANNOVAR - ANNOVAR Documentation

解压后输出环境变量

export PATH=/ipm1/hang/pl/program/snp_indel_snpeff/annovar:$PATH

annovar的使用需要gtfToGenePred软件包

下载地址为:/?target=http%3A//hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/

下载后运行 chmod +x ./gtfToGenePred 增加运行权限

2.2、将GTF文件转换成refGene格式

gtfToGenePred -genePredExt -ignoreGroupsWithoutExons genes.gtf maize_refGene.txt

2.3、建立注释库

/ipm1/hang/pl/program/snp_indel_snpeff/annovar/retrieve_seq_from_fasta.pl --format refGene --seqfile sequences.fa maize_refGene.txt --out maize_refGeneMrna.fa

2.4、将VCF文件转换成表格格式输入文件

##SNP/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.snp.filed.vcf > maize.snp.vcf.annovar.input##Indel/ipm1/hang/pl/program/snp_indel_snpeff/annovar/convert2annovar.pl -format vcf4 -allsample -withfreq maize.indel.filed.vcf > maize.indel.vcf.annovar.input

2.5、SNP、Indel注释

##SNP注释 /ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize -dbtype refGene -outfile maizesnp.anno -exonsort maize.snp.vcf.annovar.input ./##indel注释/ipm1/hang/pl/program/snp_indel_snpeff/annovar/annotate_variation.pl -geneanno --neargene 2000 -buildver maize -dbtype refGene -outfile maizeindel.anno -exonsort maize.indel.vcf.annovar.input ./

2.6、统计变异信息、查看变异类型等

less -S maizesnp.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -cless -S maizeindel.anno.variant_function |cut -f 1|sed 's/;/\n/g' |sort | uniq -c

如果觉得《GWAS数据分析流程—SNP Indel注释》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。