人类基因组hg19.fa和hg38.fa下载及基因注释下载-纯脚本

##===============参考基因组hg19、hg38下载=================####

#对应的版本可参考http://www.bio-info-trainee.com/1469.html  https://blog.csdn.net/leadingsci/article/details/82947869

================ 下载USCS版本的hg19====================

$ mkdir -p ~/reference/genome

$ cd ~/reference/genome

$ nohup wget http://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/chromFa.tar.gz &

# 解压,得到所有染色体的信息

================检测文件完整性===============

# 打开码文件

cat md5sum.txt

## 将chromFa.tar.gz的码写入一个新文件

echo "ec3c974949f87e6c88795c17985141d3  chromFa.tar.gz" > check_md5sum.txt

## 检测

md5sum -c check_md5sum.txt

##显示 chromFa.tar.gz: OK

===============查看染色体,看染色体命名规律=============

cat hg19.chrom.sizes |head -n 25

===============解压参考基因组,显示所有染色体单个文件======

$ tar -zxvf chromFa.tar.gz

===============将不要的染色体,移动到暂存的文件夹=========

mv chrUn_gl0002* chr*_random.fa  chr*ctg* chr*apd* chr*cox* chr*hap* temp

===============将需要的染色体进行合并,并移动到单个fa文件暂存文件夹======

for i in chr1.fa chr2.fa chr3.fa chr4.fa chr5.fa chr6.fa chr7.fa chr8.fa chr9.fa chr10.fa chr11.fa chr12.fa chr13.fa chr14.fa chr15.fa chr16.fa chr17.fa chr18.fa chr19.fa chr20.fa chr21.fa chr22.fa chrX.fa chrY.fa chrM.fa

do

echo $i;

#cat $i >> hg19.fa

mv $i chrfa

done

==============bwa进行索引构建===========================

bwa index -a bwtsw -p hg19.fa hg19.fa

#mkdir chrfa

#mv chromFa.tar.gz chrfa/

=============fai结尾======================

samtools faidx hg19.fa

## 显示生成  hg19.fa.fai

samtools faidx hg38.fa

=============dict结尾===================

gatk CreateSequenceDictionary -R hg19.fa -O hg19.dict

欢迎同行一起交流讨论

微信 forensic_JS

QQ1956238898

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容