ChIP-seq(一)

Homo sapiens,neuron神经元细胞的数据分析;

1. rawdata数据处理

了解ChIP-seq的实验流程 (qq.com)

下载数据

vim download_data.sh
#!/bin/bash
for i in 806 807 809 810 811 812 813 817 
do
  prefetch-orig.2.10.8 `srapath-orig.2.10.8 SRR13764${i}`
done
qsub -N download -cwd download.sh -q g5.q 

sra2fastq

single end 75 bp

vim sra2fastq.sh
#!/bin/bash
for i in 806 807 809 810 811 812 813 817 
do
  fastq-dump-orig.2.10.8 --split-3 -O fastq --gzip SRR13764${i}/SRR13764${i}.sra
done
qsub -N fastq -cwd sra2fastq.sh

fastqc

vim fastqc.sh
#!bin/bash
for i in 806 807 809 810 811 812 813 817
do
  fastqc SRR13764${i}.fastq.gz -o fastqc
done
qsub -N fastqc -cwd fastqc.sh -q g5.q

trim_galore

vim trim_galore.sh
#!bin/bash
for i in 806 807 809 810 811 812 813 817
do
  trim_galore --output_dir clean_data -q 25 --phred33 --length 36  SRR13764${i}.fastq.gz 
done
qsub -N trim_galore -cwd trim_galore.sh -q g5.q

2. Bowtie2 比对

介绍:生信软件 | bowtie2(测序序列与参考序列比对) - 云+社区 - 腾讯云 (tencent.com)
下载基因组hg19

wget -t 0 -c -b https://hgdownload.soe.ucsc.edu/goldenPath/hg19/bigZips/hg19.fa.gz

-c :如果下载一半断网中断了,wget -c +网址 可以续下载;
-t 0 :如果网速很慢, 总断开重新连接,“-t 0 ”会让他一直重试,直到把文件下载完成;
-b:后台下载;
检查下载数据的完整性

$md5sum hg19.fa.gz
806c02398f5ac5da8ffd6da2d1d5d1a9  hg19.fa.gz
$echo "806c02398f5ac5da8ffd6da2d1d5d1a9  hg19.fa.gz" > check_md5sum.txt
#将数据写入check_md5sum.txt文件
$md5sum -c check_md5sum.txt
#检测数据是否一致
hg19.fa.gz: OK

构建bowtie2索引文件

vim index.sh
#!/bin/bash
bowtie2-build hg19.fa hg19
qsub -N index -cwd index.sh

生成6个文件:
926M Apr 14 17:41 hg19.1.bt2
691M Apr 14 17:41 hg19.2.bt2
4.8K Apr 14 17:18 hg19.3.bt2
691M Apr 14 17:18 hg19.4.bt2
926M Apr 14 18:01 hg19.rev.1.bt2
691M Apr 14 18:01 hg19.rev.2.bt2

bowtie2比对 一步完成

vim bowtie2.sh
for i in 806 807 809 810 811 812 813 817
do
  bowtie2 -p 10 -x ~/chipseq/genome/index/bowtie_index/hg19 -U SRR13764${i}_trimmed.fq | samtools sort -O bam -@ 10 -o - > SRR13764${i}.bam
done
#循环生成bam文件

sort:对bam文件进行排序(不能对sam文件进行排序)
-O:--output format (SAM, BAM)
-@:samtools中设置排序和压缩的线程数,默认单线程
分两步完成的步骤:(1)运行bowtie2 获取 SAM 文件

nohup bowtie2 -p 10 -x ~/chipseq/genome/index/bowtie_index/hg19 -U SRR13764809_trimmed.fq -S CTCF_ChIP-seq.hg19.sam&

-S:write hits in SAM format;-q:query input files are fastq
(2) samtools转换排序为bam格式

samtools view -bS CTCF_ChIP-seq.hg19.sam  > CTCF_ChIP-seq.hg19.bam
#sam转bam
samtools sort -@ 10 CTCF_ChIP-seq.hg19.bam > CTCF_ChIP-seq.hg19.sorted.bam
#排序

sam格式详解:SAM文件的每一行代表一个reads的比对情况,包含12列(tab分割),从左往右,每一列的含义不同。
第一列:测序出来的reads序列数据名
第二列:flag之和
第三列:参考基因组的染色体名
第四列:比对到这个染色的具体位置(从1'端开始)如9486878
第五列:比对质量,是一个衡量比对好坏的打分结果,越高越好
第六列:比对具体信息的表达式 CIGAR字符串,M:完全比配;D:缺失。如49M表示连续49个完全匹配
第七列:=表示参考序列与reads一模一样,*表示没有完全一模一样的参考序列

第十列:reads碱基序列。
第十一列:ASCII 编码的read碱基质量
参考讲解:BOWTIE2 进行基因组比对 - 简书 (jianshu.com)
第二列flag的含义 :(1,2,4,8,16,32…)每个整数代表不同的含义。参考讲解:(5条消息) 2019/2/20_*.bam 与 *.sam文件中的flag的含义和统计结果_super_qun的博客-CSDN博客_bam flag

图片2.jpg

第六列GIGAR的含义

图片1.jpg

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容