ChIP-Seq

#从ncbi下载数据,GEO-GEO号/SRA-SRA号/SRA-SRP号,找到最终的SRP号,

#在搜索界面send to file:Runinfo,内含https下载链接

#或send to file:accession list,记下每一行值,补全链接为:

#ftp://ftp-trace.ncbi.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR(前三位)/SRR(全名)/SRR(全名).sra

#下载目前使用idm和迅雷下载,prefetch下载太慢,ascp又不能用,后拷贝至分析端


0.环境准备(针对win10 ubuntu子系统)

#linux清密码

#apt换源(清华源)

#sudo apt-get update

#sudo apt-get upgrade

#安装图形界面(不装fastqc老是报错)

#安装中文语言包(随意)

#安装miniconda3,手动激活环境变量,更换源,更换python版本为3.6(3.7版有个东西用不了,啥东西暂时忘了)

#apt装fastqc,bwa,samtools,bamtools,trimmomatic,tree,pandoc,unzip,axel,aria2(zsh,oh-my-zsh)

#conda装sra-tools,multiqc,bowtie2

#手动安装aspera


1. sra转为fastq

fasterq-dump -3 -e 8 -p -o 输出路径 sra文件

#(-e 指定线程数,-3<=>--split-3,-p 唠叨模式)

rename 's/.sra//' 输入文件(去除文件名中的.sra)


2.质检

#将所有的数据进行质控,得到zip的压缩文件和html文件

fastqc -o 输出路径 -t 8 fastq文件1 fastq文件2 ... fastq文件n(-t 指定线程数)

multiqc -t default -o 输出路径 -f 输入路径(-t 输出格式为默认)


3.比对

bowtie2 --local -3 整型-5 整型 -p 6 -x index位置 -U fastq文件 | samtools sort -o 输出的排过序的bam文件路径及名称

# --local表示使用local模式,在这种模式下,Bowtie2不要求整个读取从一端到另一端对齐。相反,为了达到最大可能的对齐分数,可以从末端省略一些字符(“软裁剪”)

#(-p 指定线程数, -U 表示单端测序,-3或-5 表示从3‘端或5端’某个碱基位置开始修剪) 


4.peak calling

macs callpeak -c 对照的bam文件 -t 实验的bam文件 -q 0.05 -f BAM -g mm -n suz12

#(-q FDR值,-f 输入文件格式,-g 基因组类别,-n 输出文件的前缀名)

#narrowPeak结尾的文件可导入进行分析

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容