DamID-seq分析笔记（一）

pre: 尽量写详细点，方便理解

1：
illumia机器测序的方向是3---->5,附上一张图：

image.png

我是PE150测序，测序的adapter ：GATCG GAAGA
拿到数据的第一眼，先看一下测序的情况，我先打开一个fq的文件先看看：

cat  XXX_R1.fq | grep GATCGGAAGA

illumia机器测序的方向是3-5，从这个情况来看，trim之后的有些reads长度会短一些。

但是因为在加接头之前需要加A,再加接头，我们把这个碱基往前挪去A去看，然后就可以发现都序列特征是AG

这个是DamID-seq的数据
我们需要知道，DamID是利用Dam和DpnI来工作的，DpnI的位点是G(me)ATC :

结合3--->5的illumia的测序，我们知道，有AG开头的reads是我们要的reads.

(PS:记得在Adapter 后面加个A)
数据处理思路
1：先用cutadapt去掉接头
然后跑一个fastqc看一些结果，如果碱基质量很好的话，可以不用trim，如果碱基质量不够好还是需要trim的

cutadapt -a ADAPTER_FWD -o out.1.fastq -p out.2.fastq reads.1.fastq reads.2.fastq

2（可选）：trimmomatic

java -jar /asnas/sunyl_group/liull/software/Trimmomatic-0.36/trimmomatic-0.36. jar  PE Reads_R1. fq.gz Reads_R2.fq.gz reads_R1.trimmo.fq unpair_1.trimo.fq reads_R2.trimmo.fq unpair_2.trimo.fq LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15  MINLEN:51

那么好，接下来把接头给去了，并且去掉一些低质量的数据：
接下来就是mapping 到基因组上

总结一下：
利用cutadapter去了接头
trimmomatic去了低质量数据（可选）
fastqc看结果

下一步：mapping

最后编辑于：2021.03.06 17:29:34

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

DamID-seq分析笔记（一）

DamID-seq分析笔记（一）

pre: 尽量写详细点，方便理解

相关阅读更多精彩内容

友情链接更多精彩内容