群体DNA甲基化分析1——基因组各个组分相关统计

写于20201114
这部分，我是进行了基因组各个组分的一些统计。详细内容如下：

01.DMR和NSR在基因组中各个组分的占比
02.基因组各个基因组成分（exon、intron、TE和intergenic）的核酸多态性
03.各个亚群这些组分的核酸多态性分析
04.DMR、DSR和NSR这些组分的核酸多态性
05.DMR中各个组分的遗传多样性比较
06.整体DMR遗传多样性比较
07.DMR在基因组分上的分布（分Hyper和Hypo）
08.总体PIM到CER和CER到BIGD甲基化水平的趋势
09.三种类型DNA甲基化circos图
10.6圈DMR一圈驯化，一圈染色体的整体DMR的图谱
11.DMR的频率分布
借鉴文章中的结果图：

1.

图1

2.

图2

3.

图3

4.

图4

5.

图5

6.

图6-1

7.

图6-2

8.

图7

9.

图8

10.

图9

11.

图10

12.

图11

-------------------------------------------------------------------------------------

1.DMR和NSR在基因组中各个组分的占比
获取基因间区序列，需要先获取gene.bed和TE.bed，然后用bedtools complement 进行找到互补区域
bedtools complement -i gene.bed -g genome.bed
但是注意的是，这个互补区域中每条染色体的第一个位置为0，这样会对后面bedtools 操作造成报错。

获取TE、exon、intron和intergenic的bed后，用bedtools的intersect进行取交集，反映出覆盖了多少组分。
bedtools intersect -a exon.bed -b DOM.fin.bed -wb |awk '{print $4"\t"$5"\t"$6}' |less > temp.bed最开始我没想到，会有重复的行，所以造成间区和TE的区域特别多，后来我想到这个问题，所以需要添加bedtools sort -i temp.bed > temp.s.bed和bedtools merge -i temp.s.bed |awk '{sum+=($3-$2)}END{print sum}'|less
这样得到DMR和DSR的组分信息。

最后编辑于：2020.11.18 16:47:40

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

群体DNA甲基化分析1——基因组各个组分相关统计

群体DNA甲基化分析1——基因组各个组分相关统计

-------------------------------------------------------------------------------------

相关阅读更多精彩内容

友情链接更多精彩内容