Hi-C学习

原理

3014937-b66c93b9c55b0e7e.png

1.使用甲醛使三维空间上相邻的DNA之间形成共价键,使DNA交联
2.使用限制性内切酶切割相邻的片段形成相同的粘性末端
3.使用带有标记的序列填补粘性末端为平末端
4.将相邻的平末端的序列连接起来,形成一个环
5.将序列切割成小段,并用链霉亲和素磁珠将带有标记的小片段富集起来
6.洗脱磁珠上的片段,加接头,使用二代双末端测序的方法得到包含酶切位点序列的序列信息
这个视频把原理和实验的步骤说的很详细了:
https://www.jove.com/video/1869/hi-c-a-method-to-study-the-three-dimensional-architecture-of-genomes

分析策略

3014937-09c5bfbeff18467e.png

1.quality control 同 NGS analysis
2.比对到基因组上,比对的方式主要分两种,一种判断每条reads是否含有酶切位点,有则在酶切位点打断分割序列分别进行bowtie2单端比对;另一种采用单端比对的策略,以25bp为起始长度,每次增加5bp直到该reads比对到基因组具有唯一性(hiclib是这种)。无论哪种都是要进行单端比对,最后获得两端均匹配于基因组同一位置的reads(最可靠),以及单末端匹配到的reads(Imakaev,2012)也可以。
3.过滤reads要符合以下条件:
Read-level filtering:
①对错配数量和mapping质量MAPQ得分过滤②在参考基因组中利用酶切位点的信息列出一个列表,同mapping的结果相对比,也就是mapping到的reads附近应该存在酶切位点,去除附近没有酶切位点的reads,所以片段大小要设定一个阈值,比如选择在 500 bp 左右。
Read-pair level filtering:
获得两端均匹配于基因组同一位置的reads(最可靠),以及单末端匹配到的reads(Imakaev,2012)也可以。
Strand filters:
酶切位点两端的reads的方向要相反才行,都向内-><-和都向外<-->是合理的染色质构像,都向左<-<-或者向右->->,很可能是来自未消化的染色质的有效对或PCR人工产物。向内-><-的距离应该大于1kb,向外<-->的距离应该大于25kb
Distance filters:
Strand filters过滤掉的都是距离短的结果,Distance filters这种基于距离的过滤广泛用于早期的Hi-C数据,它对低分辨率Hi-C研究相当有效,经验数值是至少20-25KB,也就是过滤掉至少25KB以上的距离的序列。
最后是删除冗余的序列。

参考文章
Analysis methods for studying the 3D architecture of the genome (Ferhat Ay,2015)
染色质构象解析技术———Hi-C 及染色质构象信息提取 (胡文桥,2015)

标准化以及后续的指导基因组组装以及TAD,LOOP分析等后续看看论文再写

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 8种特殊建库测序 8种特殊建库测序 1. RNA-seq 2. 外显子测序 3. small RNA-seq 4....
    wangchuang2017阅读 13,330评论 2 92
  • 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sang...
    oddxix阅读 7,398评论 0 44
  • 什么是高通量测序? 高通量测序技术(High-throughput sequencing,HTS)是对传统Sang...
    翠湖心影阅读 21,537评论 2 81
  • 出来这么久没一年过半载 弄不清,追求的是什么。日子平平常常过 越来越说不清的孤单或寂寞 没有个性的磨砺造成对工作的懒惰
    lljjcm_fed8阅读 96评论 0 0
  • 天气阴沉的很厉害,没有一点风,屋顶的俩人站了将近四半时辰,一人手里握着刀,一人手里拿着木棍,硕大的斗篷看不清俩人的...
    妙灵童_阅读 322评论 0 0