文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part II:数据分析)

上一篇:《文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part I:文章梳理)》

原文链接
Beagrie RA, Scialdone A, Schueler M, et al. Complex multi-enhancer contacts captured by genome architecture mapping. Nature. 2017 Mar 23;543(7646):519-524. doi: 10.1038/nature21411. Epub 2017 Mar 8. PMID: 28273065; PMCID: PMC5366070.
https://www.nature.com/articles/nature21411

数据预处理

I. Alignment

  • 使用Bowtie2(默认参数)将read mapped 到 mm9 参考基因组
  • 仅保留MAPQ>=20 read
  • 去除PCR duplicates

II. Calling positive windows

首先,将全基因组分为一系列连续bins(i.e. equal-sized windows)

III. Exclude low-quality datasets

作者共产生了471个nuclear profiles + 5 negative control 共477个样本
作者考察了以下质量指标:

  • % of mapped reads
  • % of non-PCR duplicate reads
  • average sequencing quality
  • Mononucleotide repeat score
  • Dinucleotide repeat score
  • total number of windows scored positive
  • number of positive windows immediately adjacent to another positive window
  • number of positive chromosome for each sample

使用以上所有质量指标作为特征,对所有477个样本进行主成分分析,发现 % of mapped read 指标是区分 nuclear profile 和 negative control 最有效的特征。

negative controls 中 % of mapped reads 最高为2%。严格起见,作者将 % of mapped reads 小于 15% 的细胞全部过滤掉,共过滤掉63个细胞,剩余408个高质量细胞。

Calculation of linkage matrices

假设:
(1)位点A被检测到的频率为 f_A,位点B 被检测到的频率为f_B
(2)f_{AB} 是位点AB同时被检测到的频率

定义Linkage disequilibrium
D = f_{AB}-f_Af_B
使用 linkage D 的理论最大值D_{max}D进行归一化,得到Normalized Linkage disequilibrium
D' = \frac{D}{D_{\max}}
其中 D_{max} 的计算方法为:
D_{\max} = \begin{cases} min(f_af_b, (1-f_a)(1-f_b)) & D<0 \\ min(f_b(1-f_a),f_a(1-f_b)) & D \geq0 \end{cases}

染色质三维结构识别

compartment A/B

GAM识别compartment A/B的方法与Hi-C基本相同,具体过程如下:

  1. 使用normalized linkage matrices 替代 normalized contact matrices,记为原始矩阵为O

  2. O按距离进行切片,定义片内所有locus pair的均值为该片的期望,即
    E(i,j) = average\{ O(i', j') | dist(i,j)=dist(i',j') \}

  3. 定义 K(i,j) = O(i,j) / E(i,j)

  4. 计算 K 的 Pearson 相关系数矩阵为 C,即
    C(i,j) = corr(K_i, K_j)

  5. C为特征矩阵,进行主成分分析(PCA),提取前3个主成分

  6. 选择与GC含量相关最高的主成分,用于定义compartment A/B

TAD

TAD的计算参考了 2015 Crane et al. [1] 提出的用于Hi-C数据的 insulation score方法。
使用 3 x 3 window box 沿对角线滑动,计算每个window box内的normalized LD的平均值。

使用SLICE识别 prominent interacting locus

interacting locus pairs

Figure 3a

核心思想:
假设基因组中的两个位点A,Bm个NP中:
- m_0个既没有检测到A,也没有检测到B
- m_1个检测到AB中的一个
- m_2个同时检测到AB

定义A,B的共出现(co-segregation)频率为
m_2 / (m_1 + m_2)

则当AB的互作频率为\pi时,根据SLICE model(详见《文献阅读 | GAM:基于ligation-free方法捕获基因组中增强子间的复杂互作 (Part III:SLICE 统计学模型)》可以计算得到co-segregation ratio服从的分布,并进行统计学检验:H_0:\{ \pi =0 \} v.s H_1: \{ \pi > 0 \}
具体而言,计算 \pi=0时的分布的95%分位值t,当\frac{m_2}{m_1+m_2}>t时,即认为A,B间存在显著互作。

此外,对于prominent interacting pairs,SLICE model还可对\pi进行估计(即Figure 3)

Interacting locus triplets

类似地,定义triplet co-segregation ratio 为
m_3 / (m_3 + m_2 + m_1)

参考文献

[1] Crane, E., Bian, Q., McCord, R. et al. Condensin-driven remodelling of X chromosome topology during dosage compensation. Nature 523, 240–244 (2015). https://doi.org/10.1038/nature14450

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335

推荐阅读更多精彩内容