DMRcalling之comb-p原理2019-12-02

1.(https://www.biostars.org/p/54994/)
https://github.com/brentp/combined-pvalues/
各种高通量技术可生成全基因组数据,用于研究DNA结合,甲基化状态和组蛋白修饰等过程。这些技术,包括平铺阵列和基于序列的分析,会生成通常在整个基因组中自相关的数据,从而难以进行推断。在可能对数百万个站点进行多次测试校正后,可能会削弱各个区域的重要性。在此类研究中,可以在每个位置执行假设检验以生成用于评估感兴趣效果的P值。为此,Kechris等。 (2010年)开发了一种方法,用于组合滑动窗口中的P值并考虑整个基因组的空间相关性。在此,我们利用软件构建这种方法,该软件允许整个基因组中的数据结构不均匀,更通用的自相关计算以及对峰(即富集的基因组区域)的多次测试校正,并适用于多种不同的技术


All programs within comb-p expect files in simple BED format (Kent et al., 2002) sorted by chromosome and start. Additional columns contain the P-value(s) of interest based on the study design and generated from any software or statistical test.

  1. Autocorrelation
    Autocorrelation is a mathematical representation of the degree of similarity between a given time series and a lagged version of itself over successive time intervals. It is the same as calculating the correlation between two different time series, except autocorrelation uses the same time series twice: once in its original form and once lagged one or more time periods.
    自相关是数学上表示给定时间序列与其在连续时间间隔内自身的滞后版本之间的相似度的信息。 它与计算两个不同时间序列之间的相关性相同,只是自相关两次使用相同的时间序列:一次以其原始形式出现,一次则滞后一个或多个时间段。
    这个网站是这么说的
    https://www.statisticssolutions.com/autocorrelation/

A common method of testing for autocorrelation is the Durbin-Watson test. Statistical software such as SPSS may include the option of running the Durbin-Watson test when conducting a regression analysis. The Durbin-Watson tests produces a test statistic that ranges from 0 to 4. Values close to 2 (the middle of the range) suggest less autocorrelation, and values closer to 0 or 4 indicate greater positive or negative autocorrelation respectively.
自相关测试的常用方法是Durbin-Watson测试。 诸如SPSS的统计软件可能包括在进行回归分析时运行Durbin-Watson检验的选项。 Durbin-Watson检验产生的检验统计量范围为0到4。值接近2(范围的中间值)表明自相关性较小,值接近0或4则分别表明正相关性或负相关性更大。


Once the ACF has been calculated, it can be used to perform the Stouffer–Liptak–Kechris correction (slk) where each P-value is adjusted according to adjacent P-values as weighted according to the ACF. The resulting BED file has an additional column containing the corrected P-value. A given P-value will be pulled lower if its neighbors also have low P-values (and little auto-correlation) and likely remain insignificant if the neighboring P-values are also high.

如果给定的P值的邻居的P值也很低(并且自相关很小),则该P值将被拉低;如果相邻的P值也很高,则该P值可能会变得无关紧要。

A q-value score based on the Benjamini–Hochberg false discovery (FDR) correction or on a null model from shuffled data may then be calculated. The peak-finding algorithm can then be used to find enrichment regions or peaks on the FDR q-value, the slk-corrected P-value or on the original P-value.

region_p程序报告slk校正的P值和Šidák(1967)单步多重测试校正。 对于给定区域,Šidák校正中可能进行的测试数量是所有输入探针覆盖的总碱基数除以给定区域的大小。
简而言之,我们使用FDR q值定义区域的范围,然后使用原始P值的SLK校正来定义区域的重要性。

The corrected P-value reported by comb-p can be used as a filter to extract regions of interest; we calculated the enrichment ratio of the number of observed to expected Ci target genes at various comb-p-corrected P-value cutoffs. For a cutoff of 0.1, the enrichment is 2.41, this enrichment increases to 3.46 and 5.29 for more stringent cutoffs of 1e−3 and 1e−4, respectively.

Bisulfite-sequencing (BS-Seq) is also used to measure methylation across the genome. As another example of the flexibility of our method, we demonstrate a possible analysis on data described in Hsieh et al. (2009) from Arabidopsis thaliana using MethylCoder (Pedersen et al., 2011) to map the bisulfite-treated reads to the genome. At each site, we use Fisher’s exact test to obtain P-values for the counts of converted and un-converted cytosines between endosperm and embryo. We find DMRs between these two tissues associated with genes enriched for gene ontologies related to the ribosome (P = 1e−3).

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351