CPGI130原理

cpgi130

参数选择

可选的几个参数

 GCC          set %GC of lower limit (50-70,default value:55%)
 OE           set ObsCpG/ExpCpG of lower limit (0.60-1.00,default value:0.65)
 LENGTH       set length of lower limit (200-1500,default value:500bp)

原理解析

A. 按照LENGTH在序列的起始处初始化一个窗口,每次向后移动1bp,直至寻找到符合阈值的一个LENGTH的窗口
B. 找到一个符合阈值的窗口之后,将整个窗口向后移动LENGTH
C/D. 重复B步骤直到新的窗口不符合阈值
E. 将此不符合阈值的窗口向5‘端移动1bp直至其符合阈值
G. 将此阶段找到的所有窗口合并并计算其各个参数是否符合阈值
H. 如果这个大的窗口不符合设定的阈值,则从5’和3'端各减去1bp,直至新窗口符合阈值
……
从得到的CpG Island的末端+1位开始新一轮的计算,直至遍历整个序列
……
I. 在计算得到所有的窗口之后,如果两个窗口的距离小于100bp,则将两个窗口合并
J. 重新计算这个大的窗口的各项参数,如果各项参数符合阈值,则用大的窗口替换着两个小的窗口,如果不符合,那么依旧取原来的两个独立的窗口

参考文献

Comprehensive analysis of CpG islands in human chromosomes 21 and 22

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容