参数选择
可选的几个参数
GCC set %GC of lower limit (50-70,default value:55%)
OE set ObsCpG/ExpCpG of lower limit (0.60-1.00,default value:0.65)
LENGTH set length of lower limit (200-1500,default value:500bp)
原理解析
A. 按照LENGTH
在序列的起始处初始化一个窗口,每次向后移动1bp,直至寻找到符合阈值的一个LENGTH
的窗口
B. 找到一个符合阈值的窗口之后,将整个窗口向后移动LENGTH
C/D. 重复B步骤直到新的窗口不符合阈值
E. 将此不符合阈值的窗口向5‘端移动1bp直至其符合阈值
G. 将此阶段找到的所有窗口合并并计算其各个参数是否符合阈值
H. 如果这个大的窗口不符合设定的阈值,则从5’和3'端各减去1bp,直至新窗口符合阈值
……
从得到的CpG Island的末端+1位开始新一轮的计算,直至遍历整个序列
……
I. 在计算得到所有的窗口之后,如果两个窗口的距离小于100bp,则将两个窗口合并
J. 重新计算这个大的窗口的各项参数,如果各项参数符合阈值,则用大的窗口替换着两个小的窗口,如果不符合,那么依旧取原来的两个独立的窗口
参考文献
Comprehensive analysis of CpG islands in human chromosomes 21 and 22