WGBS 下游处理-Package methylKit

1.1 我们要将上游处理得到的the methylation call files转换为methylKit这个R包可以识别的格式

需转换成为的格式

该文作者写了三种命令来转换格式,对应不同的cytosine context

在服务器上完成

1.2 下一步就是将数据导入R中

分为两步

#Paths

首先,由于该实验有六个分组,因此第一步是将六个分组集合成一个列表(列表内容对应文件所在的位置)

#Read files

treatment参数用于规定每个实验组的数据的起点是以1或0为基准的

1.3 去除低计数片段和高计数片段

1.4 The getMethylationStats and getCoverageStats functions

The getMethylationStats and getCoverageStats functions can print the percentage methylation distribution and read coverage per base statistics to the R console, as well as generate histograms to visualize these statistics.

通过这两个函数所做的图来理解会更加直白

【CpG甲基化-百分数分布图】一个典型的柱状图会在两边有峰而中间没有——意味一个位点要么甲基化要么非甲基化

未处理低/高计数片段
已处理低/高计数片段

【每个CpG位点碱基的读数的百分比】若有PCR重复导致的偏差,则会在右边出现第二个峰

1.5 Before comparing the methylation profiles between samples, the unite function is used to merge and retain only bases that are covered in all samples.

用unite函数将在所有样本中都出现过的碱基提出来

meth.cpg. unite(filt.mobj.cpg) # CpG sites covered in all samples.


1.6 The getCorrelation function prints the Pearson matrix of correlation coefficients

计算各样本之间的相关性

1.6 The clusterSamples function uses hclust function to performs hierarchical clustering samples based on the similarity of their methylation profiles and produce a dendrogram.

根据相似性聚类

Additionally, the PCASamples function performs principal component (PC) analysis using the prcomp function.

也可以选择PCA分析法

其中第二个图是用screeplot函数作的,也称为崖低碎石图

此图用来确定主成分个数,虚线之上的主成分保留,特征值大于1的保留,最大拐点之上的保留。

这篇文章

http://www.360doc.com/content/19/0818/16/57890290_855677956.shtml

对PCA主成分分析做了很简洁而有用的说明

1.7 The calculateDiffMeth function is called to calculate differential methylation and it produces a methylDiff object.

这里是先用calculateDiffMeth function计算差异化,后续步骤再获得。

mDiff.cpg. calculateDiffMeth(meth.cpg)

1.8 get.methylDiff function can be used to retrieve differentially methylated bases that satisfy the Q-value and percent methylation difference cutoffs.

意义:P值=假设是正确但是被拒绝的概率=阴性个数/总个数,是对与样本数据的一个检验概率;Q值=被拒绝但却是正确的概率=假阳性/推测为阳性的个数,是对你得到的推论的一种检验概率,是基于P值计算出来的。可以说Q值是对P值的再统计。

mDiff25p.cpg. get.methylDiff(mDiff.cpg, difference.25, qvalue.0.01)

这一步可以同时得到differential hypomethylated and hypermethylated bases

1.9 The diffMethPerChr function can be used to print the proportion of differentially methylated CpG bases

低甲基化和高甲基化之间的比例

2.0 准备注释文件

the gene annotation GRangesList object is build from a TxDB object

这一步比较有条理,可以配图“食用”

那么,显而易见,在从TxDb文件中提取出的promoter exon intron intergenic等信息都被整理到了GRangesList这个对象中,这个对象包含的内容:哪些序列对应的是启动子,哪些序列对应的是外显子等等

2.1 

这里同时有几种函数,但表达的意思都差不多

annotate.WithGenicParts function is called to calculate the percentage of the differentially methylated CpG bases in promoter, exon, intron and intergenic regions.

(百分比)

The getTargetAnnotationStats function returns the number or percentage of target features overlapping with gene annotations.

The target features in this case are the differentially methylated CpG bases.

(数目)

The getFeatsWithTargetsStats function returns the number or percentage of promoters, exons and introns that overlap with differentially methylated CpG bases.

(数目)

2.2 这一步需要对有差异化的甲基化区域进行处理

the tileMethylCounts function is used to summarize the methylation information over tiling windows specify size.

因为

It is also useful to identify differentially methylated regions in the genome where hypermethylated or hypomethylated cytosines occurs consecutively.

tiles.cpg = tileMethylCounts(meth.cpg, win.size.200, step. size.100)

得到了这个tiles.cpg文件后,重复上述甲基化差异分析步骤

总结:看起来methylKit这个包能做的基本上就是这些,最后得到的主要结果就是:启动子、外显子、内含子和基因间区这几个位置上有差异性的甲基化位点或甲基化区域有多少个

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,204评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,091评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,548评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,657评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,689评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,554评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,302评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,216评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,661评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,851评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,977评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,697评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,306评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,898评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,019评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,138评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,927评论 2 355

推荐阅读更多精彩内容