一些之前学习过程中的笔记
==========================================================
软阈值的选取
- 通过无标度拓扑(scale free topology)选择邻接函数的软阈值
细节见书 4.3节 ,zhang and Horvath基于无标度拓扑准则,提出选择软阈值的方法。也就是说,我们根据无标度拓扑拟合指数(公式1.13):选择满足近似无标度拓扑的最小的beta值作为构建共表达网络的邻接函数的软阈值。
计算不同的软阈值对应的无标度拓扑拟合指数R^2。从中选择近似于无标度拓扑的最小的beta值,作为构建共表达网络的邻接函数的软阈值。
Left hand side: the SFT index R^2 (y-axis) as a function of different powers beta (x-axis). While R^2 tends to go up with higher powers, there is not a strictly monotonic relationship.尽管SFT图中的R^2随着beta值的增大而增大,但是二者之间没有严格的单调关系。
右边的图:平均连接性(y轴)关于软阈值β(x轴)是严格单调下降的。
我们选择软阈值β=7,因为当β=7时,曲线达到饱和点。
==========================================================通过动态切割树算法,自动识别模块。
逐步模块识别方法在12.2.4节介绍,函数blockwiseModules自动的进行模块识别的所有步骤。也就是说,这个函数自动地构建一个相关网络,创建一个聚类树,将树的分支定义为模块,将相近的模块融合到一起。这个函数输出模块颜色和模块特征基因,这些结果将会用于后续的分析。人们可以将模块识别的结果进行可视化。
这个函数有很多参数,在这个函数的许多示例中,参数往往设定为它们的默认值。开发者尽力提供合理的参数默认值,但是,这些参数默认值可能并不适合某个特定的数据分析。
颜色条对模块设定(树形图中树枝的剪切)提供了一个简单可视化比较,通过颜色条,可以清楚的看到,树形图的那些分支被分到同一组。
参数maxBlockSize告诉函数:读者计算机可以处理的最大block的大小。默认值为5000,这个值适用于大部分现代计算机。注意:当这个代码处理超过5000行的数据集时,这个函数会将数据切割成几个block。
recutBlockwiseTrees函数可以应用于blockwiseModules的运行结果。这个函数可以用来改变切枝的参数,而不需要重复计算聚类的密集计算。
模块识别的具体操作步骤:
- 计算一个加权邻接矩阵A
- 根据距离矩阵,计算拓扑重叠矩阵(公式1.27)
- 构建一个聚类树形图
- 将聚类树形图的分支定义为模块
树形图的分支将紧密互相连接且高度共表达的基因连接在一起。将聚类树的分支定义为模块,也就是模块的识别涉及到树的剪枝。现如今对于剪枝已有很多方法。最灵活的方法时动态树剪切法(8.6节进行描述),其对应的R函数为cutreeDynamic(Langfelder, Zhang et al 2007)