#软件下载
# TFs_1718.tsv All_genes_25489.tsv使用软件自带的测试数据。
#确定分界值
Cutoff 13 13 example_data/TFs_1718.tsv example_data/All_genes_25489.tsv
***********这里的13是样本数量
在构建GCN时,您需要在两种情况下的皮尔逊相关系数(PCCs)的正值和负值。我们的方法是计算每个TF-基因对在每个条件下的所有PCC值。利用所有的PCC值,我们生成概率密度函数(PDF)和累积密度函数(CDF)的分布。根据CDF,我们可以为你建议每种情况下的正负临界值,p<0.05。要运行截断程序,您必须提供4个参数:条件1下的样本数量、条件2下的样本数量、TF基因的数据文件和所有基因的数据文件。
除了建议的截止值外,程序还将生成.tsv格式的PCC值分布文件。您可以使用该文件通过Microsoft Excel或R程序生成直方图条形图。
#构建不同类型的八个GCN
GCN 13 13 example_data/TFs_1718.tsv example_data/TFs_1718.tsv 0.84 0.84 -0.75 -0.75
注意: 0.84 0.84 -0.75 -0.75在运行程序的过程中。
过程:
结果产生八个csv文件
在第二步中,我们想要在两个条件(C1和C2)下构建八种GCN的共表达类型:C2、C1C20、C2-、C10C2、C1-C2-、C1-C20和C10C2-,其中,-、0分别表示正、负和不共表达。每个GCN的输出文件都以逗号分隔值(.csv)格式列出。这五列分别代表TF基因ID、共表达类型、基因ID、条件1下的PCC、条件2下的PCC。您可以将这些基因对导入到网络生成工具中,如Cytoscape,以获得GCN的可视化。要运行GCN程序,您必须再提供4个参数(总共8个参数),以指示条件1和2的正分界值以及条件1和2的负分界值。
#确定感兴趣的GCN中的时序级别
最后一步是确定GCN中节点的时间顺序(级别)。时间顺序由广度优先搜索(BFS)算法指定,从您选择的一组种子节点开始(在seeds.txt中列出)。在大多数情况下,我们会选择一些在第一个时间点高表达,在接下来的时间点低表达的基因作为种子。在我们的研究中,我们选择了一个ID为Zm00001d041056的基因,并运行To-GCN程序来分配C1C2GCN中节点的时间顺序(水平)。因此,我们只需要条件1和2的正截止,以及另外两个指示种子节点基因ID和共表达类型(0、1或2)的参数,其中0、1和2分别表示C1C2、C1C20和C10C2。每个节点的级别和GCN。
TO-GCN 13 13 example_data/TFs_1718.tsv example_data/TFs_1718.tsv 0.84 0.84 example_data/seeds.txt 0
过程:
结果产生一个level文件,根据此文件及第二步产生的csv数据,用Cytoscape画图。