可见,下面5个文本文件分别为:string_interaction.tsv(以tab分割);XML 总结;网络坐标;蛋白序列和蛋白注释。
应该都可以用excel打开。
在string_interaction中,有15列,上图为前面6列。第一列为每一个node的基因名,3,5分别是它们对应的内部ID和蛋白ID(这里的蛋白ID还在前面加了物种编号)。2则是和之前那个node有关系的另一个node,4,6也分别是node2的对应内部ID和蛋白ID。
后面9列,分别为染色体上临近点,基因融合,系统发育,同源性,共表达,实验性相互关系,数据库注释,自动文本挖掘,综合评分。
network_coordinate记录的是Node名称,坐标,颜色和注释。
protein_sequences记录的是氨基酸的序列。
protein_annotations及记录了基因名,蛋白ID和结构域的信息来源。但是由于格式太大,用excel不能完全打开。
最后一个XML,是以psimi格式制备的,因此不适宜用excel打开。不然看起来就像cxk打篮球一样。