1.在CTD里,哪些基因被注释到哮喘病相关
广泛的定义为“对于一个给定的基因集来说,哪些基因和某疾病相关?”
哮喘病是一个严重的慢性疾病,有时会威胁生命,这种病肺部发生病变。哮喘的病因很复杂包括遗传和环境因素。对化学物的过敏对哮喘关系很大,但机制不明。因此,对毒理学家来说,因为化学物质引起的哮喘的关键生理过程对毒理学家很重要。
为了回答这个问题,我们限制搜索条件为comparative toxicogenomic database,human data(CTD-hman)。CTD是一个数据库,关注于基因,化学物质和疾病之间的相互作用。选择source,选择gene disease网络,搜索框定义asthma限制条件,这会产生78个nodes的网络,102条关系(78个nodes中,1个disease,77个genes)。边的颜色依赖关系类型。我们可以看到,
有一条关系的颜色是粉色,其余灰色。粉色的这条关系类型是治疗,其余是标记物。
我们还想看看是不是还有其他基因在文献中有记载,而在curated中没有记录。于是我们执行了befree source。这个命令能检索基于文本挖掘的注释。结果是一个网络,1089个基因(10990个nodes,5343个边)
现在我们建立一个网络,包含所有的asthma相关疾病。为了获取和asthma相关的CTDhuman基因疾病网络,我们执行和之前一样的命令但是限定一个模式,选择CTD-human为source,关系类型和疾病类型any。但是限定asthma为所索茨,产生网络,现在这个网络有110个nodes(12个疾病,98个基因),136个边。注意,有3个哮喘相关疾病共享3个基因,TBX21是唯一一个和三种i并相关的基因。作者问,你可能找到网络中得分最高的GDA吗?
为了想看看,是否在文献中和动物模型source中有其他疾病和TBX21相关,执行ALLset搜索,并且限定基因TBX21,这个命令也会获取源于uniprot,clinvar,GAD,MGD的注释。结果产生的网络,有61个疾病注释到TBX21(62个nodes,110个edges).
如果我们想看看TBX21和asthma之间的关系,我们会发现这两个node之间有23个边。并且这些边属于不同的类型(biomarker和genetic variation),因此,颜色不同。
再进一步,我们还可以发现每个gene-disease之间关系的证据,通过检查边属性浏览。
这个例子显示了文献搜索的价值,因为curated database现在并没有完全覆盖文献中的gene-disease关系。
2.病人中观察到的并发症,是否反应了这种疾病的共同遗传根源?
这个问题可以归结为,疾病x和y有共同的遗传根源?这个问题可以公式化“疾病x和疾病y之间的共有基因是什么?”
一个病人可能有好几个疾病,这种情况成为并发症。并发症可以考虑两种疾病之间的共同发病遗传原因。慢性梗阻型呼吸道疾病和糖尿病是并发症的一个例子。通过命令disease projection网络我们可以回答这个问题:两种疾病有共同的遗传起因。
首先,我们命令disease projection (curated),搜索框输入“obstructive然后从下拉菜单选择chronic obstructive airway disease,,不限制疾病类型。这个网络437nodes,436个边。然后,我们在在使用cytoscape的搜索框搜索“diabetes”,我们立即看到两个疾病联系在一起了(三个糖尿病node)。一旦我们知道至少在两种疾病中有一个基因共享,我们就可以产生CURATED
Gene disease network并产生包含疾病和他们的相关基因的sub网络。(ucco注:上面这个步骤是验证这两种疾病有没有共有基因,一旦完成,主要的工作还是下面的。)步骤如下
Gene disease network,source选择curated,
为了达到这个目的,我们先利用cytoscape自己的功能,选择代表慢性阻塞性呼吸疾病的nodes和他们的相关基因,select,nodes,first neighbous of selected nodes,然后,执行第二轮和上面一样的工作。然后我们产生子网络,包含上面选择的nodes和边,file.,new,network,from selected nodes all edges.关系类型和疾病种类选择any,create network。在生存的大网络中,在cytoscape的搜索框中输入Chronic Obstructive Airway Disease或者在下面的table面板找寻这个病,找到后右击选中,然后以这些选中节点进行扩增,
重复,以上一步的节点进行第二次扩增。接着我们就可以产生sub-network了。具体file-new-network-from selected nodes,all edges。得到600个nodes和1638个edges的网络。在这个网络中,可以在table面板中查找,可以在cytoscape的搜索框中输入obstructive diabetes,会发现3个糖尿病亚类型和慢性阻塞这个疾病,见下图
选中4个node后,selet-nodes-first neighbours of selected node。以圆形显示图,如下
我们 看到上图中蓝色的9个nodes或基因和两种疾病有关。支持这样的假说:这些基因的功能改变可以导致同一个病人身上两种疾病的发生!
有趣的是,我们还可以看出,NOS3和TNF是仅有的在慢性阻塞呼吸疾病和三种类型糖尿病中同时出现的2个基因。
在DisGeNET中,NOS3这个基因和485中疾病有关系,比如高血压,阿尔兹海默症,不能勃起是排名最靠前的三个。
上面的功能也可以分别产生各种疾病的网络,然后进行merge。
3.和翻译后修饰有关的疾病有哪些
这种类型的案例可以作为药物发现的兴趣点。发现的疾病相关基因可以被药物靶向,比如有磷酸化修饰干涉.
首先,产生网络,all gene disease network,限制关系类型为posttranslational modification,不限制疾病class。产生的网络有621个nodes(157个disease nodes),个edges。使用边的属性浏览可以查看每个 基因疾病的支持证据。
提个问题:前10个疾病相关的翻译后修饰共有的疾病类型