如何查询基因和通路的相关性,确定研究思路

最近有很多小伙伴私信喵学姐,说设计课题、设计实验的时候,找不到思路,有目标基因但是又无法确定相关的通路。

今天喵学姐就教大家怎么查找基因和通路的关系,减少试错成本。

查找现有的研究结果

对于之前研究结果的确定,首先我们打开genecards(www.genecards.org/)。genecards当中总结了这个基因参与哪些经典的通路。在genecards里面汇总了KEGG等多个通路数据库当中的信息。

这里我们就以TP53为例,输入想要检索的基因选择pathways进行快速定位可以查看与这个基因有关的通路

确定基因和通路内基因的关系


01查询通路内的基因

有时候我们想研究的目标通路不在检索列表,那我们还可以进一步探究候选基因和目标通路内其他基因之间的关系。这里就可以用到PathCards(https://pathcards.genecards.org/)对目标通路进行检索,获取参与目标通路的所有基因列表

在这个数据库,我们以Cell Cycle为例,输入检索就可以看到该通路所有相关的基因

这样我们就获得了目标通路的所有基因了。


02蛋白相互作用分析

在我们获得基因之后,就可以看一下他们之间的互作关系,我们可以把获得的所有基因以及目标基因,统一放到STRING(https://string-db.org/)里面,就可以查看TP53和其他基因有没有关系了。

分析完成后在下方下载结果文件

在Excel中筛选与TP53互作的蛋白


03共表达分析

如果还想探究候选基因和目标通路中的基因在某个疾病中的共表达关系,我们可以借助cBioPortal数据库(www.cbioportal.org/)。选择想要分析的疾病队列(这里以以甲状腺癌的TCGA队列为例),并输入候选基因后,点击Co-expression模块获取基因的共表达关系。

△下载数据表格流程

我们把相关的结果全部下载下来之后,在excel中筛选一下,根据需求设定相关系数的阈值。在本示例中,我们以p<0.05和r>0.5为阈值,

这里可以看出只有FGD1的相关系数是大于0.5的。那如果我们后续要做一些富集分析,可以把相关系数阈值灵活调整,如设置为0.4,筛出8000多个基因,我们可以选取前100个基因进行后续的富集分析

通过这些方法,大家会发现要了解基因和通路的关系也并不复杂,除了看文献,花点时间在数据库查询,也能获得不少有价值的数据,更为后续的分析、实验设计做了基础

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容