一键解决不同物种间的直系同源基因的转换
今天推荐一个数据库网站,可以直接在网站上进行转换,比如我们就知道果蝇这个物种,他们自己的名字名命就是和别的物种不一样,总有一些自己的叫法,让你不知道这个基因到底在人类啊,小鼠当中究竟是什么基因。一个一个的查非常的麻烦,这里提供一个可以提供gene list就直接转换的网站。
DIOPT数据库
直接给出数据库的网址DIOPOT,目前已经更新到了version9。
https://www.flyrnai.org/cgi-bin/DRSC_orthologs.pl
该数据库最早是在2011年发表在BMC bioinformatics上面。
Hu, Y., Flockhart, I., Vinayagam, A. et al. An integrative approach to ortholog prediction for disease-focused and other functional studies. BMC Bioinformatics 12, 357 (2011). https://doi.org/10.1186/1471-2105-12-357
使用方法非常简单:
选择输入的物种
选择要得到的物种,或者选择all,数据库中包含的所有的物种的
输入你的基因的名字或者上传你的gene list(你能想到的一切都可以,uniprot id, ENSEMBL ID等常用的都可以)
选择你想要的比对的方法的来源
-
一些额外的筛选阈值(不是必须的)
-
点击提交获得结果,可以在结果种直接选择Best Predicted Ortholog以获得单一的结果展示
如果还是不会用,他们团队还在网站上放了使用的教程。
作者团队主要想解决的问题
物种间直系同源基因的作图在功能基因组学中发挥着重要作用,研究人员可以根据已知的其他物种中直向同源基因的功能,提出有关一个物种中基因功能的假设。有几种预测直系同源基因关系的工具可用。然而,这些工具可能会给出不同的结果,并且预测直系同源物的识别并不总是那么简单。
分析果蝇 RNAi 筛选中心 (DRSC) 筛选结果的研究人员经常希望识别在筛选中“命中”(阳性结果)的果蝇基因的哺乳动物直向同源物。
作者团队开发的DIOPT 整合了现有方法,有助于快速鉴定人类、小鼠、斑马鱼、线虫、果蝇和酿酒酵母之间的直系同源物。
并且目前截止到了最新的第九版的更新中,还额外的加入了冈比亚按蚊Mosquito (Anopheles gambiae),大肠杆菌 (E. coli),线虫(Caenorhabditis elegans),拟南芥(Arabidopsis thaliana),裂殖酵母(Schizosaccharomyces pombe),非洲爪蟾(Xenopus laevis)等共12种物种之间的直系同源基因之间的转换。
已经出现了许多工具来满足识别直系同源物的需要。然而,这些工具的低覆盖率和异质性给科学家们带来了障碍,他们想要识别给定感兴趣基因的一个或几个最高置信度的直系同源物,或者相反,想要撒下广泛的网络并跟进所有可能的直系同源物,一个基因。
-
DIOPT的目标是提供易于使用的资源,以促进总结、比较和访问各种直向同源预测来源。DIOPT 集成了 Ensembl Compara、HomoloGene、Inparanoid、Isobase、OMA、orthoMCL、Phylome、RoundUp 和 TreeFam 数据库内的直系同源预测。DIOPT 使用户可以找到由一种、多种或所有这些已发表方法鉴定的指定基因或基因的直系同源对。这提供了一种简化的方法,用于集成、比较和访问源自基于序列同源性、系统发育树和功能相似性的算法的直系同源预测。DIOPT 计算一个简单的分数,指示支持给定直系同源基因对关系的工具数量,以及基于功能评估的加权分数,使用每个工具预测的所有果蝇-人类直系同源对的高质量 GO 分子功能注释。每种工具用于预测同源关系的算法的差异是一种工具与另一种工具做出的一组预测存在差异的根源之一。
其实如果熟悉orgdb的同学们,看到这里肯定已经想到了可以使用bitr在不同的数据库之间进行转换,但是bitr只能提供从一个数据库的名字转移到另一个数据库的名字的方式,并不能像DIOPT一样提供多个数据库之间的相互转换,我个人也觉得这个是这个数据库最厉害的点,而且对于 wet lab的同学们更加的友好。
- DIOPT 还显示预测的直系同源对的蛋白质和结构域比对,包括氨基酸同一性百分比。这些应该可以帮助您在多个可能的直向同源物中识别最合适的匹配。
一些自己的想法
之前做转录因子名称转换的时候(JASPAR得到的果蝇的想转人的),想了挺多的方法感觉转化的效率都不高。也尝试过bitr的方式,但是总是会损失,最后搁置了一段时间以后,突然发现了这个网站,其实早就应该想到有人会做这种网站的开发,果不其然也是负责flybase的团队的人开发的,但是那个时候却总在想着自己造轮子,没有很好的上网做搜索,从而导致浪费了很多的时间。
果蝇有很多做的大规模的RNAi或者敲除的文章,发表的期刊水平也是非常的高,如果把这种理解为是一种站在模式生物的角度和高度做的文章,那么,怎么能够多的利用这些资源,对于做非模式生物的研究来说,尤其是其他的昆虫相关的研究,真的是一个很好的资源。哪怕只是在读文献的时候,能把这里的A基因和我们做的B基因快速的连接起来,这也对我来说省了很多力气了。至少不用去做blast再去确定这个基因到底是不是我想的那个。