Homolog genes
同源基因是来自一个共同个祖先DNA序列的genes。不同物种中的同源基因指的是直系同源基因(rotholog genes,例如从一个共同祖先基因因为物种进化来的基因),通常在进化中保留了非常相似的功能。相反的,paralog genes旁系同源genes来自于同一个基因组(通过基因复制获得)。旁系同源基因可能有相似的功能但是也可以进化成不同的特征。有时,我们想比较同源基因,或许,给你一个基因symbol,你想获取以下信息:
- 哪些是它的旁系同源基因(在同一个基因组)
- 那些是他的直系同源genes(不同的基因组)
我们可以使用biomaRt获取这些信息。
BiomaRt 提供了有力且简单的用户界面来或许不断增长的数据库信息,包括ensembl,uniprot和hapmap。biomaRt允许和检索不同类型的广泛的信息。这里描述的只是简单的例子和同源基因的获取。你想看更多的例子,你可以看下面资料
BiomaRt
接下来看这些简单的例子
下参考plos one
比较人类和实验大鼠和小鼠等模式物种之间的恶性肿瘤基因表达谱,提供了一个唯一的,有力的方法来鉴定在百万年中保守的肿瘤细胞发育的基因网络。(大概就是,在人类和实验大鼠和小鼠等模式动物进行跨物种比较,以期找到那些在百万年进化中保守的肿瘤细胞发育基因,提供了一个唯一,有利的工具)。对人类肿瘤转录组数据进行跨物种比较的最主要的目标是在模型物种中发现和对应的癌症类型中同时失调的基因。这种基因指向肿瘤发展的常见驱动因素或肿瘤维持途径,治疗反应,获得耐药性和/或总体结果。在整体基因表达模式进行跨物种比较已经成功的应用在肝癌,乳腺癌,肺癌,前列腺癌,等的基因发现上。DLBCL,弥散性大B细胞淋巴瘤。
肝癌文章
比较序列分析的成功运用鉴定除了很多重要生理功能的调控区域,归因于这些区域比相对不重要的区域进化的比较慢。虽然这些功能基因组elements很多都是蛋白质编码序列,但仍然有一大部分保守序列可能是调控elements,扮演着调控基因表达的角色。因为我们推测,如果进化上相关的物种调控元件是保守的话,那么在物种中反应相似表型的基因表达特征也会相应的保守。为了验证这一假设,我们研究人和小鼠HCC中种间同源基因的全局表达模式的比较是否可以鉴定出肿瘤表型的相似和不相似性,这样就会鉴定出最适合人类HCC的小鼠模型。
因为我们使用两种不同的微阵列平台来研究小鼠和人HCC,我们通过使用curated mammaliam orthology from the Jackson laboratory来选择在两种micorarrays都出现的基因。总共4036个同源genes都出现在微阵列中。我们选择表达变化差异大的同源genes进行下一步分析(1650个基因)。总共4036个直系同源genes在两个microarrays都出现。我们选择表达变化明显的1650个同源genes进行下一步分析。