明晰概念
- 基因是染色体上一段可以发生转录的区域
- 基因≠CDS
- 基因应该包括:CDS 内含子 UTR 启动子
- 可转录的区域是多变的
- 我们做分析的时候常用的是蛋白序列,而蛋白序列是某个转录本翻译而来的
- 蛋白序列≠某个基因的序列
蛋白序列=某个转录本翻译过来的蛋白质 - 而这个转录本对应的是染色体上一段可转录的序列——基因
- 而这段序列可以转录各种不同的转录本
- 我们常常说克隆了AA基因BB基因,所指的其实是这个基因的某个转录本(主要转录本primary transcript),而不是真实的这段基因的序列
- 转录本才是基因的研究实体
基因家族是什么
官方定义
- 来源同一祖先
- 由一个基因通过基因重复得到两个或更多拷贝构成的一组基因
- 结构和功能具有明显相似性
- 编码相似的蛋白质
- 可能形成基因簇或在染色体上的不同位置
从序列相似度看
- 高度相似的序列就互为同源基因,即归属为同一个基因家族(即拷贝数一定大于1)
从结构域上看
- 具有一个或几个保守结构域/功能域的序列,就为某个基因家族的序列(特征)
?mid/midlite - caution:等位基因不能算是基因家族,做研究时注意(二倍体)