一个基因包括外显子和内含子部分,有时候我们需要了解基因包含的具体外显子位置信息。确定的方法有很多种,比如NCBI、USUC和Blast等。这里我们用NCBI的方法找到一个基因的外显子序列。
首先打开NCBI网站,https://www.ncbi.nlm.nih.gov/,
选择“gene”数据框,搜索框内敲入基因名字“EML4”。
在“search results”页面会出现多个结果,我们选择后面括号注明是Homo sapiens的选项。
打开界面,可以看到EML4基因的summary信息。包括基因的全名,曾用名,基因名会随着版本的升级而变化,每个基因名对应一个GeneID,这个ID是唯一的。
往下面看,在基因的regions,transcripts and products界面内,可以看到这个基因的mrna和编码蛋白的编号.NM_开头的序列都是Mrna序列。记住这个Mrna的编号。
接下来介绍一个线上的软件,Splign,网址是https://www.ncbi.nlm.nih.gov/sutils/splign/splign.cgi?textpage=online&level=form
可以用Mrna或EST序列与所在的基因组序列比对,可以显示基因的结构。比对结果显示EML4有22个外显子,有对应的基因组比对的序列,明确外显子在Mrna序列上的区域。