motif与domain
motif(模体)是蛋白中较小的保守序列片段,概念比domain小。
PROSITE是专门搜索蛋白motif的数据库,其中signature seqs是最重要的motif信息。
domain(结构域)是在较大的蛋白质分子中形成的某些在空间上可以辨别的结构,若干motif可以形成一个domain。
Pfam可以搜索某段序列中的domain,并以图形化表示出来。用法:在搜索栏输入蛋白的swissprot的序列号。
展示基因家族的结构域
-
MEME适合挖掘motif,不适合展示基因家族的结构域
MEME以motif为单位,在序列中,往往一个结构与会包含一个以上的motif。 -
NCBI CDD数据库,鉴定基因保守结构域
NCBI conserved domain database(CDD),是收录大量NCBI官方矫正过的结构域模型,同时也提供一部分结构域的3D结构和功能说明。一般做基因家族,或者基因结构域鉴定的时候会用到。 - 批量化绘制一个基因家族的结构域图片
1)序列下载:http://planttfdb.cbi.pku.edu.cn/download_seq.php?sp=Ath&fam=ARF
2)提交到NCBI的CDD batch search:https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi
3)下载结果
4)使用TBtools可视化Batch-CDD结果
Others->Redraw Motif Pattern (from NCBI Batch-CDD)
来自:生信札记