基因家族分析

笔记

基因家族

同一个祖先基因经过变异,产生了结构、功能相似的各种表达蛋白,表达这些蛋白的基因统归为一个基因家族。

超基因家族

同一个祖先基因经过变异,产生了结构相似、功能不同的各种表达蛋白,表达这些蛋白的基因统归为一个基因超家族。

domain

一个基因转录的蛋白质分子中可以包含多个结构特异并且功能不同的区域,这些区域称之为domain,domain 可以看作蛋白质功能的基本单位,蛋白质的功能由包含的多个domain共同决定,研究domain, 可以更好的研究蛋白质功能,而具有相同结构域的基因往往形成一个基因家族。

流程

下载基因家族模型

在PFAM中下载
在文献中找到pfam ID :PF02519 (睡莲)


image.png

image.png

已获取HMM文件

下载hmmer

Linux可以在官网下载
windows下载网址:http://hmmer.janelia.org/static/binaries/hmmer3.0_windows.zip
(直接打开会404,用迅雷打开就可以了)
下载后解压即可使用。

使用hmmer

在桌面按windows+R,输入CMD,进入窗口后,输入“D:”,进入hmmer所在文件夹。

hmmbuild 要输出的文件名(.hmm)+sto文件(相对路径)
image.png

(不小心命名错了T T)
alen表示比对氨基酸一共465个,mlen表示最大比对上218个氨基酸,eff_nseq表示比对效率0.96存在15.58个gap,re/pos表示每个位置的相对熵0.590
随便打开看看(ASCII码文件)

cat 02319.hmm
image.png

hmmsearch搜索序列数据库

需要一个蛋白质数据文件,是fasta格式,uniprot sprot.fasta
在uniprot中搜Nymphaeales找家族蛋白质数据


image.png

(尝试在文献中找,但是那个网址下载一直失败。就自己搜搜看了)


image.png

文件下载好后,输入
hmmsearch  02319.hmm uniprot-Nymphaeales.fasta > 02519.out

02319.hmm是上一步输出的文件,.fasta文件是下载好的蛋白质文件,02519.out是输出文件。
文件内容


image.png

比对到的含有domain的序列,按E值来排序,从小到大

  • 第一列的E-vaule是最终要的一个参数,越小越有可能是同源的序列
  • 第二列的score也可以用来评估可能性,而且不依赖于比对数据库的大小,只依赖HMM文件和目标序列
  • 第三列bias是score的偏差,比如score是222.7,那么原始值就是加上3.2,等于225.9,但是这个数值一般不重要,可以忽略不看。
    后面的3列也是一样的参数,只是对于best 1 domain而言,前三列是对于full sequence而言。最后的#dom内容是有多少个domain,exp是均值,可以是小数,而N是真正的整数个数。

教程参考https://cloud.tencent.com/developer/article/1424604

clustalx的使用

下载clustalx(Windows)/clustaw(Linux)
下载网址http://www.clustal.org/download/current/
安装后

image.png

在kegg找同源但不同物种的基因序列。我找的是拟南芥(Arabidopsis thaliana (thale cress))的光系統II蛋白D1基因(NCBI-GeneID: 844802)和亚麻(Camelina sativa (false flax))的光系統II蛋白D1基因。
image.png

在NCBI中,拟南芥叶绿体的psbA基因序列
image.png

其他同理可得
第一步:输入序列文件,选择.fasta文件
image.png

选择第二个比对文件,也是.fasta文件
image.png

第二步,选择多重比对参数
image.png

image.png

第三步,选择好后,进行多重比对
image.png

对输出的.dnd和.aln文件选择输出位置及文件命名
image.png

.aln是序列比对的文件,可以进一步用于构建系统发育树,.dnd是向导树文件(指导树)。
第四步,比对完成,选择输出结果文件的格式
image.png

image.png

比对结果如下
image.png

MAFFT的使用

这是另一个比对软件

序列过滤

序列比对杂乱的序列认为其是噪音,需进行过滤。

trimAL

下载:

conda install trimal

用conda安装,要首先安装了conda才能装trimal。
-gappyout 过滤掉gap-rich的部分

建树

选择模型

jModelTest 用于找DNA建树模型,ProtTest用于找蛋白质建树模型。
也可以用iqTree软件建树,里面带有ModelFinder,可以自动帮你找模型。

iqtree -s turtle.fa -m MF -pre turtle.MF -mset JC,GTR   #-s 输入多重序列比对序列  -m 确定模型(如有),如果没有就输入MF modelfiner -pre 输出文件前缀  -mset 限定搜索范围
image.png

I 不变的
G4 γ分布


image.png
PartitionFinder

不仅找每个基因的模型,而且把进化模型相似的分为一个组,以一整个区块拿来分析。

下载MEGA

下载网址http://www.drv5.cn/sfinfo/15726.html
安装后打开。
第一步,将6条序列合并到同一个.fasta文件中。

image.png

第二步,打开MEGA,按下图操作后选择含有所有序列的.fasta文件。
image.png

image.png

image.png

按shift可多选序列
第三步,选择对齐方式,ClustalW适用于基因序列,MUSCLE适用于蛋白质序列。
image.png

对齐后保存为.meg格式,用于后续建树。
image.png

.mas格式保不保存都无所谓,但顺手保存了。
第四步,关闭窗口后,回到原来MEGA窗口。点击phylogeny
image.png

弹出“是否使用刚刚生成的.meg?”,点击“是”,如不会调参数可以使用默认参数,即可生成进化树。在弹出窗口“Tree Explorer”中可以对进化树进行美化、调整等。还可以用word进一步编辑该进化树。
image.png

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,012评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,628评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,653评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,485评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,574评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,590评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,596评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,340评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,794评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,102评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,276评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,940评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,583评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,201评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,441评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,173评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,136评论 2 352