基于全基因组的基因家族分析(2):SlNRAMP家族基因成员鉴定

Red and Yellow

1.找到你所感兴趣的基因家族

番茄(Solanum lycopersicum),最喜爱的蔬菜水果之一。摘录维基百科最基本的介绍,详细了解番茄的起源,自行Google。小编还是喜欢Transporter gene family,就觉得特别有意思。植物对于各种营养元素的吸收,都需要其帮助,一旦缺少了,轻则营养不良,重则一命呜呼。本次流程,我选择了The natural resistance-associated macrophage protein (NRAMP)家族。

The tomato (see pronunciation) is the edible, often red, fruit of the plant Solanum lycopersicum, commonly known as a tomato plant. The plant belongs to the nightshade family, Solanaceae.

2.获取基因家族pfam number

  • 进入官网https://pfam.xfam.org/,主页如下:

    pfam主页

  • 选择KEYWORD SEARCH,来直接搜索“NRAMP”。点Go,进入搜索结果页面。


    KEYWORD SEARCH灰色状态

    搜索结果
  • 选择第一个Accession number:PF01566,进入以下界面

    NRAMP家族信息界面

  • 左侧栏选择Curation&model,进入如下界面:


    model界面
  • 可以看到第二张表格,HMM information,点击表格最下面的download链接,就可以下载Stockholm格式的HMM文件。

3. 利用hmmsearch进行基因家族初步筛选

  • 最基本的语法:hmmsearch Nramp.hmm protein.fa > out,一般我只用到这么简单的语法。

Nramp.hmm 是上一步下载到的文件
protein.fa是番茄全基因组蛋白序列文件
out是重定向的输出的文件

  • 找到的成员信息,可以看出来,初步找到了共10个NRAMP成员。但是根据拟南芥和水稻的成员数目(各自是6个和7个),估计番茄不会有那么多的成员。此外,从score一栏发现,其中只有5个成员的分数在200以上,可靠性相对比较高。但是不管怎么样,还是先把所有成员的蛋白序列download下来,进行保守结构域分析。


    Nramp.hmm文件

    out输出文件的内容
  • 批量获取家族成员信息

大致思路:首先从out输出文件的内容中,将其中的geneID截取下来,然后再根据ID号将蛋白序列从protein.fa文件中获取所有家族成员。

代码如下:

# 截取id号
vim out
# 获取id号所在的行号,然后再用sed命令截取行,再用grep命令将id号匹配并重定向。
在vim命令模式下,输入“:set nu”
# sed命令截取,并用管道符直接输入给grep,匹配重定向到id文件
sed -n '17,26p' out | grep -o "Sol.*\.1" > id
# 利用samtools工具来进行序列提取
# 首先建立索引文件
samtools faidx protein.fa
# 再将id好作为输入,之后在重定向
# 参考链接:https://www.biostars.org/p/49820/
xargs samtools faidx protein.fa < id > nramp_protein
less nramp_protein
# 得到的序列文件是含有回车符的,我利用一个perl单行命令将fasta格式的多行序列变成单行的fasta格式序列,链接:http://www.biotrainee.com/thread-291-1-1.html
perl -pe '/^>/ ? print "\n" : chomp' in.fasta | tail -n +2 > out.fasta
# 最后在samrt网站确认是否是该家族成员,进行最后的鉴定。链接:http://smart.embl.de/smart/set_mode.cgi?NORMAL=1
行号显示

会多这样一个fai后缀的索引文件

含有NRAMP结构域的基因

4.写在最后的感想

还是没有及时的更新,虽然一直想写,但作为实验gou,我只能将大部分的时间用来实验了,从而没有过多的时间来写。挺对不起一个读者,我之前回答说的是上个礼拜更新的,可是最后还是拖了一个礼拜。

今天实验室聚餐,各种情况都出现了,感觉大家都是不容易,外人看来都是很光鲜亮丽,很不错的工作,但是这背后的背后,有多少的辛酸能被人所理解,有时候还真是需要诉说。发现现在自己出去,真的会混得非常的惨,真是不敢想象。

最近在做基础序列的发掘分析,感觉主要就是对于各种文本文件的截取,需要用到很多shell命令,发现自己很欠缺这方面的,开始特别困难,之前从来没有实战过,只是看教程,对于真正的项目分析,还是非常欠缺。
到现在,还是学到了很多,在实践中去补充自己的不足,一边摸索一边学习还是收到了很多的收获。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343