chromosome---基因家族成员在染色体上的分布及共线性图

首先介绍如何在染色体上标注基因家族成员位置。先上图:


基因家族成员在染色体分布

要实现这个图需要准备两个文件,一个基因组格式化的fai文件,该文件的获取在:


格式化基因组序列文件

需要注意的一点是,有些同学可能动过了自己的基因组文件或者有些同学基因组序列文件太大(>3 G)。在格式化的时候可能会报错,这个时候需要同学们对基因组序列文件做一个处理,所用到的功能就是旁边那个按钮“if there is an error (1,2)”。之后将重新生成的基因组序列文件再次导入相应位置以便产生fai文件。这个文件放在了与基因组序列文件的同一文件夹下。

再一个是由gff或者gtf等文件而来的基因家族位置信息文件,其格式如下:


家族成员位置信息

这个文件的获取可以在gff等文件中直接查找,如果成员较多也可以借助SPDE的文件提取功能进行,或者借助本模块的格式化操作功能进行。因此,需要在这里为同学们普及一下gff文件的相应知识,如下:


标准的gff文件

第一列是染色体ID,第二列意义不大,第三列就是它后面这个片段是什么,比如标记mRNA的就是整个基因转录起始和终止的位置,exon是外显子等,第四列是该片段的起始位置,第五列是该片段的终止位置,第六列是一个得分,第七列是该基因在正链还是负链上,最后是基因ID以及其他一些信息。

可以在 hmmsearch(可参看本专题先前文章)以后根据ID直接在gff文件中直接查找;成员多时,可使用如下功能:

根据关键字查找

通过输入关键字“gene”/"mRNA"等先把这些信息提取出来,之后把基因ID整理到一个文件里,然后从提取的这些信息中批量操作即可。之后,将不需要的部分删除即可。

第三种方法是借助为本模块设置的格式化功能进行:


提取gff信息

其操作模式与之前相同,用户需要根据软件界面提供的信息进行操作。

在文件准备好之后,输入到相应位置即可


各个文件的位置

之后点击draw即可生成相应图,其中在左侧出现的ID是位于负链上的成员而在右侧出现的ID则是位于正链上的成员。需要补充的一点儿是由于同学的基因组组装水平是在scaffold或者contig水平的,这个时候所谓的染色体会非常多,但考虑到排版的美观,SPDE每一次出图只展示14条片段,如果展示太多了就太拥挤。如下图所示:


每次最多14条染色体

可以看到当14条染色体的时候间距还是可以的,但再增加,还要考虑安放基因家族成员的位置,这时就不太美观。当然考虑到一些特殊情况,当多于14条片段时,同学们可以考虑用一组图来表示。也就是需要把fai文件和家族成员的位置文件相应拆开就好。

加下来时染色体共线性图:


染色体共线性

要完成上面的图需要做两种文件类型的准备。一个时bed文件,该文件的生成在:


bed文件的生成

另一个是共线性文件。而共线性文件的生成又要准备两个文件:一个是gff文件;一个是blast文件。blast文件在这里:


diamond比对

需要用蛋白序列进行比对。在最新版本的SPDE中改进了程序,使blast文件生成的时间成本大大缩短,以拟南芥蛋白文件(32 兆)进行自身比对,用时仅为48 S。gff文件的生成则在

共线性gff文件的生成

两个文件准备好后,在Alignment/hmmer模块生成共线性文件

共线性文件的生成

之后,将生成文件进行格式化

格式化生成的共线性文件

上述过程后就可以开始绘图了


共线性界面

还是按照先前几章所叙述的方式在该放入文件的地方放入文件,有几点需要注意的地方:


注意的点

1、大家对文件命名尽可能简单,并且在物种名那个地方填入相应名称;2、填写完成后点击提交,即“submit”,此时会在下面的框中出现提交的内容,第一个框还好说,第二个框需要注意删除你bed文件中并不需要展示的染色体或者片段,否则图没法看;3、注意选择保存类型,即“choose save type”;4、尽量将结果保存在一个空文件夹里,如上图所示,在那个框需要填入一个文件夹的名字。完成分别点击“to layout file”以及“to seqids file”,之后点击draw即可,绘制的图片将存在于你设定的文件夹里

需要补充的一点是在做共线性图的时候往往需要对某些基因进行强调,一般会使用不同颜色的线进行标注。在SPDE中添加标注的方法是:


为线条添加颜色

或者打开格式化后的共线性文件:


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,658评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,482评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,213评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,395评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,487评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,523评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,525评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,300评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,753评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,048评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,223评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,905评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,541评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,168评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,417评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,094评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,088评论 2 352

推荐阅读更多精彩内容