改造IGV (八)- 基于RNAseq测序数据 - 人工进行基因结构注释矫正

写在前面

课题组目前做一些基因组相关工作。了解基因组的朋友应该明白,基因结构注释错误几乎遍布所有基因组,包括我们目前看到的大多数即使是发表在顶级期刊的工作。生物是复杂的,而算法是存在局限的。所以人工矫正基因结构注释往往是最终选择之一。目前,市面上基本只有一个工具可以做到,那么是一款叫做Apolle Browser的浏览器。现在已经是第二代【第一代似乎已经无法下载到】,一个常用的网页基因组浏览器JBrowser的一个插件实现。配置起来并不方便,涉及到各类软件的安装。所以最好的选择或许还是直接使用IGV。本文提到的改造,没有之前IGV-sRNA的改动大,主要原因是,我失败了。不过这并不影响目的的基本达成【失败只是相对于暂时定位过高的目标】。以下,直接讲述操作,作为课题组师弟师妹的使用指引。

主要分为三步:

  1. IGV中定区间,指定基因ID
  2. TBtools中转换输出的文件为gff3格式【即是最优基因结构注释】
  3. 替换原始GFF3文件对应的内容

第一步 - IGV中定区间

我写工具,往往会考虑操作的难度。所以要求用户在IGV中定区间,我做了一些简单的东西,使得用户可以相对轻松的完成。
如下
可以看到这是一个错误的注释,或者是没注释出来。换句话说,其中已有的那个注释,本身很可能是一个错误的注释。


首先,使用IGV的区间工具,选中几个区间,你可以一次选择一个外显子,也可以使用多个有重叠的区间,覆盖一个外显子(后续会自动合并)。
如下,我分几步走,先用短的覆盖边界



随后,我继续使用区间工具,增加一些跟以上区间重叠的外显子区间



在Region Navigator中可以看到

这个窗口一般不关闭,完成一个基因之后,我个人的建议是,先Assign成一个基因,首先是选中这些区间,然后点击Assign

然后关闭小窗口,那么就会直接Assign一些信息上去
注意,其中GeneName必须是唯一的,Positive是转录本在正反链,我们用的是链特异,所以这些是负链的基因,Coding与否,你要有自己的判断,我是直接截取这个区间,BlastX到NCBI,看了下,知道这个是Coding

针对每一个基因,可以一直重复一个操作。那么就会有一系列的基因

第二步

完成了你人工矫正的步骤之后,在IGV中导出regions.bed




随后,打开TBtools



将文件设置进去,注意到必须输入文件是一个,即regions.bed
如果你的是Coding的基因,那么最好是也输入基因组序列文件,这样TBtools会自动判断并输出CDS的Feature;如果没有基因组序列文件,那么就不会有CDS feature,即使你输入的是Coding的。

点击Start,会在非常短的时间内完成。



这个生成的gff3文件,可以直接导入到IGV

于是,我们完成了基因的结构注释人工矫正。

我们手上的IGV是已经改造过的。所以,我们这个时候还可以做一个有趣的事情,直接点击对应的转录本



随后打开TBtools,黏贴进去



是的,你点击了一下转录本,就直接在剪切板中得到了全长CDS【这个功能是前几天我增加进去的】。
于是你还得到了对应的蛋白序列,找个公共数据库BlastP

可以看到,我们确实完成了一个正确的基因结构注释的人工矫正。
荔枝基因组从此多了一个基因注释。

写在后面

当然,还有第三步,那么就是替换gff3,但是...暂时懒得写了。以后再算吧。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容