写在前面
经过了前面的五次IGV改造,我以为这个系列可能就到此为止了。
然而在近期的数据分析过程中,我们仍然发现了一个新的需求:
在展示sRNA reads的时候,只看某个长度的reads,比如植物的miRNA大多是21nt,常见的phasiRNAs,或者全都是21nt,或者全都是24nt
在IGV中,一个不错的选项是Group Alignment。使用整个选项,可以做很多事情,如下:
从选项中,我们可以看到,可以基于读段方向,读段文库等进行分组,甚至也可以基于自定义的tag进行分组。
这里存在一个简单的方法可以实现,按照sRNA reads的长度进行分组,即直接在BAM文件操作,对每一个记录增加一个tag,记录其对应的read长度信息。这个做法事实上比较OK的,但是也是比较ugly的。一者是低效,二者是增加硬盘存储。
那么解决这个问题最好的做法就是,继续改造IGV
改造结果
昨天晚上,在与博导讨论到某个位点的分析是,我们觉得有必要单独查看21nt的sRNA reads。我当然不会选择去对BAM做修改。于是拿起IGV,改之。
效果如下:
修改之前,我们可以看到存在不同长度的reads在AlignmentTrack
在改造中的IGV,为了更快地看到不同长度的reads,我们在之前已经提供了Color Alignments的参数
可以看到,这个位点是个很不错的21-nt PHAS位点,从readLen Track或者是real-time phasing score track都不错。下面的Alignment Track中存在一些24 nt 和 22 nt的reads,当然还有其他长度的。于是我们使用Group Alignment by sRNA Len
上图增加了一个Option,使用后效果如下
此时,我们当然也可以不用Color By ReadLen
对比起一开始的Reads Alignment Track,Phas的情况看起来清晰很多。
当然,这个功能或许只有在相对混杂的位点,会更加明显。
写在最后
有时候,或许很多事情,跟sRNA位点是一样的。
需要拨开云雾,才能看到真相。
修改版IGV的获取方式
近日有多个朋友联系过来,想要使用这个改造后的IGV。嗯...
我个人的想法是:
- 付费,如资助XiaLab课题组出游一次,大体价格是3K,那么将获得本年度(如果还有更细的话)的我经手的IGV更新功能。
- 直接联系课题组PI即RX获取,课题组主页为 http://xialab.scau.edu.cn/