长链非编码RNA(Long non-coding RNA, lncRNA)是长度大于 200 个核苷酸的非编码 RNA。研究表明, lncRNA 在剂量补偿效应(Dosage compensationeffect)、表观遗传调控、细胞周期调控和细胞分化调控等众多生命活动中发挥重要作用,成为遗传学研究热点。
在lncRNA研究中,lncRNA的靶基因确定是最难的一个步骤,因此如果有办法预测lncRNA的靶基因,会大大减少我们的工作量。今天推荐一款在Linux下运行的软件——RIblast。
软件介绍
https://github.com/fukunagatsu/RIblast
RIblast is ultrafast RNA-RNA interaction prediction software based on seed-and-extension algorithm for comprehensive lncRNA interactome analysis.
作者也针对这款软件发表了文章,感兴趣的可以去读读。Prediction of lncRNAs and their interactions with nucleic acids: benchmarking bioinformatics tools
用法
1.git clone下载源文件及编译
mkdir -p RIblast #新建RIblast路径
cd RIblast
git clone https://github.com/fukunagatsu/RIblast.git
make #编译
2.建库
./RIblast db -i dbRNA.fa -o test_db #此处dbRNA.fa是预测的目标mrna序列,test_db为建库名称
./RIblast ris -i queryRNA.fa -o output.txt -d test_db #queryRNA.fa为lncRNA序列,output.txt为输出文件
3.结果
Id,Query name, Query Length, Target name, Target Length, Accessibility Energy, Hybridization Energy, Interaction Energy, BasePair
查询名称,查询长度,目标名称,目标长度,可访问能量,杂交能量,交互能量