PsRobot的使用流程 | 小麦篇

⭐⭐⭐本文记录我使用PsRobot的psRobot_tar模块识别靶基因的过程。踩了不少坑，供实验室师弟师妹们借鉴学习。本文参考：

psRobot_tar模块 is designed to find potential small RNA targets;
psRobot_tar 识别潜在的小RNA 的靶基因。
psRobot_map模块 is designed to find all perfect matching locations of short sequences (less than 40bp) in longer reference sequences;
psRobot_map 在更长的参考序列上找出所有完美匹配的短序列(小于40bp)。
psRobot_mir模块 is designed to find small RNAs with stem-loop precursors (e.g. miRNAs or shRNAs) for a batch of input sequences from high throughput sequencing data;
psRobot_mir 可为一批来自高通量的输入序列寻找具有茎环前体的小RNA(如miRNA或shRNA)。
psRobot_deg模块 is designed to identify which small RNA targets are supported by user specified degradome data.
psRobot_deg 用于识别哪些小RNA靶标得到了用户指定的降解组数据的支持。

下面我们借助psRobot_tar模块识别miRNA的靶基因，let's go。

1. 下载、处理mature.fa文件

1. 从mirBase下载，mature.fa 文件
  👉 注意：最好迅雷下载，不知道为何，浏览器直接下载，下载不了。
1. 使用Notepad++ 软件处理，删除其他物种的miRNA，仅保留小麦的，另存为tae_miR.fa.

2. 从Ensembl plants 下载cDNA文件。

Triticum_aestivum.IWGSC.cdna.all.fa

3. 使用xftp 上传至服务器

Triticum_aestivum.IWGSC.cdna.all.fa
tae_miR.fa

4. 简化Triticum_aestivum.IWGSC.cdna.all.fa 和tae_miR.fa文件

删除以">"开始的行中cdna 及以后的信息

sed  -ri   '/>/s/cdna.*$/ /g'  Triticum_aestivum.IWGSC.cdna.all.fa

简化tae_miR.fa

没处理之前的tae_miR.fa
less -SN tae_miR.fa
===================  没处理之前  =========================
>tae-miR159a MIMAT0005343 Triticum aestivum miR159a
UUUGGAUUGAAGGGAGCUCUG
>tae-miR159b MIMAT0005344 Triticum aestivum miR159b
UUUGGAUUGAAGGGAGCUCUG
>tae-miR160 MIMAT0005345 Triticum aestivum miR160
UGCCUGGCUCCCUGUAUGCCA
>tae-miR164 MIMAT0005346 Triticum aestivum miR164
UGGAGAAGCAGGGCACGUGCA
===================  没处理之前  =========================

处理tae_miR.fa，变得清爽多了
sed  -ri  '/>/s/MIMAT.*$//g'  tae_miR.fa
less -SN tae_miR.fa
===================  处理之后  ===========================
>tae-miR159a 
UUUGGAUUGAAGGGAGCUCUG
>tae-miR159b 
UUUGGAUUGAAGGGAGCUCUG
>tae-miR160 
===================  处理之后  ===========================

5. 依赖软件mfold3.5 安装 (有管理员权限)

wget http://omicslab.genetics.ac.cn/psRobot/program/WebServer/mfold.tar.gz
tar xvzf mfold.tar.gz
cd  mfold-3.5/
./configure
make
sudo make install

6. PsRobot软件安装 (有管理员权限)

wget http://omicslab.genetics.ac.cn/psRobot/program/WebServer/psRobot_v1.2.tar.gz
tar xvzf psRobot_v1.2.tar.gz
cd  psRobot_v1.2
sudo ./configure
make
sudo make install
source  ~/.bashrc

7. PsRobot运行

PsRobot 有一些参数：

psRobot_tar  -s  tae_miR.fa  -t  Triticum_aestivum.IWGSC.cdna.all.fa  -p 8  -o  target_results.gTP

使用cDNA序列不用genomic序列的原因是，miRNA在细胞质和靶基因结合发挥作用。此时靶基因还有UTR区域但是已经没有内含子区了。(考虑到UTR区域的序列特点，其实用CDS序列也行)

psRobot_tar 的参数:

-s input file name: smRNA sequences (fasta format)；default = smRNA
待预测的miRNA，fasta格式；默认：smRNA
-t input file name: target sequences (fasta format)，default = target
用于搜索的cDNA序列，fasta格式；默认： target
-o output file name，👉注意：default = smRNA-target.gTP
输出文件名，默认：smRNA-target.gTP
-ts target penalty score, lower is better (0-5)，default = 2.5
输出结果的阈值，默认：2.5
-fp 5 prime boundary of essential sequence (1-2)，default = 2
5'后第几位开始是必要区间(1~2)，默认：2
-tp 3 prime boundary of essential sequence (7-31)， default = 17
3'后第几位开始是必要区间(7~31)，默认：17
-gl position after which with gap/bulge permit (0-30), 0 means no gap/bulge permitted， default = 17
从第几个碱基后允许出现gap/bulge，默认：17
-p number of processors use，default = 1，
使用线程数，默认：1，👉注意：根据实际情况可以改大些
-gn number of gaps/bulges permitted (0-5)， default = 1
允许存在几个gap/bulge，默认：1

8. 结果查看

less  -SN target_results.gTP
======================================================
1 >tae-miR159a    Score: 2.5      TraesCS7A02G377100.1  
2 
3 Query:          1 TTTGGATTGAAGGGAGCTCTG^M 22
4                   *|||||*||||||||||||::*
5 Sbjct:       1095 TAACCTTACTTCCCTCGAGGTA 1074
6 
7 
8 >tae-miR159a    Score: 2.5      TraesCS7D02G446700.1  
9 
10 Query:          1 TTTGGATTGAAGGGAGCTCTG^M 22
11                   |||||*|:|||||||||||*|*
12 Sbjct:        952 AAACCAAGCTTCCCTCGAG-CG 932
13 
14 
15 >tae-miR159a    Score: 2.5      TraesCS1D02G307500.2  
16 
17 Query:          1 TTTGGATTGAAGGGAGCTCTG^M 22
18                   *|||||*||||||||||||::*
19 Sbjct:       1156 TAACCTTACTTCCCTCGAGGTA 1135
======================================================

9. 将靶基因对存于miRNA-mRNA.txt 文件

cat  target_results | grep  "^>"   | cut  -f  1,3 | sed 's/>//g' >>miRNA_mRNA.txt

最后编辑于：2021.07.23 15:34:19

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,546评论 6赞 507
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,224评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,911评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,737评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,753评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,598评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,338评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,249评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,696评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,888评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,013评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,731评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,348评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,929评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,048评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,203评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,960评论 2赞 355

PsRobot的使用流程 | 小麦篇

1. 下载、处理mature.fa文件

2. 从Ensembl plants 下载cDNA文件。

3. 使用xftp 上传至服务器

4. 简化Triticum_aestivum.IWGSC.cdna.all.fa 和tae_miR.fa文件

删除以">"开始的行中cdna 及以后的信息

简化tae_miR.fa

5. 依赖软件mfold3.5 安装 (有管理员权限)

6. PsRobot软件 安装 (有管理员权限)

7. PsRobot运行

8. 结果查看

9. 将靶基因对存于miRNA-mRNA.txt 文件

推荐阅读更多精彩内容

6. PsRobot软件安装 (有管理员权限)