PsRobot的使用流程 | 小麦篇

⭐⭐⭐本文记录我使用PsRobot的psRobot_tar模块识别靶基因的过程。踩了不少坑,供实验室师弟师妹们借鉴学习。本文参考:

  1. psRobot_tar模块 is designed to find potential small RNA targets;
    psRobot_tar 识别潜在的小RNA 的靶基因。

  2. psRobot_map模块 is designed to find all perfect matching locations of short sequences (less than 40bp) in longer reference sequences;
    psRobot_map 在更长的参考序列上找出所有完美匹配的短序列(小于40bp)。

  3. psRobot_mir模块 is designed to find small RNAs with stem-loop precursors (e.g. miRNAs or shRNAs) for a batch of input sequences from high throughput sequencing data;
    psRobot_mir 可为一批来自高通量的输入序列寻找具有茎环前体的小RNA(如miRNA或shRNA)。

  4. psRobot_deg模块 is designed to identify which small RNA targets are supported by user specified degradome data.
    psRobot_deg 用于识别哪些小RNA靶标得到了用户指定的降解组数据的支持。

下面我们借助psRobot_tar模块识别miRNA的靶基因,let's go。

1. 下载、处理mature.fa文件

    1. 从mirBase下载,mature.fa 文件
      👉 注意:最好迅雷下载,不知道为何,浏览器直接下载,下载不了。
    1. 使用Notepad++ 软件处理,删除其他物种的miRNA,仅保留小麦的,另存为tae_miR.fa.

2. 从Ensembl plants 下载cDNA文件。

Triticum_aestivum.IWGSC.cdna.all.fa

3. 使用xftp 上传至服务器

  • Triticum_aestivum.IWGSC.cdna.all.fa
  • tae_miR.fa

4. 简化Triticum_aestivum.IWGSC.cdna.all.fa 和tae_miR.fa文件

删除以">"开始的行中cdna 及以后的信息

sed  -ri   '/>/s/cdna.*$/ /g'  Triticum_aestivum.IWGSC.cdna.all.fa

简化tae_miR.fa

没处理之前的tae_miR.fa
less -SN tae_miR.fa
===================  没处理之前  =========================
>tae-miR159a MIMAT0005343 Triticum aestivum miR159a
UUUGGAUUGAAGGGAGCUCUG
>tae-miR159b MIMAT0005344 Triticum aestivum miR159b
UUUGGAUUGAAGGGAGCUCUG
>tae-miR160 MIMAT0005345 Triticum aestivum miR160
UGCCUGGCUCCCUGUAUGCCA
>tae-miR164 MIMAT0005346 Triticum aestivum miR164
UGGAGAAGCAGGGCACGUGCA
===================  没处理之前  =========================

处理tae_miR.fa,变得清爽多了
sed  -ri  '/>/s/MIMAT.*$//g'  tae_miR.fa
less -SN tae_miR.fa
===================  处理之后  ===========================
>tae-miR159a 
UUUGGAUUGAAGGGAGCUCUG
>tae-miR159b 
UUUGGAUUGAAGGGAGCUCUG
>tae-miR160 
===================  处理之后  ===========================

5. 依赖软件mfold3.5 安装 (有管理员权限)

wget http://omicslab.genetics.ac.cn/psRobot/program/WebServer/mfold.tar.gz
tar xvzf mfold.tar.gz
cd  mfold-3.5/
./configure
make
sudo make install

6. PsRobot软件 安装 (有管理员权限)

wget http://omicslab.genetics.ac.cn/psRobot/program/WebServer/psRobot_v1.2.tar.gz
tar xvzf psRobot_v1.2.tar.gz
cd  psRobot_v1.2
sudo ./configure
make
sudo make install
source  ~/.bashrc 

7. PsRobot运行

PsRobot 有一些参数:

psRobot_tar  -s  tae_miR.fa  -t  Triticum_aestivum.IWGSC.cdna.all.fa  -p 8  -o  target_results.gTP

使用cDNA序列不用genomic序列的原因是,miRNA在细胞质和靶基因结合发挥作用。此时靶基因还有UTR区域但是已经没有内含子区了。(考虑到UTR区域的序列特点,其实用CDS序列也行)

psRobot_tar 的参数:

  • -s input file name: smRNA sequences (fasta format);default = smRNA
    待预测的miRNA,fasta格式;默认:smRNA

  • -t input file name: target sequences (fasta format),default = target
    用于搜索的cDNA序列,fasta格式;默认: target

  • -o output file name,👉注意:default = smRNA-target.gTP
    输出文件名,默认:smRNA-target.gTP

  • -ts target penalty score, lower is better (0-5),default = 2.5
    输出结果的阈值,默认:2.5

  • -fp 5 prime boundary of essential sequence (1-2),default = 2
    5'后第几位开始是必要区间(1~2), 默认:2

  • -tp 3 prime boundary of essential sequence (7-31), default = 17
    3'后第几位开始是必要区间(7~31), 默认:17

  • -gl position after which with gap/bulge permit (0-30), 0 means no gap/bulge permitted, default = 17
    从第几个碱基后允许出现gap/bulge, 默认:17

  • -p number of processors use,default = 1,
    使用线程数, 默认:1,👉注意:根据实际情况可以改大些

  • -gn number of gaps/bulges permitted (0-5), default = 1
    允许存在几个gap/bulge, 默认:1

8. 结果查看

less  -SN target_results.gTP
======================================================
1 >tae-miR159a    Score: 2.5      TraesCS7A02G377100.1  
2 
3 Query:          1 TTTGGATTGAAGGGAGCTCTG^M 22
4                   *|||||*||||||||||||::*
5 Sbjct:       1095 TAACCTTACTTCCCTCGAGGTA 1074
6 
7 
8 >tae-miR159a    Score: 2.5      TraesCS7D02G446700.1  
9 
10 Query:          1 TTTGGATTGAAGGGAGCTCTG^M 22
11                   |||||*|:|||||||||||*|*
12 Sbjct:        952 AAACCAAGCTTCCCTCGAG-CG 932
13 
14 
15 >tae-miR159a    Score: 2.5      TraesCS1D02G307500.2  
16 
17 Query:          1 TTTGGATTGAAGGGAGCTCTG^M 22
18                   *|||||*||||||||||||::*
19 Sbjct:       1156 TAACCTTACTTCCCTCGAGGTA 1135
======================================================

9. 将靶基因对存于miRNA-mRNA.txt 文件

cat  target_results | grep  "^>"   | cut  -f  1,3 | sed 's/>//g' >>miRNA_mRNA.txt
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容

  • wget http://ftp.ebi.ac.uk/pub/software/vertebrategenomics...
    喜欢吃土豆的彭某人阅读 3,007评论 0 3
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,536评论 28 53
  • 信任包括信任自己和信任他人 很多时候,很多事情,失败、遗憾、错过,源于不自信,不信任他人 觉得自己做不成,别人做不...
    吴氵晃阅读 6,190评论 4 8
  • 步骤:发微博01-导航栏内容 -> 发微博02-自定义TextView -> 发微博03-完善TextView和...
    dibadalu阅读 3,138评论 1 3
  • 人工智能是什么?什么是人工智能?人工智能是未来发展的必然趋势吗?以后人工智能技术真的能达到电影里机器人的智能水平吗...
    ZLLZ阅读 3,779评论 0 5