第4周:大规模鉴定phasiRNA的方法

原文来源:Yang K, Wen X, Sablok G. Method for the Large-Scale Identification of phasiRNAs in Brachypodium distachyon[M]//Brachypodium Genomics. Humana Press, New York, NY, 2018: 187-194.

Abstract

摘要简单说了四个方面的内容,第四点是全文的重点。

  • 小RNA的作用:转录后调控
  • 小RNA的分类,产生过程
  • 鉴定PHAS的策略:不同物种同源序列比对;de novo(测序数据与参考基因组比对)
  • 整理了一份分析流程
Key words

PHAS, phasiRNA, Hyper geometric distribution, Phasing score, Bioinformatics

1. Introduction

第一段

  • 命名为phasiRNA、trans-acting siRNAs的原因
  • 举例说明phasiRNA在植物配子形成过程,光敏雄性不育过程中具有调节作用

第二段

  • phasiRNA和产生phasiRNA的基因座(PHAS基因座)的起源和分布在基因组上是均匀的
  • 单击/双击模式:phasiRNA生成过程需要一个或两个miRNA来触发
  • 详述了phasiRNA生成过程

2. Materials

  1. 小RNA序列的fasta文件
>SRR_1_x77275
TCGGACCAGGCTTCATTCCCC
  1. 参考基因组或转录组的fasta文件
  2. Perl, R, bowtie, and bowtie-build

3. Methods

3.1 建立参考基因组索引
bowtie-build genome.fa genome.fa
3.2 将小RNA序列比对到参考基因组

比对到基因组的小RNA的5'末端的坐标作为起始位置。考虑到小RNA双链体的3'末端有2-nt的突出,当小RNA比对到反义链时,需要额外加上2-nt的正偏移再来确定小RNA的起始位置。
大多数情况下,序列简单、比对到重复区域的那些reads应该被舍弃,以减少背景噪音。

bowtie -f -m 6 -v 0 -a -p 4 genome.fa smallRNA.fa smallRNA.bwt

这里补充一篇bowtie用法详解的帖子,https://blog.csdn.net/soyabean555999/article/details/62236341

3.3 Extracting Small RNA Hotspots from Genome

该方法使用滑动窗口沿基因组滑动的方法来确定以特定相位模式产生小RNA的基因组区间。
一个关键点是确定多远的距离来区分:两个小RNA reads的5'坐标是属于一个hotspots还是属于两个不同的hotspots。

这里的Hotspots应该就是常说的cluster,简单理解为基因组上能产生很多小RNA的小片段。

3.4 Identifying Positive Sliding Windows
3.4.1

以鉴定产生21-nt phasiRNA的区间为例。
将窗口设置为189-nt,移动步长为1;以小RNA 5'的坐标为其位置。

在移动窗口的过程中,当窗口左端与某一小RNA reads 5'的坐标重合时,选取该窗口为待分析窗口。将窗口内基因组的每一个位置编号,按基因组位置坐标除以21的余数,即1-21依次循环编号。如图所示。

小RNA reads比对定位之后,其位置如果具有相同的bin编号,则可以说明,这些小RNA reads是通过相同的相位模式形成的。

3.4.2 Filtering windows showing low possibility to generate small RNA in 21-nt manner

对于每一个窗口,采用以下指标过滤:

  • unique small RNAs的数量.
  • unique 21-nt small RNAs的数量.
  • PHAS register 1st occupied by 21-nt small RNAs的数量.
  • Discarding those with only a few small RNAs mapped, those with low ratio of uniquely mapped 21-nt small RNAs, and those with low proportion of PHAS registers occupied by 21-nt small RNAs.

这里的“register 1st”理解为第一种bin编号,不一定就是1。

3.4.3 Filtering windows with high P-value:
3.5 Calculating Phasing Score
3.5.1 Merging positive sliding windows whose PHAS register 1st are the same as PHAS candidates
  • Grouping positive sliding windows by their PHAS register 1st.
  • Ordering positive sliding windows in the same group by their start coordinates.
  • Checking start and end coordinates of the adjacent positive sliding windows to see if they have overlaps.
  • Extending the positive window by taking the most left and right coordinates of overlapped adjacent windows until they don’t have overlaps anymore.

如果窗口的第一种bin编号相同则将窗口分为一组,再按窗口起始坐标排序,相邻的窗口若有重叠则合并。

3.5.2 Filtering PHAS candidates with highest phasing score

对于每一个候选的PHAS位点,按照以下指标过滤:

  • 21-nt small RNAs的数量.
  • PHAS register 1st occupied by 21-nt small RNAs的数量.
  • 21-nt small RNAs occupying PHAS register 1st的数量.
  • Calculating phasing score of each coordinate with following formula.
  • For PHAS candidates, each coordinate is regarded as the 95th position, which is the middle position of a sliding window. Its phasing score is calculated with the following formula.
  • Discarding PHAS candidates whose highest phasing scores are small.
3.6 Extracting and Quantifying phasiRNAs from Identified PHAS

根据PHAS loci(起始和终止位置)和相位模式(phasiRNA长度为21;每个phasiRNA左端位置对应的bin编号已知)还能够提取出phasiRNA序列。

如图,
63,642,240-63,642,260
63,642,261-63,642,281
63,642,282-63,642,302
......
就是对应的phasiRNA序列。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,864评论 6 494
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,175评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,401评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,170评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,276评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,364评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,401评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,179评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,604评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,902评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,070评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,751评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,380评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,077评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,312评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,924评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,957评论 2 351

推荐阅读更多精彩内容

  • “什么是鱼的爱情?” “遇见她,爱上她,然后忘了她……” “既然已经忘却,那您怎么知道曾经爱过?” “因为心会知道...
    金忆潇阳阅读 1,155评论 0 5
  • 文/图 艾米在渔村 那花,开满围墙 密密匝匝 一簇簇 一串串 橙红艳丽 似炮仗 又似小喇叭 在春节里热情浪漫...
    月影清韵阅读 3,507评论 73 122
  • 1 面纱从一角撩开 一座山,自图书馆踱出 美酒般诗篇,从容了一路眼神 邂逅一个春日,一个人 回首冬季,每个字每一行...
    by一苇阅读 252评论 2 10
  • 其实我很好奇你们三个人,感觉你们仨实属不是一个频道的人,竟然也如此相濡以沫的做了知心好友。 也如你我二人,其实真的...
    莫淇阅读 119评论 0 0
  • 父亲是山梁上的一弯冷月 寂寞的夜里 寒星闪烁 我的父亲 在那个夜晚 孤寂的吸着纸烟 忽明忽暗的烟火 一直在那个夜晚...
    随意分享阅读 227评论 0 1