RNA-seq,Ribo-seq数据分析(上)

文献:The Tomato Translational Landscape Revealed by Transcriptome Assembly and Ribosome Profifiling

根据文献,从GEO数据库下载原始测序文件,RNA-seq双端100bp,Ribo-seq单端50bp,两种方式各三个生物学重复。

原始文件

module load sratoolkit/2.9.6

prefetch --option-file SRR_Acc_List.txt

#下载原始测序数据,ncbi,GSE124962,路径~/ncbi/public/sra/

for i in SRR*;do

fastq-dump --split-3 $i #RNAseq的目录下,RNA双端reads转fq

gzip $i

done

for i in SRR*;do

fastq-dump $i #Riboseq的目录下,ribo单端reads转fq

gzip $i

done

The adaptor sequence AGATCGGAAGAGCACACGTCT was fifirst removed from the Ribo-seq data using FASTX_clipper v0.0.14.文献中去adapter的说明,我用cutadapter。

for i in *fastq.gz;do

out=${i%.fastq.gz}_trim.fastq.gz

"cutadapt -a \"AGATCGGAAGAGCACACGTCT\" -O 5 -o ${out} ${i}"

现在Ribo-seq得到SRR8434774_trim.fastq.gz,SRR8434775_trim.fastq.gz,SRR8434776_trim.fastq.gz,三个文件。

作者用番茄SL2.5的参考基因组和ITAG2.4去掉了测序中的rRNA,tRNA,snRNA等等,用SL3参考基因组ITAG3.2版本注释去出数据中基因组重复序列。将SL2.5和ITAG2.4中对ncRNA的注释下载下来,根据注释提取序列,并且建bowtie2索引。

bedtools getfasta -fi S_lycopersicum_chromosomes.2.50.fa \

-bed ITAG2.4_infernal.gff3 -fo internal.fa

module load Bowtie2/2.4.1

bowtie2-build internal.fa internal

#将ncRNA的序列提取出来,internal.fa,并且建比对索引

将RNA数据比对到ncRNA的序列上,利用samtools将未必对上的提取出来,再用bedtools将bam文件转化成双端fq文件。

for id in *_1.fastq.gz;

do

name=${id%_1.fastq.gz}

one=${name}_1.fastq.gz

two=${name}_2.fastq.gz

out=${name}.sam

bowtie2 -x /public/home/yliang/ly/protocol/tommato-ribo/\

ref/SL2.5/internal -p 10 -1 ./$one -2 ./$two  -S ./$out

done

#RNA-seq数据批量比对到small RNA上

module load SAMtools/1.9

for i in *sam;do

out=${i%.sam}.sort.bam

samtools view -@ 10 -bS -f 4 ${i}|\

samtools sort -@ 10 -m 32G -n -o ${out}

done

#将未必对上的read取出来,并且将bam文件排序。

#samtools -f 4指输出没比对上的reads

#samtools sort中默认按照参考gtf文件中的顺序排序,-n加上按照fastq文件的顺序

#ribo和rna的数据这一步都一样

#对于RNA的数据,将bam转化为双端fq,并压缩

module load BEDTools/2.27

for i in *sort.bam;do

fq1=${i%.sort.bam}_sort1.fq

fq2=${i%.sort.bam}_sort2.fq

bamToFastq -i ${i} -fq ${fq1} -fq2 ${fq2}

done

gzip *fq

撒币了,bowtie2有专门输出没比对上的参数,绕了个大圈。对于单端的Riboseq的reads有:

for id in *trim.fastq.gz;

do

name=${id%.fastq.gz}

out=${name}.sam

un=${name}.fq.gz

bowtie2 -x ~/ref/SL2.5/internal -p 10 \

-U ./$id -S ./$out --un-gz ./$un

done

对于双端的RNA-seq数据,有:

module load Bowtie2/2.4.1

for id in *_1.fastq.gz;

do

name=${id%_1.fastq.gz}

one=${name}_1.fastq.gz

two=${name}_2.fastq.gz

out=${name}.sam

un=${name}.fq

bowtie2 -x ~/ref/SL2.5/internal -p 10 \

-1 ./$one -2 ./$two -S ./$out --un-conc ./$un

done

以上步骤去掉了注释的rRNA,tRNA,snRNA,snoRNA。

下一步是去除包含基因组中包含重复序列的reads,下载SL3参考基因组和ITAG3.2对重复序列的注释文件,将重复序列提取出来,建比对索引。

bedtools getfasta -fi S_lycopersicum_chromosomes.3.00.fa \

-bed ITAG3.2_REPET_repeats_agressive.gff -fo repeat.fa

bowtie2-build repeat.fa repeat

与以上相同的方式,通过bowtie2的--un,--un-conc参数把单端Ribo-seq和双端RNA-seq中未必对上的reads给取出来。OK,过滤完毕。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,198评论 6 514
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,334评论 3 398
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,643评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,495评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,502评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,156评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,743评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,659评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,200评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,282评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,424评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,107评论 5 349
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,789评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,264评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,390评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,798评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,435评论 2 359