RNA-seq转录组数据分析2022-09-30

RNA-seq转录组数据分析思路

数据产生

-测序的平台和测序的类型
-测序基本原理
1.single end 、2.pair end测序、3.mate pair测序
-实验设计

数据处理

-数据误差来源
-质量控制软件FastQC结果解读
-数据过滤软件Trimmomatic

有参转录组序列比对hisat2

-不同软件的比较
-常用高通量序列比对算法
-基因组
1.STAR、2.
-转录本
RSEM

无参转录组

-转录本从头拼接原理
-拼接方法 Trinity

表达定量

-RNA-seq常用的统计定量单位
-基因组比对
1.Htseq-Count、2.FeatureCount
-转绿本比对
Rsem

无比对快速定量

kallisto
数据如何分析

差异表达

-Deseq标准化原理
-结果解读

8.富集分析

-Go常用网站和工具
-通路富集分析

9.数据可视化展示

-IGV
-基因浏览器

实战演练

数据预处理

构建目录

-原始数据目录
-基因组文件
-注释信息文件
-结果文件

参考序列下载

-参考基因组fasta
去相关数据库下载参考基因组的fasta文件
-注释信息 gtf、gff
ensembl、jgl等数据库,araport数据网站

原始数据上传

检测数据完整性md5值
md5sum *gz>md5.txt
md5sum -c md5.txt #比对已经有点数据

质量控制

-安装conda使用fastQC
which fastqc #查找是否有该软件
fastqc 序列文件名.fastqc.gz 进行处理
fastqc *.gz #进行多个处理
或者
for i in ls *gz;do fastqc $i ;done #for循环实现批处理
或者(将文件放入后台并行处理)
ls *.gz |xargs -I [] echo 'nohup fastqc [] &' >fastqc.sh
bash fastqc.sh

Multiqc进行多个质控结果可视化

multiqc ./ #在当前文件下进行比对

质量过滤-Trimmomatic(需要java的环境)

对illumina测序文件的接头进行开头结尾进行切除
接头的序列信息不同,采用不同的命令进行处理
illumina Single End/illumina Paired End : TruSeq2-SE.fa/TruSeq2-PE.fa
TruSeq Universal Adapter/TruSeq Adapter,index: TruSeq3-SE.fa TruSeq3-PE.fa
接头参数的选择
TRUE/FALSE
双端测序用TRUE

序列比对

-无参分析:转录本拼接——trinity
-以转录本和基因组分别进行比对

转录本

RASE

基因组

-STAR实例
1.建立索引
STAR --runThreadN 6 --runMode genomeGenerate
--genomeDir arab_STAR_genome(比对的文件输出目录)
--genomeFastaFiles /目录/文件 (比对的参考文件)
--sidbGTFfile /目录/文件 (比对的注释文件)
--sidbOverhang 149^C (比对reads的长度-1)
2.进行比对

image.png

3.查看比对文件


image.png

-Hisat2

表达定量分析

-处理原始比对文件
picard、samtools
将sam文件变成bam文件
-先比对再定量STAR+RSEM/STAR+HTSeq


image.png

构建准备环境


image.png

参考基因组转录本文件
image.png

查看
image.png

主要关注的是基因和转录本的信息。

-非比对的定量表达分析Kallisto(free-alignment)
构建索引


image.png

定量


image.png

观察.tsv文件

差异分析

featureCounts+STAR软件能够提升表达定量的速度
conda install subread


image.png

查看文件内容

表达定量结果转换为表达矩阵

到RESM的输出文件目录操作


image.png

生成基因表达矩阵
查看之后剔除表达量为0的命令


image.png

进入R之后操作...

-edgeR
-DESeq2

。。。。。。。
由于配置环境未成功,后续操作做不了。
详情参见于:
RNA-seq转录组数据分析入门实战07-差异分析_哔哩哔哩_bilibili

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容