转录组测序是最常用的组学实验,对全谱基因定量,找到差异表达基因。RNAseq涉及到原始数据,数据质控,基因组比对,差异基因鉴定,差异基因功能富集分析,重要基因如转录因子激酶的靶基因预测等,我们用10讲的时间,全面讲解转录组测序报告,及在上百个项目中遇到的近百个常见问题。
前几期视频,我们讨论了在cleandata数据与参考基因组比对后,基因表达的定量信息,并识别了组间差异表达的基因。
寻找差异表达的基因并识别它们的功能,是我们进行RNA测序的最主要目的。很明显,这些差异的基因必然与功能改变密切相关,例如,比较患病个体与正常个体的组织表达谱,不难想到这些显著失调的基因参与了生物学过程、信号通路等,导致了疾病的发生。
本期视频就让我们讲解如何通过生信分析的方法,包括差异表达基因的GO、KEGG功能富集分析以及基因集富集分析(GSEA),初步探索差异表达的基因发挥了怎样的功能,参与了哪些调控通路。
本节内容要点包括:
(1)GO、KEGG数据库简介,怎样进行GO、KEGG富集分析;
(2)通过超几何分布计算功能通路富集的原理;
(3)常见的GO、KEGG功能富集分析工具有哪些;
(4)如何评估通路激活与抑制;
(5)怎样挑选感兴趣的通路;
(6)如何确定与功能相关的基因;
(7)关于p值和p调整值(FDR)考虑哪个;
(8)关注的功能没有富集到,是什么原因呢;
(9)明显不相符的通路为什么会被富集到(例如,植物中富集了癌症信号通路);
(10)数据库中缺乏注释的物种如何进行功能富集;
(11)基因集富集分析(GSEA)与常规的GO、KEGG富集分析的区别在哪里,怎样进行GSEA;
(12)常见统计图表解读,包括柱形图、气泡图、弦图、网络图等。
视频教程:
bilibili超清视频链接:https://www.bilibili.com/video/BV12T4y1E7UW