前面学习怎么做差异分析,差异分析的R包是需要根据数据进行选择的,前面我们提到了芯片数据一般用limma包做差异,高通量的二代测序如果是count数据(全是整数),可以选择使用edgeR或者Deseq2进行分析,如果是TPM/FPKM的数据呢?一般推荐使用先做log,默认的话,可以做log2(x+1)或者是log2(x+0.0001),再使用limma包做差异分析,差异分析后,如何做可视化呢?
http://www.sxdyc.com/singleCollectionTool
生信豆芽菜提供了一个差异分析的可视化,比如说常见的火山图,单个特征基因山峦图,多个特征的山峦图,单个特征的基因箱线图,多个特征的箱线图,配对型的箱线图,配对型的复杂箱线图,热图都是
比如说火山图(http://www.sxdyc.com/visualsVolcano)
如果需要展示关注的基因,则准备两个文件,如果不需要展示关注的基因,则准备一个文件就可以了
最关键的就是准备第一个文件,差异分析的结果,只要有三列即可,第一列为基因名,第二列为取过对数后的差异倍数,第三列为p值或者是FDR。列名不重要,重要的是,三列的顺序不能变
可以自己选择下载不同的格式的图片,其中pdf为矢量图,可以用AI进行编辑。
比如说配对型的复杂箱线图
准备一个三列数据,第一列为样本名,第二列为第一个分组的基因表达,第三列为第二个分组的基因表达
http://www.sxdyc.com/visualsBoxHalfPlot
这里就不多介绍了,主要还是要看一下示例数据,把数据复制粘贴进去即可