导读
火山图表示两组间的差异,而在scRNA-seq中,同时会有多个cluster(vs其他cluster)的差异。如果用常规火山图展示,可能需要绘制十几个图。有没有更高效的展示方法呢?今天给大家带来CELL文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”中展示scRNA-seq差异基因的多组火山图的绘制方法。
1,常规火山图
在RNA-seq(或蛋白质组,或代谢组)数据分析中,火山图是常见的一种数据可视化工具,它通过将统计显著性量度(如p值)和变化幅度(例如log2FC)相结合,帮助研究者快速直观地识别出在不同样本间具有显著差异表达的基因(或蛋白,或代谢物)。
火山图本质上是一种散点图,每个点代表一个基因(或蛋白,或代谢物),其位置由两个坐标轴定义:横轴通常表示变化幅度(如log2 fold change,log2FC),纵轴表示统计显著性(如-log10 p-value)。倍数变化(fold change)是衡量基因(或蛋白,或代谢物)在一组样本中相对于另一组样本的表达水平变化的指标。如果log2FC大于0,则表示基因在实验组中的表达量上升;如果log2FC小于0,则表示表达量下降。
火山图可以展示为不同颜色的点,通常红色表示上调基因,蓝色表示下调基因,而灰色表示无显著差异的基因。
2,scRNA-seq火山图
2019年发表在CELL上的文章“A Spatiotemporal Organ-Wide Gene Expression and Cell Atlas of the Developing Human Heart”fig 2h给我们展示了单细胞RNA测序数据展示的新思路。
图中展示了10个cluster的差异基因。其中X轴利用10个矩形块(编号0-9)将整个区域分成10快:cluster0 - cluster9。每一块中X轴上的点进行了抖动(jitter,随机抖动),Y轴表示logFC,并标注了每个cluster上topN的基因。红色点表示adjusted
pval<0.01,黑色点表示adjusted pval>0.01。从图中可以很容易地观察到每个cluster(vs其他cluster)的差异基因,倍数变化范围,大概的差异基因数,以及adjusted pval的情况。令人耳目一新。
3,余丁解图
所有的图都是由点、线、颜色等组成的。这个图由以下元素构成:
1),表示基因的点,每个点的位置由X轴cluster的编号和Y轴logFC组成,并且在X轴的方向上进行了jitter;每个点根据adjusted
pval的大小以不同的颜色表示,可以使用geom_jitter绘制;
2),0-9的cluster,就是10个矩形,标注了不同cluster的编号,可以使用geom_tile函数绘制
3),限制不同cluster的灰色矩形背景,可以使用geom_col函数绘制。
由于jitter的点是随机抖动的,所以如何标注jitter后基因的位置是本图的难点,这也是网上其他教程悬而未决的问题。
4,在线绘制scRNA-seq多组火山图
4.1 打开微生信在线作图网站
https://bioinformatics.com.cn/plot_basic_scrna_multi_volcano_plot_244
4.2 示例数据
点击右侧的示例数据,下载打开。
示例数据包括四列,A列是基因,B列是log2FC,C列是pvalue,D列是cluster。
4.3 粘贴示例数据
拷贝ABCD 4列,粘贴到第一个输入框。若数据较多,也可以上传tab分割的txt文件。
4.4 设置参数
可选参数我们设置了
1)标注基因的输入框
若留空则标注log2FC top10的差异基因;若有数据(数据为上述表格中感兴趣基因所在的行)。
2)图片大小、字体、cluster背景颜色及透明度
3)cluster矩形的颜色
共设置了12种可选颜色,第13+种使用系统默认的颜色
4)p/fdr阈值和log2fc阈值
其中p阈值也可以使用科学计数法表示。
Log2fc阈值用来控制cluster矩形的高度。因为我们一般不绘制非差异的点(基因)。
5)绘图模式及颜色
提供了3种绘图模式。
第一种是up,down模式。Up一种颜色,down一种颜色。
第二种是p模式,p小于阈值的一种颜色,p大于阈值的一种颜色。
第三种是组合模式,up一种颜色,down一种颜色,p小于阈值的一种颜色。
同时提供了点大小、Y轴说明和字体等参数供选择。
4.5 提交出图
粘贴好数据,选择好参数后,点击提交按钮,等待约5s后会生成scRNA-seq多组火山图。
从图中C3最上方标注的点可以看出,微生信完美解决了网上其他教程中“线指虚空”的问题。
我们提供了PDF、SVG两种矢量图,PNG和tiff两种标量图供大家下载使用。其中矢量图可以使用acrobat illustruator或者inkscape进行编辑,例如拖动legend的位置等。
微生信助力高分文章,用户183000,谷歌学术3400篇