导语
热图,作为在组学分析中不可或缺的一部分,其绘制方法相对简单。 热图通过颜色的深浅来反映二维矩阵中数值的大小,常用于展示基因表达、蛋白质相互作用、代谢途径活性等方面的数据信息。它不仅能直观地展现多个基因在不同样本中的表达水平,还能通过丰富的色彩变化凸显差异,吸引读者注意力,呈现重点。今天,小编主要给大家分享元莘生物云平台(http://cloud.origin-gene.com/)的3款热图小工具,赶紧mark一下~
1.聚类热图
聚类热图(Heatmap)使用渐变的颜色来反映矩阵中的数据信息,通过颜色的深浅变化显示数值的大小,使得数据呈现形式更加直观。Heatmap分析往往根据实际需要对数据进行相似性聚类,并将聚类树显示于Heatmap上。
用户可依据实际需要选择是否进行聚类,选择聚类可将相似度较高等信息汇聚在一起,聚类后的结果图更有序直观。如果用户已设定特定的样本顺序,且对除样本外的其他展示信息没有特殊的要求,可以选择不聚类。
参数设置
热图数据表:数据矩阵。文件格式可以是xls或txt,Tab分隔。需要包含行头和列头,一般第一行为样本名,第一列为基因id或名称(或其他特征名称)。
行注释文件(选择):文件格式为txt,Tab分隔。第一列为相关因子,和数据表对应。
列注释文件(选择):文件格式为txt,Tab分隔。第一列为样本名,和数据表对应。
使用说明:《云平台|云工具之聚类热图操作指南(3)》
2.相关性热图
相关性热图是通过计算不同组学研究或单一组学与环境因子数据矩阵之间的相关性(spearman、pearman、kendall相关系数),将获得的数值矩阵通过heatmap图直观表示。通过颜色变化反映二维矩阵或表格中的数据信息,颜色深浅表示数据绝对值的大小,它可以直观地将数据值的大小以定义的颜色深浅表示出来。
参数设置
纵坐标数据:选择数据一文件,数据表必须包含行头和列头,样本名在首列,特征名(如:基因、蛋白、代谢物、OTU、临床指标、理化因素)在首行,样本名和特征名应仅包含数字、字母、下划线,样本顺序不做限制。输入数据表文件的分隔符仅支持Tab制表符。
横坐标数据:选择数据二文件,数据表必须包含行头和列头,样本名在首列,特征名(如:基因、蛋白、代谢物、OTU、临床指标、理化因素)在首行,样本名和特征名应仅包含数字、字母、下划线。首列样本名需与纵坐标数据保持一致。输入数据表文件的分隔符仅支持Tab制表符。
使用说明:《云平台|云工具之相关性热图操作指南(1)》
3.样本相关性热图
根据样本的基因表达水平计算各样本之间的相关性系数,得到相关性矩阵,样本相关性热图通过可视化相关性矩阵,可以直观的看出样本之间的差异或重复情况,同时检验实验是否可靠、样本选择是否合理。相关系数越接近1,表明样本之间的表达模式相似度越高。
参数设置
表达量矩阵:文件必须为txt格式。可以选择在excel中将数据打开,然后另存为"文本文件(制表符分隔)(*.txt)"。列名为样本名,行名为gene_id/gene_name,行名和列名只能包含字母、数字及下划线。
使用说明:《云平台|云工具之样本相关性热图操作指南》