甲基化组学全流程生信分析教程

甲基化组学全流程分析和可视化教程

读取数据目录下的idat文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

参数解释

func_arraytype:可选450k或EPIC,EPIC是870K的甲基化芯片

func_resultsDir: 分析结果要保存的目录

func_compare__groups__str: 做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock:是否进行比较耗时的block分析,默认为FALSE

func_runGSEA: 是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA: 是否进行比较耗时的CNA分析,默认为FALSE

nested_function: 是否嵌套函数

run_file_path: 甲基化.idat格式的原始数据所在的目录

run_read_file:是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

参数给定的默认值

func_arraytype: 450K ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ;

func_compare__groups__str: T-C ; func_runBlock: FALSE ; func_runGSEA: FALSE ; func_runCNA: FALSE ; nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_raw/ ;

run_read_file: FALSE ; run_analysis_type_name: 10.met_analysis_from_idat ;

run_add__res__dir: FALSE ; run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.met_analysis_from_idat_last_final_run_res_log.csv

运行完成的显示信息

结果展示

读取甲基化beta矩阵文件的甲基化全流程一键分析

功能简介

  1. 甲基化分析模块可以实现甲基化芯片450K, 870kEPIC数据的自动读取,可以读取idat文件,也可以读取beta甲基化矩阵文件
  2. 甲基化数据的缺失值插值
  3. 甲基化数据的质控分析
  4. 甲基化数据的归一化处理分析
  5. 甲基化数据的SVD分析
  6. 甲基化数据的Combat去除批次效应分析
  7. 甲基化数据的DMP差异甲基化位点分析
  8. 甲基化数据的DMR差异甲基化区域分析
  9. 甲基化数据的差异block分析
  10. 甲基化数据的GSEA分析
  11. 甲基化数据的CNA分析

模块使用讲解

参数解释

func_arraytype: 可选450k或EPIC,EPIC是870K的甲基化芯片

func_met__probe__col:甲基化探针所在的列名,当从beta文件开始分析时,要提供

func_resultsDir:分析结果要保存的目录

func_sample__anno__file:样本注释信息的文件,默认是空,如果file_path给的是beta矩阵文件,则需要给出sample.anno.file

func_compare__groups__str:做DMP和DMR分析时候要指定的比较分组,多个分组间用;号隔开

func_runBlock: 是否进行比较耗时的block分析,默认为FALSE

func_runGSEA:是否进行比较耗时的GSEA分析,默认为FALSE

func_runCNA:是否进行比较耗时的CNA分析,默认为FALSE

nested_function:是否嵌套函数

run_file_path:甲基化beta矩阵的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix;是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

给定参数的默认值

func_arraytype: 450K ;

func_met__probe__col: V1 ;

func_resultsDir: D:/omics_tools/demo_data/methylation/lung_results/ ; func_sample__anno__file: D:/omics_tools/demo_data/methylation/lung_results/myImpute_pd.csv ; func_compare__groups__str: T-C ; func_runBlock: FALSE ;

func_runGSEA: FALSE ;

func_runCNA: FALSE ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myLoad_beta.csv ;

run_read_file: FALSE ;

run_analysis_type_name: 10.met_analysis_from_beta ;

run_add__res__dir: FALSE ;

run_add_save_file_prefix: FALSE ;

run_add__parent__dir: FALSE

窗口截图

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation/lung_results; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation/lung_results\10.met_analysis_from_beta_last_final_run_res_log.csv

结果展示

样本的PCA分群聚类分析和剔除异常样本

样本的PCA分群聚类分析

删除异常样本

剔除异常样本后再次进行PCA分群聚类分析

DMRs差异甲基化区域的基因组circos图

参数解释

func_chr__col: bed文件中染色体编号所在的列名

func_start__col: bed文件中起始位置所在的列名

func_end__col: bed文件中终止位置所在的列名

func_value__col: bed文件中结果数值所在的列名

func_use__value__threshold: 是否对value的阈值进行筛选,默认为TRUE

func_value__threshold: bed文件中结果数值的阈值,默认为0

func_p__value__col: bed文件中p值所在的列名

func_title:图表的标题

func_chr__track:是否绘制不同颜色的染色体轨道

func_species:物种的基因组版本号

nested_function:是否嵌套函数

run_file_path:甲基化DMRs结果的文件路径

run_read_file:是否要读取文件

run_analysis_type_name:分析项目名称

run_add__res__dir:是否要创建res_dir结果目录

run_add_save_file_prefix:是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定参数的默认值

func_chr__col: seqnames ;

func_start__col: start ;

func_end__col: end ;

func_value__col: value ;

func_use__value__threshold: TRUE ;

func_value__threshold: 0 ;

func_p__value__col: p.value ;

func_title: DMRs genome plot ;

func_chr__track: FALSE ;

func_species: hg19 ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMR_BumphunterDMR.csv ; run_read_file: FALSE ;

run_analysis_type_name: 10.circlize_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

运行中的显示信息

分析正在执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 运行结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

窗口截图

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\10.circlize_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\10.circlize_plot\10.circlize_plot_last_final_run_res_log.csv

结果展示

结果文件列表

Circos图

差异甲基化位点结果的棒棒糖图可视化

参数解释

func_data__type:数据类型选择methylation

func_sequence__type: 序列类型,是DNA还是protein

func_gtf__anno__file: hg19的基因组注释gtf文件,450K和EPIC都是用的hg19基因组

func_gene__list__str:选择绘制的基因,多个基因用分号分割来批量绘制

func_gene__col: DMP结果文件中基因名称的列名

func_pos__col: DMP甲基化位点位置所在的列名

func_pos__name__col: 甲基化探针名称所在的列名

func_value__col: DMP结果的组间甲基化差值所在的列名

func_pval__col: DMP结果的p值所在的列名

nested_function: 是否嵌套函数

run_file_path: 甲基化DMP结果的文件路径

run_read_file: 是否要读取文件

run_analysis_type_name: 分析项目名称

run_add__res__dir: 是否要创建res_dir结果目录

run_add_save_file_prefix: 是否要添加结果保存文件的前缀

run_add__parent__dir:是否在上一级目录下创建目录或保存结果

提交

已给定的参数默认值

func_data__type: methylation ;

func_sequence__type: DNA ;

func_gtf__anno__file: E:/data/download/Homo_sapiens.GRCh37.75.genome_anno.csv ; func_gene__list__str: HOXB3;CLDN18 ;

func_gene__col: gene ;

func_pos__col: MAPINFO ;

func_pos__name__col: V1 ;

func_value__col: Diff.Value ;

func_pval__col: P.Value ;

nested_function: TRUE ;

run_file_path: D:/omics_tools/demo_data/methylation/lung_results/myDMP_C_to_T_with_gene_anno.csv ; run_read_file: FALSE ;

run_analysis_type_name: 9.met_lollipot_plot ;

run_add__res__dir: TRUE ;

run_add_save_file_prefix: TRUE ;

run_add__parent__dir: TRUE

窗口截图

运行中的显示信息

执行中,请稍后, 运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

运行完成的显示信息

执行已完成,运行结果保存的目录位置为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot; 分析结果日志保存的路径为: D:/omics_tools/demo_data/methylation\9.met_lollipot_plot\9.met_lollipot_plot_last_final_run_res_log.csv

结果展示

结果文件列表

结果图

差异甲基化DMPs的统计分析条形图可视化

差异甲基化基因的火山图绘制

差异甲基化基因的GO,KEGG和GSEA富集分析

差异甲基化基因的GO和KEGG富集分析

GO富集分析结果图

KEGG富集分析结果图

GSEA富集分析

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容