随着测序技术的发展,每年测序数据量以PB级增长。随着海量测序数据的增长,越来越多的研究人员开始挖掘公共数据库中的测序数据的意义。已有很多研究表明,某个基因可能参与了某种肿瘤的发生和发展。我们可以使用生物信息学的方法分析基因在肿瘤中参与的生物过程和行使的功能。本文主要介绍单基因生信分析的思路。
一、单基因生信分析能发什么样的SCI
据小编不完全统计,单基因生信分析发表的杂志主要有Molecular Therapy Nucleic Aids、Frontiers in Oncology、Frontiers in Immunology、Aging、International Journal of Molecular Sciences 、EBioMedicine和Journal of Cancer等,影响因子在4-8之间。
二、单基因生信分析内容
单基因生信分析内容主要分为两步,第一步为筛选核心基因,第二步为对核心基因进行深入分析,包括单基因泛癌免疫,WGCNA, 突变拷贝数多组学分析,预后模型等。
筛选核心基因
根据单基因生信分析的文献,小编总结了几种筛选核心基因的方法。分别为基于ESTIMATE算法计算患者免疫打分,基于多数据集差异分析和WGCNA方法筛选核心基因。
第一种:
1. 免疫、基质和ESTIMATE打分与亚型和预后的关系
使用ESTIMATE算法计算肿瘤患者的免疫打分,基质打分和ESTIMATE打分(图1A和1B)。根据免疫打分,将患者分为免疫打分高组和免疫打分低组。Kaplan-Meier曲线分析不同免疫组的预后(图1C)。
Figure 1
2. 免疫微环境相关基因的差异分析,功能富集分析和PPI分析
为了分析免疫打分与基因表达水平的关系,对肿瘤患者的免疫打分高组和免疫打分低组进行差异分析,鉴定DEGs,聚类热图绘制排名前20的上调和下调基因的表达水平(图2A)。对差异表达基因进行GO和KEGG富集分析(图2B和2C)。图2D主要展示GSEA分析结果。
Figure 2
3. 蛋白互作网络鉴定核心基因
使用STRING在线工具和Cytoscape绘制蛋白互作网络。鉴定免疫应答核心基因。
Figure 3
第二种:
1. 筛选多个数据集中共有的差异表达基因
对多个数据集的肿瘤组织和正常组织进行差异分析,鉴定差异表达基因(图4a-4c)。对这些差异表达基因取交集得到共有的差异表达基因以作为候选基因(图4d)。绘制共有的差异表达基因在肿瘤组织和正常组织中表达水平的聚类热图(图4e)。
Figure 4
2. 通过ROC曲线分析和AUC筛选核心基因
对候选基因进行ROC曲线分析并计算AUC,评估候选基因对诊断肿瘤的敏感性和特异性。根据AUC值筛选核心基因(图5a-5d)。AUC值最大的基因可作为核心基因进行下一步分析。通过构建五倍交叉验证的核心基因的ROC曲线和混淆矩阵确定核心基因的预后价值(图5e和5f)。
Figure 5
第三种:
1. 基于WGCNA构建共表达网络
根据肿瘤患者的转录组数据构建共表达网络,并根据模块的保守性和Z-summary打分鉴定关键模块(图6)。
Figure 6
2. 鉴定关键模块中的核心基因
对模块中的hub基因绘制聚类热图并使用Cytoscape软件计算hub基因的连接程度以鉴定核心基因(图7)。
Figure 7
单基因深入分析
参考:****5分+单基因单癌种免疫相关纯生信模版
1. 基因与生存分析和临床病理特征相关性分析
对核心基因进行Kaplan-Meier分析(图8A),研究核心基因与临床病理特征的相关性(图8B-8F)。
Figure 8
2. 针对核心基因与免疫细胞群的相关性分析
为进一步阐肿瘤中核心基因的免疫功能,使用微环境细胞群计数算法计算免疫细胞群的丰度(图9A和9B)。这些结果表明核心基因可能参与调节细胞免疫,而且在不同癌种中的免疫调节模式不同。
Figure 9
3. 诱导免疫反应中核心基因与其他免疫检查点协同作用
为研究肿瘤诱导免疫反应中核心基因与免疫检查点的协同作用,评估核心基因与免疫检查点的相关性(图10A-10D)。
Figure 10
4. 核心基因与特定细胞免疫和炎症反应的相关性
使用GSVA分析研究核心基因与特定免疫及炎症反应的相关性。从7个簇中提取出104个基因并使用GSVA算法定义metagenes。鉴定核心基因在肿瘤中免疫和炎症功能(图11)。
Figure 11
5. 确定免疫调节因子与核心基因的相关性
使用cBioPortal查询与免疫调节因子相关的基因(图12B),对这些基因进行GO和KEGG分析(图12C和12D)。
Figure 12
6. 已知基因与多组学联合分析
基于已知基因的表达水平,将患者分为高表达组和低表达组。结合miRNA,lncRNA或甲基化或数据研究差异分组下的miRNA,lncRNA或甲基化差异水平(图13)。
Figure 13
7. 核心基因相关免疫调节因子对肿瘤的预后作用
为研究核心基因对肿瘤的预后作用,进行单因素多因素Cox回归分析,得到基因的预后特征。并利用lasso回归构建与基因相关的免疫调节因子预后模型,并构建列线图以评估患者预后(Figure14, 15, 16)
Figure 14
Figure 15
Figure 16
8. 实验验证
如果有条件的话,可以使用Western blotting,PCR或者IHC染色检测筛选到的基因表达水平。做到这一步,你的文章已经达到6分标准了,如果加上深入的机制实验,把故事讲好,能发更高的分数,同时也会申请基金课题打下坚实的基础。
Figure 17
参考文献:
【1】Identification of Novel Tumor-Microenvironment-Regulating Factor That Facilitates Tumor Immune Infiltration in Colon Cancer
【2】Identification of AUNIP as a candidate diagnostic and prognostic biomarker for oral squamous cell carcinoma
【3】Construction of co-expression modules related to survival by WGCNA and identification of potential prognostic biomarkers in glioblastoma
【4】Integrated Bioinformatical Analysis Identifies GIMAP4 as an Immune-Related Prognostic Biomarker Associated With Remodeling in Cervical Cancer Tumor Microenvironment
【5】Comprehensive Analysis of the Immune Implication of ACK1 Gene in Non-small Cell Lung Cancer
【6】Application of cAMP-dependent catalytic subunit β(PRKACB) Low Expression in Predicting Worse Overall Survival:A Potential Therapeutic Target for Colorectal Carcinoma
【7】Identification of PGRMC1 as a Candidate oncogene for Head and Neck Cancers and Its Involvement in Metabolic Activites
【8】Molecular and Clinical Characterization of PD-1 in Breast Cancer Using Large-Scale Transcriptome Data
作者:WOSCI沃斯编辑
链接:https://www.jianshu.com/p/247a9ec3f2e0