第1篇
原文:Integrative analysis of gene expression and DNA methylation through one‐class logistic regression machine learning identifies stemness features in medulloblastoma
解读:“肿瘤干细胞”用生信怎么玩
1-干性指数的计算:源于一篇Cell文献(必读)。
2-连续性变量的界值选取:还可以使用‘cutp’ function of the R package ‘survMisc’ (https://cran.r-project.org/web/packages/survMisc) with default parameters.
训练集和验证集的划分,还可以使用‘createDataPartition’ function of the R package ‘caret’ (https://cran.r-project.org/web/packages/caret)【虽然我一般使用人工划分的方式】
3-干性指数与临床分型的相关分析比较简单,两种干性指数与预后的分析(单因素、多因素)。本文预后分析发现,仅SHH型的预后与干性有关,此后的分析都是局限于SHH型中。
4-根据干性指数的高低进行分组,然后筛选DEG,在这些DEG里再寻找与预后有关的基因,然后再使用Cox-LASSO降维得到最终的23基因。这一步的逻辑有点奇怪,筛选到的基因,可以解释为:既与预后有关,也与干性相关的基因。
得到的23基因预后模型,再使用R包的选取界值方法,分成高危组和低危组,得到生存曲线的对比。
5-干性与免疫微环境的相关性分析:这个图可以借鉴。
6-CMap分析来识别新的靶向特征的候选药物。
这篇文献只读了个大体思路和实现流程,但是没有仔细分析思路的合理性、连贯性等细节(好的研究应该是一环扣一环)。有时间回来再辩证读读。