想要多做几篇纤维肌痛的前期基础,就开始学习别人的文章思路啦
IF5.5,题目真的好长,而且作者来自四个附属,同期还有类似papers online
主要是学习文章思路啦
背景略去,直接攻向材料方法偶哟
1. search strategy and inclusion criteria
分别从CEO和AE挖掘涉及PaCa病人的miRNA表达数据,对照哦包括良性胰腺疾病或者健康人,不足20个样本的排除,最终从561个GEO,62AE中只剩10个转录组用于分析。
2. data extraction and procesing
数据预处理:分位数标准化(具体可以参考statquest-Josh Starmer)或对数转换,并根据平台注释信息,将ID转换为通用名,得到表达矩阵,并分组。用pROC package计算最佳阈值,构建2*2列联表,得到每个miRNA二的FP,FN,TP,TN(?自我感觉这是关键一步)
3. diagnostic value assessment for miRNA
基于双变量(线性)随机回归模型,计算敏感性,特异性,标准误,95%CI,诊断比值比,阳性/阴性似然比,并画出ROC曲线,计算AUC,95%CI。在9个转录组中均有的miRNA作为分析数据,并根据AUC排序,筛选出TOP50。
metaregression探究基于Higgin's I^2 (I^2>50%)以评估异质性。
4.validating the prognostic significance of miRNA with TCGA data
从TCGA提取PaCa病人的miRNA表达和临床数据,经过Log2转换后得到的表达高低分为三组,即为高中低表达组,比较三组的K-M生存曲线,应用多变量Cox回归模型以验证哪些miRNA是总生存率,风险比率的独立文献因子。
5. pathway analysis of miRNA
首先使用miRWalk2.0预测miRNA的靶向基因集(p<.01),而后提取TCGA中mRNA表达,并于miRNA的表达变化进行Pearson 相关分析(P<.05),选取负相关(因为2者是负向调控,这就涉及到2者的作用机制啦,可以趁机补课啦)。miRNA-mRNA对子扔进cytoscape构建调控网络,并对靶向基因进行GO,KEGG enrichment analysis。
6. statistical analysis
general package for meta-analysis package。
数据处理细节
- 筛选出的TOP50 miRNA用TCGA数据验证,发现在癌症表达升高或降低(可能过高/低表达,但是是癌症的原因还是结果,不明确,相关不代表因果),5个与生存相关(可能促进/抑制癌症进展);
2.选择很重哟啊,作者选择在癌症组织中过表达的9个miRNA,一并作为后续分析,不多不少;
3.配对mRNA,mRNA的方法可以是通过数据库,找出miRNA的靶向基因,再与表达变化负相关的mRNA取交集,就可以得到miRNA-mRNA pairs啦。