文献信息
标题:Machine learning-based analysis of cancer cell-derived vesicular proteins revealed significant tumor-specificity and predictive potential of extracellular vesicles for cell invasion and proliferation – A meta-analysis
日期及杂志:20 November 2023, Research
作者及单位:Matyas Bukva, Department of Immunology, Albert Szent‑Györgyi Medical School, Faculty of Science and Informatics, University of Szeged, 6726 Szeged, Hungary
文献概述(这篇文献的结论是什么?)
本文是一项探讨细胞外囊泡(EVs)在癌症中作用的meta分析。研究主要集中在两个方面:(1)EV蛋白质组和(2)肿瘤细胞系的侵袭和增殖能力。
研究人员根据整个EV蛋白质组或所有EV样本共享的蛋白质(213个在EV中表达的蛋白),对来自9种不同肿瘤类型的60个细胞系进行了分类。采用多元逻辑回归模型进行分类,然后使用LASSO回归构建鉴别蛋白面板(discriminative protein panel),其中包括172个蛋白,并基于该面板对样品进行重新分类。基于全蛋白质组、共享蛋白和鉴别蛋白面板的分类模型对9种肿瘤类型的区分准确率分别为49.15%、69.10%和91.68%。
使用LASSO回归得到与侵袭和增殖相关的蛋白panel(分别为20,15个蛋白),并进行多元线性回归预测60株细胞株的侵袭能力和增殖能力,R2值分别为0.68和0.62,相关性显著,说明EV携带有关侵袭和增殖能力的信息。
文章亮点(这篇文献的优点在哪?)
- 该研究利用机器学习方法对肿瘤细胞释放的外泌体蛋白质进行了meta分析,探讨了外泌体蛋白质组的特异性以及其作为预测肿瘤细胞侵袭能力和增殖率的工具的潜力
我的疑问(这篇文献的不足在哪?)
本文将数据拆分成训练集和测试集,使用测试集进行测试,引入外部独立测试集进行验证是有必要的
小数据集训练的局限性,可以纳入更大规模的数据集进行训练
和我相关(我从这篇文献里学到了什么?)
- 本文中进行了RNA表达谱和EV表达谱的相似性比较,使用Spearman相关分析,Rv系数作为R2的多元推广,可以描述两个定量矩阵之间的相似性,在0-1之间,值越大表示相关性越强,使用R语言omicade4包(但是在本文中Rv系数并不高)