我们目前已经完成了,把原始的单细胞测序数据,整理成一个结构清晰的 Seurat 对象,但这并不意味着可以直接进行下游分析。 在进行标准分析流程(...
朋友们好,我是小简,从今天开始,我准备陆续分享一些单细胞分析的内容。当然这些内容不是“金标准”,更多是我在实际分析过程中的一些整理和总结,大家可...
我们依次分享了 随机森林、GBDT、XGBoost 这些基于树的集成模型,它们在处理大规模数据时,往往表现出了极强的预测能力和泛化性能。 但是在...
在上一讲中,分享了梯度提升树(GBDT)。GBDT 通过残差拟合和梯度下降的方式,不断叠加弱分类器,从而逐步逼近目标函数,是一种性能非常强大的集...
之前分享了随机森林(Random Forest)。随机森林通过 Bagging 思想,将大量决策树并行训练,再通过投票或平均的方式集成结果,从而...
之前陆续分享了逻辑回归、岭回归、LASSO 回归以及弹性网络回归,这些模型大多属于线性方法。它们在解释性和计算效率上有优势,但当面对高维、非线性...
机器学习02 | LASSO 回归[https://mp.weixin.qq.com/s?__biz=Mzk5MDYwOTg1NA==&mid=...
在生信分析任务中,我们常常面临这样的问题: 给定一组样本的基因表达信息,能否预测它们属于疾病组还是对照组? 这种问题,本质上就是一个典型的二分类...
因为后续想分享机器学习的内容,所以先写一个序章,理一下机器学习在生信分析中的应用,后续内容会结合生信数据,分享常见模型的原理与应用案例。 机器学...