R语言机器学习算法实战系列(十五)随机森林生存预后模型+SHAP值 (Random Survival Forest + SHAP)

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!

image.png
  1. R语言机器学习算法实战系列(一)XGBoost算法+SHAP值(eXtreme Gradient Boosting)
  2. R语言机器学习算法实战系列(二) SVM算法+重要性得分(Support Vector Machine)
  3. R语言机器学习算法实战系列(三)lightGBM算法+SHAP值(Light Gradient Boosting Machine)
  4. R语言机器学习算法实战系列(四)随机森林算法+SHAP值 (Random Forest)
  5. R语言机器学习算法实战系列(五)GBM算法+SHAP值 (Gradient Boosting Machines)
  6. R语言机器学习算法实战系列(六)K-邻近算法 (K-Nearest Neighbors)
  7. R语言机器学习算法实战系列(七)朴素贝叶斯分类算法 (Naïve Bayes Classifier)
  8. R语言机器学习算法实战系列(八)逻辑回归算法 (logistic regression)
  9. R语言机器学习算法实战系列(九)决策树分类算法 (Decision Trees Classifier)
  10. R语言机器学习算法实战系列(十)自适应提升分类算法 (Adaptive Boosting)
  11. R语言机器学习算法实战系列(十一)MLP分类算法 (Multi-Layer Perceptrons)
  12. R语言机器学习算法实战系列(十二)线性判别分析分类算法 (Linear Discriminant Analysis)
  13. R语言机器学习算法实战系列(十三)随机森林生存分析构建预后模型 (Random Survival Forest)
  14. R语言机器学习算法实战系列(十四): CatBoost分类算法+SHAP值 (categorical data gradient boosting)
  15. R语言机器学习算法实战系列(十五)随机森林生存预后模型+SHAP值 (Random Survival Forest + SHAP)
  16. R语言机器学习算法实战系列(十六)随机森林算法回归模型+SHAP值(Random Forest Regression + SHAP)
  17. R语言机器学习算法实战系列(十七)特征选择之弹性网络回归算法(Elastic Net Regression)
  18. R语言机器学习算法实战系列(十八)特征选择之LASSO算法(Least Absolute Shrinkage and Selection Operator Regression)
  19. R语言机器学习算法实战系列(十九)特征选择之Monte Carlo算法(Monte Carlo Feature Selection)
  20. R语言机器学习算法实战系列(二十)特征选择之Boruta算法

机器学习论文

  1. R语言机器学习论文(一):研究背景
  2. R语言机器学习论文(二):数据准备
  3. R语言机器学习论文(三):特征提取
  4. R语言机器学习论文(四):模型构建
  5. R语言机器学习论文(五):解释模型
  6. R语言机器学习论文(六):总结

介绍

随机森林生存分析(Random Survival Forest,简称RSF)是一种用于处理右删失数据(即生存时间数据)的机器学习方法,它是传统随机森林算法在生存分析领域的扩展。RSF的目标变量是生存时间,它考虑了每个样本的生存时间(T)和删失时间(C),其中删失时间指的是在观察期间内未发生感兴趣事件的时间。RSF框架的核心步骤包括:

  1. 数据重采样:从原始数据中抽取多个bootstrap样本,每个样本平均排除一定比例的数据,称为袋外数据(Out-Of-Bag, OOB)。
  2. 构建生存树:对每个bootstrap样本构建一棵二叉生存树。在树的每个节点上,随机选取一定数量的候选变量,并使用最大化子节点之间生存差异的候选变量进行拆分。
  3. 生长限制:在叶节点不少于一定数量死亡事件的约束下,将树生长到完整大小。
  4. 累积风险函数:对每棵树计算累积风险函数(Cumulative Hazard Function, CHF),得到集成累积风险函数的均值。
  5. 预测误差计算:使用OOB数据,计算集成累积风险函数预测误差。

教程

本文旨在通过R语言实现Random Survival Forest,总共包含:

  1. 加载R包
  2. 案例数据
  3. 数据预处理
  4. 数据描述
  5. 构建randomForestSRC模型
  6. 评估模型
  7. 特征重要性(筛选特征)
  8. 构建新模型
  9. 模型解释SHAP
  10. 保存模型
  11. 总结
  12. 系统信息

更多内容请前往

R语言机器学习算法实战系列(十五)随机森林生存预后模型+SHAP值 (Random Survival Forest + SHAP)

image.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357

推荐阅读更多精彩内容