登录注册写文章

定量建模时，样本量估计

定量建模时，样本量估计

在医学领域建立预测模型时，样本量的估算是一个关键步骤，它直接影响模型的准确性和可靠性。根据搜索结果，以下是一些关键点和建议，用于估算置信度为95%的医学预测模型所需的样本量：

事件数与变量数的关系（EPV）：在模型开发中，一个常用的经验法则是每个预测变量至少需要10个事件（10 EPV规则），这可以确保模型的稳定性和避免过拟合。如果事件发生率低于20%，则每个变量至少需要20个事件。这个原则适用于二分类结局的预测模型，并且应该根据具体情况进行调整。
样本量的精确估计：样本量的准确估计是临床试验可靠性和可重复性的重要保证。在没有具体数据的情况下，可以使用一些在线计算工具来估算样本量，例如 https://www.surveysystem.com/sscalc.htm 或 https://www.calculator.net/sample-size-calculator.html?
Cochran公式：对于比例的样本量估算，可以使用Cochran公式：

image.png

其中，z是根据所需置信水平从z表中得到的z值（例如，95%置信水平对应的z值约为1.96）,P是预期在总体中存在的属性比例，E是误差范围。

有限总体修正：如果总体大小有限，需要使用有限总体修正系数来调整样本量：

image.png

n0是根据Cochran公式计算出的样本量，N 是总体大小。
多步骤估算：Riley等人提出了一种多步骤方法来估算开发临床预测模型所需的样本量，这个方法考虑了模型的预测性能和事件发生率。
专业软件和包：可以使用专业软件如SPSS、MINITAB和SAS等来计算样本量，或者使用R包如pmsampsize来进行更专业的样本量计算。
考虑模型复杂性：如果模型包含多个变量、多分类变量、交互作用或非线性关系，可能需要更多的样本量来确保模型的准确性。
考虑研究目的和资源：样本量的确定还应考虑研究的目的、可用资源、时间和资金限制。

综合以上信息，建立一个医学预测模型时，应首先确定模型的复杂性、预期的事件发生率和所需的预测性能，然后使用适当的公式或工具来估算所需的样本量。在实际操作中，可能需要结合多种方法和工具来确定最合适的样本量。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

R数据分析：临床预测模型的样本量探讨及R实现
文本的大部分内容来自下面的文献： Riley R D, Ensor J, Snell K I E, Harrell...
Codewar阅读 6,280评论 0赞 12
R数据分析：样本量计算的底层逻辑与实操，pwr包
样本量问题真的是好多人的老大难，是很多同学科研入门第一个拦路虎，今天给本科同学改大创标书又遇到这个问题，我想想不止...
Codewar阅读 909评论 0赞 1
定量研究的样本量的定义
样本容量主要由人口规模、置信水平、误差等因素决定。在抽样调查中，样本容量的确定很重要。因为样本容量太大，会造成人力...
顽固的皮球阅读 3,901评论 0赞 1
TCGA学习04：建模预测-cox回归
TCGA学习01：数据下载与整理 - 简书 TCGA学习02：差异分析 - 简书 TCGA学习03：生存分析 ...
小贝学生信阅读 9,707评论 0赞 18
一文搞定深度学习建模预测全流程（Python）
本文详细地梳理及实现了深度学习模型构建及预测的全流程，代码示例基于python及神经网络库keras，通过设计一个...
算法进阶阅读 8,466评论 0赞 42

赞1赞

赞赏

手机看全文