医学临床试验文献统计方法解读(我们需要多少样本)

三、分析试验需要多少样本数据的思路框架

在所有的研究开始之前,我们都面临这么一个决策。

多少数据才算够?

显然,我们做研究的资源(人力、物力、财力和时间等)都是有限的,如果我们想要研究的问题需要的数据量远远超出我们的能力范围,那么我们就面对着一个残酷的现实:
这个研究还没有开始,就已经注定失败了

所以,研究前要对所需的数据量作尽可能准确的估计。

(一)要解决问题:

文献中的确定样本统计量的方法如下:“统计功效分析:从我们之前的研究得出,内源性骨质增加的不同分组间的平均值差异为0.8毫米,每一个组别的标准差为1毫米。当我们定义检测此差异的显著性水平为0.05,统计功效为0.8时,每一个研究组所需的被试数量至少为20个。
所以,我们需要找到找到文献中利用统计功效分析计算出所需样本量的方法。

(二)涉及的基本统计概念

p值、显著性水平、统计功效、统计效应等概念相互关联。

p值、显著性水平α

1.p 值定义:p值是在假定原假设为真时,得到与样本相同或者更极端的结果的概率。

与样本相同或者更极端的概率,可以想象正态分布的钟形曲线,p值代表的是包含样本值及其右侧的尾部区域(意为更极端结果)累计概率值(如为双侧检验,则包括左、右两侧的尾部区域)。

2.显著性水平α定义:试验中我们要选定一个假设为原假设,另一个作为备择假设。当原假设为真时而拒绝原假设的事件成为类型1错误,发生这种错误的概率称为检验的显著性水平(significance level).

拒绝原假设的检验统计量的值集称为拒绝域,接受原假设的值域称为接受域。

(1)统计上的显著性:

  • 在实践中,以原假设的分布来构造检验。
  • 显著性水平α通常选择较小的数值,如0.01或0.05.
  • 当样本值,即检验统计量,落在拒绝域中,即发生了概率低于0.05的小概率事件(对应的p值小于0.05),从而反证原假设不成立,更合理的解释是备择假设成立。上面的推理过程称为“统计上的显著性”。
  • 而当样本值落在接受域,对应的p值大于0.05,则样本之间的差异仍在原假设分布内含随机性的合理范围之内,根据检验统计量不能拒绝原假设。

3.案例

案例请读博客文章:
[你真的懂p值吗](https://www.afenxi.com/23239.html

统计功效

定义:当原假设为假时,接受原假设的事件为类型2错误,其概率通常记为β。而当原假设为假时拒绝原假设的概率称为统计功效(statistical power),为1-β。β的值一般设定为0.2.

统计功效指的就是:如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。也就是不犯第二类错误的概率。

统计效应

统计效应是我们做试验要测量的试验组和控制组之间差异的大小。它是一个抽象的概念,它在数学上到底是什么形式取决于具体的统计测试。

  • 相关分析的效应大小是相关系数
  • t检验的效应大小是均值差与标准差的比值
  • 卡方检验的效应大小是OR值(比值比)

效应越大,就越容易在研究中表现出来,亦即所需要的数据量越小,反之亦然。

(三)利用功效分析测算样本所需统计量的方法

基本原理

统计学家证明,统计功效(1-β)由这些因素决定:标准化的统计效应大小(ES)、样本量(N)、显著性水平。
这四个量只要知道其中任意三个,就能求出剩下的一个。因此,如果需要在开展研究之前估计所需的样本量N,只需知道显著性水平、1-β和ES,剩下的事情交给计算机软件就可以完成了(如SAS、SPSS、R等都有利用功效分析来估计数据量的模块)。
而,显著性水平、统计功效一般都设定好了。

难点在于标准化的统计效应大小

真实的效应大小在某种意义上说我们是永远无法知晓的,即使经过了大量研究,我们也只能不断接近真相。而在功效分析估计数据量时,我们连研究都还没开始做呢,那怎么估计呢?
最常用的估计效应大小的方法有两种:

  1. 先使用少量受试者或样本进行试点研究,用获得的结果作为功效分析中的效应大小的值。这是最直接的估计效应大小的方法。容易想到,试点研究的样本量越大,研究设计与将来要进行的实验越接近,对效应大小的估计就会越准确。
  2. 如果由于条件限制,无法进行试点研究,我们可以采取“旁敲侧击”的方式——对与计划进行的研究话题、方向、对象相近的已发表的研究进行全面细致的回顾,合理推算将要进行的研究可能获得的效应大小。
    毫无疑问,这种方式有一个软肋:已有的研究不可能与我们将要进行的研究完全相同,因此难免会有无法精确控制的偏差;而且,到底哪些研究算“相近”,存在着相当多的模糊性。但是利用相近研究估计效应大小往往能够综合来自大量样本的结果,比起试点研究又有着独特的优势。近年来,利用规范、系统化的检索标准和严格定量的统计学方法对大量已发表研究的结果进行整合的“荟萃分析”(meta-analysis,又译为“元分析”、“整合分析”等)得到了越来越广泛的应用,它能够为功效分析提供更准确、更可靠的效应大小估计。

(四)扩展阅读

  1. 本章思路的主要来源:说人话的统计学:做统计,多少数据才算够?
  2. 医学统计学与 SPSS 软件(基础篇)-COURSERA
  3. 功效分析-知乎
  4. 5分钟统计学:015假设检验、019测量效应与检验效能--来自喜马拉雅听音频节目。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352

推荐阅读更多精彩内容