成组贯序分析——alpha消耗函数法

背景

进行一项某项药物临床实验时,实验关注的是药物的正面效果,但是药物也可能会有严重的副作用,如何进行监控呢?
衡量药物是否有效通过假设检验来判断,同理容易想到也可以通过假设检验判断药物的负面作用。但是固定水平检验偷看会增加假阳性,如果提前分析会增加假阳性;如果按照正确流程在实验结束后分析,实验中的志愿者可能已经受到了严重的伤害。
如何完成分析又不增加假阳性呢?医学上的做法叫期中分析,依赖于成组贯序分析,alpha消耗函数是其中一种。

解决思路

如果只是为了控制假阳性,可以将提前比较视为多次比较,使用多重检验方法进行校正。但是实验中数据相关性较强,多重校正会增大假阴性错误,并不合适。
alpha消耗函数的思路是将假阳性错误按照某种方案分配给每次比较,每次比较消耗一定的假阳性配额,合计后刚好等于预设水平

消耗函数

设实验对应时间为[0, T],在这期间我们会得到对应信息[0, I]
观测时间为:0, t_1, t_2, t_3...T
对应信息为:0, i_1, i_2, i_3...I
信息量占比为(t^*):0, t^*_1 = i_1/I, t^*_2 = i_2/I, t^*_3 = i_3/I, ... 1
alpha消耗函数为t^*的函数需要满足:
\alpha(0) = 0
\alpha(1) = \alpha
每次消耗α为:α^*_1 = \alpha(t^*_1) - \alpha(0), α^*_2 = \alpha(t^*_2) - \alpha(t^*_1),...,α^*_n = \alpha(1) - \alpha(t^*_{n - 1})

根据定义可知α^*_1 = \alpha(t^*_1),且\sum \alpha^* = \alpha,符合解决思路中的要求。

如何联系背景问题

假阳性是在实际无效果情况下发现显著。以下仅以单样本单尾为例,根据不等式求解每个时刻的显著边界Z_c:\\t_1:P\{Z(t^*_1) >= Z_c(t^*_1)\}= \alpha(t^*_1)
t_2:P\{Z(t^*_2) >= Z_c(t^*_2) , Z(t^*_1) < Z_c(t^*_1)\} \\= P\{Z_c(t^*_2) | Z(t^*_1) )< Z_c(t^*_1)\} * (1 - \alpha(t^*_1))\\= \alpha(t^*_2) - \alpha(t^*_1)
...
t_n:P\{Z(t^*_n) >= Z_c(t^*_n) , Z(t^*_1) < Z_c(t^*_1),Z(t^*_2) < Z_c(t^*_2)...,Z(t^*_{n -1}) < Z_c(t^*_{n -1})\} \\= P\{Z(t^*_n) >= Z_c(t^*_n) | Z(t^*_1) < Z_c(t^*_1),Z(t^*_2) < Z_c(t^*_2)...,Z(t^*_{n-1}) < Z_c(t^*_{n-1})\} * (1 - \alpha(t^*_{n -1}))\\= \alpha - \alpha(t^*_{n-1})
若检测时大于显著边界{Z_c}则认为显著,接受备择假设。

如何求解{Z_c}

在样本中个体独立同分布的情况下,信息量I为预设总样本量,每次检验的信息量i为已完成检验的个体数量。
求解边界并不容易,仅有第一次检测边界可以直接求出:
t_1:Z_c(t^*_1) = \phi^{-1}(\alpha(t^*_1))
后续边界该如何求解?

随着实验进行,若每次检验新增抽样都比较大,则新抽样样本的均值与和都服从正态分布,累计值的变化过程服从布朗运动,可以通过伊藤积分或蒙特卡洛模拟进行求解,以下为我的蒙特卡洛求解的过程:
1.随机产生N个样本,每个样本有M个标准正态分布抽样的个体,M与N都极大;
2.可直接求得边界Z_c(t^*_1),对每个样本的前 M * t^*_1个体合计计算Z值,不符合条件的样本标记淘汰;
3.计算第二次的alpha控制目标\alpha(t^*_2) - \alpha(t^*_1),对未淘汰的样本的前 M * t^*_2个体合计计算Z值,排序后取对应分位点的Z值近似认为Z_c(t^*_2),同样将小于边界的样本标记淘汰;
4.重复上述过程,直至完成。

通过上述过程,得到了显著边界序列[Z_c(t^*_1), Z_c(t^*_2), Z_c(t^*_3)... Z_c(t^*_n)],可以用作每次检测的边界。

后记

中文网站上关于成组贯序分析的介绍比较少,尤其时alpha消耗函数法更少,以上是阅读相关论文后的个人理解。
本文仅介绍了最简单的情况,且没有详细介绍为何服从布朗运动,详细推导和展开请继续查阅相关英文资料。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,128评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,316评论 3 388
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,737评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,283评论 1 287
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,384评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,458评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,467评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,251评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,688评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,980评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,155评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,818评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,492评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,142评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,382评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,020评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,044评论 2 352

推荐阅读更多精彩内容

  • 上次给大家分享了《2017年最全的excel函数大全12—工程函数(下)》,这次分享给大家兼容性函数(上),如果你...
    幸福的耗子阅读 839评论 0 1
  • 一、描述统计 描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关...
    微秋凌白阅读 1,431评论 0 3
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,518评论 16 22
  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    迷月闪星情阅读 10,561评论 0 11
  • 可爱进取,孤独成精。努力飞翔,天堂翱翔。战争美好,孤独进取。胆大飞翔,成就辉煌。努力进取,遥望,和谐家园。可爱游走...
    赵原野阅读 2,724评论 1 1