PK描述性统计表格的输出

在关注药代动力学相关终点的临床试验中，对PK数据的描述性统计分析是必要的。今天说说如何制作PC数据、PP数据的描述性统计分析表格。

下图是一个常见PC浓度描述性统计分析表格的shell。下面，我们根据这张shell来制作表格。

计算以上统计量之前，我们可以首先来了解一下各个统计量的含义及特点。设一组数据，样本量大小为

n

，观测值由小到大依次为

x_1

x_2

,…，

x_n

。则常见统计量相关概念如下表。

以上统计量中，均值、标准差、变异系数、中位数、最大值、最小值我们都可以通过Proc Means、Proc Univariate、Proc Summary、Proc SQL等过程计算出来并输出到数据集中。其中，Proc Univariate还可以输出几何均值。

proc means data=pc noprint;
  by trtan trta atptn atpt;
  var aval;
  output out=stat1 n=n mean=mean std=std cv=cv median=med min=min max=max;
run;

以上代码解释：
proc means 进行描述性统计分析的一个过程步
data= 指定输入数据集
noprint 不在结果查看器窗口输出内容
by 指定分组变量若指定by语句将会输出每组的各项统计量
var 指定描述性统计分析的变量
output 指定输出哪些统计量输出数据集名称

proc univariate data=pc noprint;
  by trtan trta atptn atpt;
  var aval;
  output out=stat2 n=n mean=mean std=std cv=cv median=med min=min max=max geomean=gm;
run;

proc summary data=pc;
  by trtan trta atptn atpt;
  var aval;
  output out=stat3 n=n mean=mean std=std cv=cv median=med min=min max=max;
run;

proc sql;
  create table stat4 as
  select trtan, trta, atptn, atpt, 
         n(aval) as n, 
         mean(aval) as mean, 
         std(aval) as std, 
         cv(aval) as cv, 
         median(aval) as med, 
         min(aval) as min, 
         max(aval) as max from pc group by trtan, trta, atptn, atpt;
quit;

几何均值、几何变异系数我们可以通过以下几种方式输出：

Proc SQL利用计算公式输出

proc sql;
  create table stat as
  select trtan, trta, atptn, atpt, 
  exp(mean(logaval)) as gm, 
  sqrt(exp(std(logaval)**2)-1)*100 as gcv 
  from pc
  group by trtan, trta, atptn, atpt;
quit;

先取对数，再Proc means后公式计算

proc means data=pc noprint;
  by trtan trta atptn atpt;
  var logaval;
  output out=stat_geo mean=gmean std=gstd;
run;
 
data stat_geo1;
  set stat_geo;
  if gmean>.z then gm  = exp(gmean);
  if gstd >.z    then gcv = sqrt(exp(gstd**2)-1)*100;
run;

Proc TTest直接输出

ods output ConfLimits=geostat(rename=(GeomMean=gm cv=gcv));
proc ttest data=pc dist=lognormal;
  by trtan trta atptn atpt;
  var aval;
run;
ods output close;

所有统计量都会计算之后，根据表格的shell，可能还需要一些proc transpose、data步骤将数据集处理成shell的样式，最后再加上proc report，就可以输出这样的表格了。

注意事项：

对于无法计算的统计量，SAS输出的是缺失值，需要填充NA, NE, -, /等等，如果是NA, NE这种还需要加上相应的footnote来说明。
小数位数的保留：
(1) 根据原始数据的最大小数位数来保留。假设原始数据的小数位数为x位，那么min、max保留x位，mean、median、geomean保留x+1位，std保留x+2位，cv gcv正常都是保留1位。通常还会对所有统计量的最大小数位数做一个限制，比如说要求所有统计量小数位数不得超过4位，那么如果原始位数是3位，std就取x+2位和4位中的较小值，即保留4位。
(2) 根据原始数据的有效数字来保留。这个PK数据更为常见，有时候我们从药理部门收到的pc pp原始数据就是保留x位有效数字的数据，这时除了cv、gcv(几何变异系数)之外的的统计量我们都会按照x位有效数字来保留。
(3) 根据统计师或申办方的特殊要求保留。
有0数据时，注意几何均值的正确性
一组数据，如果出现了0，是无法计算几何均值的。这时，带入公式算出来的0是没有意义的。如果数据中有0，proc univariate算出来的geomean=0，但proc ttest是剔除了为0的数据，然后计算出的几何均值，这和我们使用proc sql计算几何均值的结果一样，因为我们利用公式计算时先取对数，0和负数已经被我们剔除掉了。如果这组数据都是0或空，那么proc ttest算出来就是缺失值。通常，我们出表格也是剔除了0后，算出几何均值，而不是只要一组数据有一个0就展示NA。

最后附上输出如上表格的代码

**== PC数据集 ==**;
data pc;
input STUDYID$ SUBJID$ RANDNUM$ TRTA$ TRTAN VISIT$ PCTPTNUM ARELTM PRELTM AVAL;
  if aval>0 then logaval = log(aval);
  atptn  = sum((input(compress(VISIT,,'kd'),best.)-1)*24,PCTPTNUM);
  atpt   = cats(atptn,'h');
datalines;
XY-123  001 A01 A 1 D1  0 0 0 0
XY-123  001 A01 A 1 D1  2 0.0875  0.083333333 50
XY-123  001 A01 A 1 D1  12  0.5 0.5 113
XY-123  001 A01 A 1 D2  . 1 1 200
XY-123  001 A01 A 1 D3  . 2 2 299
XY-123  001 A01 A 1 D8  . 6.979166667 7 266
XY-123  001 A01 A 1 D15 . 14  14  112
XY-123  001 A01 A 1 D22 . 21.04166667 21  65
XY-123  001 A01 A 1 D29 . 28  28  27
XY-123  002 A02 B 2 D1  0 0 0 0
XY-123  002 A02 B 2 D1  2 0.083333333 0.083333333 57
XY-123  002 A02 B 2 D1  12  0.5 0.5 147
XY-123  002 A02 B 2 D2  . 1 1 199
XY-123  002 A02 B 2 D3  . 1.991666667 2 289
XY-123  002 A02 B 2 D8  . 7 7 200
XY-123  002 A02 B 2 D15 . 14.00833333 14  168
XY-123  002 A02 B 2 D22 . 21.08333333 21  78
XY-123  002 A02 B 2 D29 . 28.04166667 28  29
XY-123  003 A03 A 1 D1  0 0 0 1
XY-123  003 A03 A 1 D1  2 0.083333333 0.083333333 58
XY-123  003 A03 A 1 D1  12  0.5 0.5 147
XY-123  003 A03 A 1 D2  . 1.008333333 1 180
XY-123  003 A03 A 1 D3  . 2 2 302
XY-123  003 A03 A 1 D8  . 7 7 234
XY-123  003 A03 A 1 D15 . 14.01666667 14  89
XY-123  003 A03 A 1 D22 . 21  21  49
XY-123  003 A03 A 1 D29 . 28  28  18
XY-123  004 A04 B 2 D1  0 0 0 0
XY-123  004 A04 B 2 D1  2 0.083333333 0.083333333 64
XY-123  004 A04 B 2 D1  12  0.5 0.5 175
XY-123  004 A04 B 2 D2  . 1 1 220
XY-123  004 A04 B 2 D3  . 2 2 302
XY-123  004 A04 B 2 D8  . 6.979166667 7 244
XY-123  004 A04 B 2 D15 . 13.95833333 14  134
XY-123  004 A04 B 2 D22 . 20.98333333 21  99
XY-123  004 A04 B 2 D29 . 28.03333333 28  40
;
run;

**== 计算需要的统计量 ==**;
proc sql;
  create table stat as
  select trtan, trta, atptn, atpt, 
          n(aval) as n, 
          mean(aval) as mean, 
          std(aval) as std, 
          cv(aval) as cv, 
          median(aval) as med, 
          min(aval) as min, 
          max(aval) as max,
          exp(mean(logaval)) as gm, sqrt(exp(std(logaval)**2)-1)*100 as gcv 
      from pc
      group by trtan, trta, atptn, atpt;
quit;

**== 根据数据量级、统计量特点进行小数位数的保留 ==**;
data t_01;
  set stat;
  length stat1 - stat9 $200;
  stat1 = cats(put(n,best.));
  stat2 = cats(put(mean,10.1));
  stat3 = ifc(std=.,'NA',cats(put(std,10.2)));
  stat4 = ifc(cv=.,'NA',cats(put(cv,10.1)));
  stat5 = cats(put(med,10.1));
  stat6 = cats(put(min,best.));
  stat7 = cats(put(max,best.));
  stat8 = ifc(gm=.,'NA',cats(put(gm,10.1)));
  stat9 = ifc(gcv=.,'NA',cats(put(gcv,10.1)));
  label trta = '剂量组' atpt = '采样点' stat1 = '例数' stat2 = '均值' stat3 = '标准差' stat4 = '变异系数(%)'
        stat5= '中位数' stat6 = '最小值' stat7 = '最大值' stat8 = '几何均值' stat9 = '几何变异系数(%)' ;
  keep trtan trta atptn atpt stat:;
run;

**== 输出RTF ==**;
options nonumber nodate orientation=landscape;
footnote;
ods listing close;
title "表格 1 血浆XX浓度 (ng/mL)总结（药代动力学浓度分析集）" ;
ods rtf file = "table_01_pc.rtf" style = tflstyle bodytitle;

proc report data=t_01 split='|' style(header)=[just=c] style(column)=[just=c] missing ;
  columns trtan trta atptn atpt stat1-stat9;
  define trtan  / order order=internal noprint;
  define atptn  / order order=internal noprint;
  define trta   / group   style(column)=[just=l cellwidth=8%]  style(header)=[just=l];
  define atpt   / group   style(column)=[just=l cellwidth=8%]  style(header)=[just=l];
  define stat1  / display style(column)=[cellwidth=6%];
  define stat2  / display style(column)=[cellwidth=7%];
  define stat3  / display style(column)=[cellwidth=9%];
  define stat4  / display style(column)=[cellwidth=9%];
  define stat5  / display style(column)=[cellwidth=9%];
  define stat6  / display style(column)=[cellwidth=9%];
  define stat7  / display style(column)=[cellwidth=9%];
  define stat8  / display style(column)=[cellwidth=11%];
  define stat9  / display style(column)=[cellwidth=13%];

  compute after trta;
    line "" ;
  endcomp;
quit;

ods rtf text="NA:不适用";

ods rtf close;
ods listing;

PK参数描述性统计分析输出的统计量也是这些，就不用多说啦！

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 215,923评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,154评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 161,775评论 0赞 351
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,960评论 1赞 290
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,976评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,972评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,893评论 3赞 416
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,709评论 0赞 271
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,159评论 1赞 308
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,400评论 2赞 331
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,552评论 1赞 346
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,265评论 5赞 341
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,876评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,528评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,701评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,552评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,451评论 2赞 352

PK描述性统计表格的输出

Proc SQL利用计算公式输出

先取对数，再Proc means后公式计算

Proc TTest直接输出

推荐阅读更多精彩内容