医学统计学是每个医学生的必修课,学完以后虽然考过了,但是扪心自问又学会了么?以前我知道自己不懂,但是觉得也没什么影响,毕竟我们有SPSS这个软件,把数据整理好,放进去,点几个按钮,TADA~,搞定。
说实话,能够把一堆乱糟糟的数据整理好,送进SPSS,知道点哪几个按钮,已经可以让你位于统计水平排行榜中位以上的水平了。我以前也一直觉得自己应该不需要学得多深入了。直到我接了一门叫做护理研究的课程,我发现好像自己对统计的了解完全不够。
一般我们会说,t检验(一种比较样本均值的统计方法)的一个先决条件是总体的正态分布假定。也就是说,如果我现在手头上有关于上次考试成绩x的一组样本,样本量是n,那如果要用t检验去对x做假设检验,首先要保证在总体这个层面上,x是符合正态分布的。那这就有点让人犯难了,我又怎么知道它符不符合呢?
那天刚好是学生作汇报,提到了他们问卷评分准备用t检验。毕竟就算是没有分组的横断面调查,总还是可以拿一个来对比的嘛,这个时候t值无非就是
但是他那个问卷就只有5道题,每题也就是0到5分,然后排序还tm是乱的!
我觉得他这种总分用来做t检验好像不是很妥当的感觉,这位同学和其他老师则说,一个问卷的得分应该是可以作t检验的。于是我上网找答案,之后我发现,虽然众说纷纭但是好像没有太合适的答案呀。
关于t检验的事情我们后面会再说,但是这里我主要是想说,虽然医学统计学的内容并不多,但是要学透,还是需要花点时间的。而比较糟糕的情况是,适合用来学习的材料,却不是那么随手可得。
实际上从本科到研究生,医学统计学的教材只是多了一些新的统计方法,但是统计的基础,研究生教材觉得本科教材已经讲了,本科教材觉得这些太深了应该以后学,或者说,不用学。于是统计学了这么多年,很多人连样本量都不会算。
从18年开始,因为要上SPSS软件操作实验课,所以我花了一些功夫补课。更重要的是,刚好找到了一本不错的教材:数理统计初级教程(英文名 statistic: an intuitive approach,作者是GH维恩堡)。如果还没有读过这本教材,而你又对医学统计学感到有些无所适从,那你可以首先从阅读这本教材开始。
这个文集主要是准备放一些我的授课笔记,希望能够对其他人有用。当然医学统计学的课本还是需要看的,那个才是根本,我这里的,只能作为茶余饭后的一点茶点,有些晦涩,但是也会让你的知识更加多彩。希望你能够喜欢。
计划中的内容组成
- 平均值,标准差,期望
- 频数表,直方图,概率分布曲线
- 粗浅的讲讲中值极限定理
- 正态分布,I和II类错误,假设检验
- 总体方差的估计,单样本t检验,2独立样本t检验
- 方差分析
- 二项分布,二项分布的正态近似
- 泊松分布
- 连续变量和二分类变量的样本量估计
- 卡方检验和非参数检验
- 线性相关和单变量线性回归
更多的内容鉴于自己才疏学浅还需要多做准备,暂时不好做计划。上面的这些我会尽量找时间逐个写出来。简书这个平台支持markdown的math公式,这真的好方便,所以估计也只会在这里写了。
我所学到的,都是从医学统计学教材,数理统计初级教程,还有互联网上浩如烟海的材料中学到的东西。所以,如果你想转载我的内容,我很欢迎。但是正如我在引用别人的材料时必然会注明出处一样,也希望你务必在转载的时候注明出处。