直线回归与相关

解决上一篇文章留下的小尾巴

在对“校准验证”数据的处理评价中,其实是运用了与检验工作密切关联的统计方法,就是 直线回归。

这也是我们检验人所必须掌握的统计计算方法之一。内容也最枯燥。本篇会忽略大部分的计算公式,讲好原理,计算呢就交给已经做好的excel表格吧,直接填入数据即可。

以下内容大部分来源于王治国等著的《临床检验方法确认与性能验证》。

《卫生统计学》可能真的一点用没有。

直线回归

医学上,变量之间虽然有一定的关联,但这种关系不是十分确定的,这种不确定的关系称为回归关系。

直线回归(linear regression)在于找到一条最能描述变量间非确定数量关系的直线,以 y=a+bx 表示。a 为截距(intercept),b 为斜率,其中 y 是指对应于某个确定的 x ,相应群体的 y 的平均值估计。

回归线的确定主要依据“最小二乘原理”,使估算的 y 值与实测 y 值间的误差达到最小。

误差与可信区间

标准估计误差

直线回归中,各实际值 y 与由回归方程计算出的估计值 y^ 之间的误差,为估计误差(error of estimate )。其中 y^ 决定于均数及回归系数,自由度为 n-2。


标准估计误差

回归系数的标准误

回归方程中,回归系数 (b) 是由样本求出的,它是对总体回归系数 β 的估计值,二者之间的误差可以标准误 Sb 表示。


回归系数的标准误


通过 Sb 便可求出 总体回归系数 β 的可信区间,95%可信区间的计算公式为


总体回归系数的可信区间

式中:t 值的自由度为 上述估计误差的自由度,为 n-2 ,查 t 值表得。

截距 a 误差和总体参数 a 的可信区间

同上,误差计算公式略复杂,可信区间求解方式相同。

以上标准误可运用 Excel 表格中的LINEST功能求得

计算方法具体参见“线性回归”表格文件,感谢不明网友的热心提供。(实际是网上下载的)

分享度盘:链接:https://pan.baidu.com/s/1KvIXlPQUj-X8k25RS7nPcQ 密码:k9i3

回归系数和截距的统计学意义检验

由于抽样误差,从 β =0 的总体(即总体并不存在回归关系)中得到的样本回归系数可能并不等于0 ,因此,求得不等于零的回归系数后,也不能立即认为总体回归系数不等于零。

考虑到抽样误差问题,需要做 β 是否等于零的检验。

回归系数的统计学意义检验,可用 t 检验,也可用方差分析。t 检验较为简单。

计算 t 值      t =  b/ Sb

由自由度= n-2,通过 t 值表作出判断,若求得 t 值> 所查得 t 值,则 P<0.01,拒绝 B=0的假设,回归系数有统计学意义,认为总体中相应两个变量间有直线回归关系。

截距的统计学意义检验同理。

书中还提到比如“两个回归系数差别的统计学意义检验”等,在此不一一阐述(太复杂)。

相关

这个概念在平时工作中用得最多,用错的机会也很多。

相关系数说明两个变量间关系的密切程度,回归方程说明两个变量间的数量关系,两者说明的问题不同,但又是有联系的。

由于相关系数的计算及统计意义检验比较方便,所以我们在作回归分析以前,一般先作相关分析。因为只有在相关有统计意义的前提下,求回归方程及回归线才有意义

强调一点吧,实际工作中可能会用错。

方法比对中,相关系数(r)用于指示所测样本范围是否足够宽,以尽可能降低一些误差(?)的影响,而不是简单说r>0.99便认为方法之间无显著差异。

只有取样范围够宽的情况下,才可通过线性回归的方式进行偏差估计。否则只能通过其他方式进行比对 。

还有,统计方法只是一种工具,只是提供对误差的估计,而不是指示可接受性。这也是Westgard先生所极力倡导的观点。

The statistics don't directly tell you whether the method is acceptable, rather they provide estimates of errors which allow you to judge the acceptability of a method.

统计学不直接告诉你方法能否接受,而是提供误差的估计,由你自己去判断方法的可接受性。

Westgard.com网站提供了很多在线的统计工具,可直接使用,非常方便,自己做表什么的很麻烦的~

总觉得少写了点啥,先就这样吧!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355

推荐阅读更多精彩内容

  • Chapter 9 Linear Regression 本篇是第九章,内容是回归分析(主要以线性回归为主)。回归分...
    G小调的Qing歌阅读 16,749评论 0 25
  • 1. 简述相关分析和回归分析的区别和联系。 回归分析和相关分析都是研究两个或两个以上变量之间关系的方法。 广义上说...
    安也也阅读 8,691评论 0 3
  • 第九章 双变量回归与相关 x2yliner Sys.Date() 知识清单 直线回归相关概念求法统计推断区间估计 ...
    x2yline阅读 1,575评论 0 0
  • 十月份第二次打卡,我读的书是假如给我三天光明。 20页。 我最喜欢的句子是我长着洗得像小鸟世界扑打翅膀那样。
    王昱凯阅读 170评论 0 0
  • 作者:张静如 前段时间有简书里的读者留言问我,怎么写作呢? 思考了很久,我还是没有灵感,写不出来,直到第二次,他再...
    佩盈阅读 860评论 10 15