在上一篇博文整理R实战的广义线性模型中有细讲过逻辑回归,这里借助作业作为一个简单实例做一下相应分析。
数据文件“Drivers.csv”为对45名司机的调查结果,其中四个变量的含义为:
1)x1:表示视力状况,它是一个分类变量,1表示好,0表示有问题;
2)x2:年龄,数值型;
3)x3:驾车教育,它也是一个分类变量,1表示参加过驾车教育,0表示没有;
4)y:一个分类型输出变量,表示去年是否出过事故,1表示出过事故,0表示没有;
问题:
(1) 请在R语言中调用logistic回归函数,计算视力状况、年龄、驾车教育与是否发生事故的logistic回归模型,并以“odds=……”的形式写出回归公式。(10分)
(2) 指出(1)得到的模型中哪些因素对是否发生事故有显著性影响。如果存在对是否发生事故没有显著性影响的因素,请去除这些因素后重新计算logistic回归模型,并以“p=……”的形式写出回归公式。(20分)
(3) A是一名参加过驾车教育,但视力有问题的50岁老司机;B是一名没有参加过驾车教育,但视力良好的20岁新手。现在A、B都想在某保险公司投保,但按公司规定,被保险人必须满足“明年出事故的概率不高于40%”的条件才能予以承保。请预测A、B两者明年出事故的概率,并告诉保险公司谁可以投保。(20分)
处理过程请查看博文:wordpress