首页 > 其他 > 详细

统计学之多元线性回归分析

时间:2015-10-23 21:31:53      阅读:542      评论:0      收藏:0      [点我收藏+]

作者:解螺旋.算盘 解螺旋原创

不懂地方:

1.前进法,后退法和逐步法stepwise

 

 

  上回我们谈到了研究2组资料是否相互联系的统计学方法。但是,如果自变量多于1个的情况下怎么办?我们还是用上回那个例子,但是增加了一组自变量。现在,我们有12名一年级女大学生体重,身高与肺活量的数据。

  技术分享

  如果我们想要研究:肺活量是否随体重和身高的变化而变化?体重和身高,哪个指标对肺活量的影响更大?这里就要用到统计学上另一种重要的统计方法:多元线性回归分析。多元线性回归分析就是研究一个因变量(这里是:肺活量)和多个自变量(这里是:体重和身高)之间的关系。

  和上回介绍的一元线性回归方程差不多,多元线性回归方程只是增加了一个自变量而已:?=a+b1x1+ b2x2。 x1和x2为2个自变量,y为因变量。在上面这个例子中,身高是x1;体重是x2;而肺活量就是y。如果通过计算,得出a=-0.5657;b1=0.005017;b2= 0.05406。那么这个方程就可以写作:?=-0.5657+0.005017x1+ 0.05406x2。

  b1=0.005017,表示在X2,即体重不变的情况下,身高每增加1cm,肺活量增加0.005017L。利用多元线性回归方程,还可以进行预测和预报。例如x1 =166,x2=46,代入公式,就可以得出?=2.75。这表示:所有身高为166 cm,体重为46公斤的一年级女大学生,估计的平均肺活量为2.75 L。

  那么,现在问题变得简单了,我们只需要算出a和b即可得到方程式。聪明的同学们可能已经猜到我下面要说什么了。对头!那就是 ─ 计算机。现在的大部分统计学软件都可以做多元线性回归分析了。以最常用的SPSS为例,输出的结果如下图所示:

  技术分享

  我们需要注意的就是红圈标注的三个数字,它们就是a,b1和b2。另外,如果要判断几个自变量谁对因变量的影响更大,就看的标准系数。就是图中蓝圈标注的二个数字。在这里,显然身高对肺活量的影响更大。

  另外,在多元线性回归中还存在一个自变量选择的问题。这是因为:不是所有的自变量都对因变量有意义。例如,我们在上一个例子中再引入一组血压的数据,这个血压就很有可能和肺活量完全风马牛不相及。自变量选择的方法有前进法,后退法和逐步法一般采用逐步法就可以取得满意的结果。而这一切的一切,计算机都是可以代劳的。下图所示的就是SPSS进行逐步法的界面,在红圈标注的下拉菜单里选择stepwise(逐步法)即可

  技术分享

  输出的结果会自动告诉你哪些自变量被包括了;哪些自变量被排除了。怎么样?简单吧?算盘一直认为:对于我们临床医生来说,并不需要掌握复杂艰深的统计学概念和公式。我们只需要掌握在正确的地方,输入正确的数字,当结果输出的时候,能看懂结果。就OK了。

 

程序运行结果不一致

技术分享

统计学之多元线性回归分析

原文:http://www.cnblogs.com/biopy/p/4905667.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!