刘军连预约 http://m.39.net/news/a_9276668.html
前言
上一期的推文我们讲解了二元Logistic回归,二元是针对结果变量y而言的,讲解了两种:二项Logistic回归中因变量为二分类变量或多项有序、二项Logistic回归中因变量为多项无序。本期的推文我们讲解多项Logistic回归,即结果变量y是多分类有序或多分类无序的和有序Logistic回归。
多项Logistic回归
我们先讲解多项Logistic回归,即结果变量y是多分类有序或多分类无序的。我们讲个实例:35数据库,结果变量y是产后大出血情况,有三种分类,为多项无序:y=0:正常组。y=1:宫缩乏力性产后大出血;y=2:胎盘因素产后大出血。x即有无妊高症,是二分类的。我们打开35数据库:
首先加权,加权后,点分析—回归—多元Logistic:
将y放入“因变量”,x放入“因子”,然后点击参考类别:
我们需要把正常组作为参考,因此勾选第一个类别,因为正常组为第一个类别,这样勾选就能将正常组作为对照,点击确定回到上框,点击“保存”:
勾选“预测类别”和“预测类别概率”,点击继续,回到上框,其余均保持默认即可,点击确定,得出结果:
依然可以用“-2对数似然”和“伪R方”对模型好坏进行判断,后面用似然比检验得出P=0.<0.05,说明模型是有意义的。重点看模型解读:
这样我们就得出两个模型,子宫因素logitP1/0=-1.+0.x,胎盘因素logitP2/0=-3.+1.x,根据EXP(B)可以看到有妊高症发生子宫因素大出血是无妊高症的2.倍,有妊高症发生胎盘因素大出血是无妊高症的5.倍,但是有妊高症发生胎盘因素大出血的风险是子宫因素大出血是多少倍呢?是5.除2.吗?不是的。而是logitP2/0-logitP1/0=logitP2/1=-1.66+0.x,此时的EXP(B)=2.43倍。这样他们三组的关系就这么呈现出来了。
有序Logistic回归
有序Logistic回归顾名思义就是指y是等级资料,我们讲解个实例,37数据库中,研究父母文化程度与子女智商之间的关系。结果变量y是智商等级程度,分为四类:中下(y=1)、中等(y=2)、中上(y=3)、上等(y=4),x变量表示父母学历。我们打开37数据库:
同样的第一步需要加权,加权后点分析—回归—有序:
将y放入“因变量”,x放入“因子”,点击“输出”:
勾选“平行线检验”,这是有序Logistic回归的一个特别之处,右边可勾选“预测类别”和“预测类别概率”进行预测。点击继续,回到上框,其余均保持默认,点击确定,得出结果:
该信息解读同前。
此处我们可以看到建立了三个模型,阈值即常数项,第一个模型是LogitP(y=1)=-4.-2.x1-2.x2-1.x3。第二个模型是LogitP(y=2)=-1.-2.x1-2.x2-1.x3。第三个模型是LogitP(y=3)=0.-2.x1-2.x2-1.x3。此处我们可以看到,三个模型的系数是一样的,只是常数项不同,这就是等级资料的回归模型特点,因为它是要一级一级得往上递增的。
我们看到下面的平行性检验,看到P值=0.>0.05,说明与平行线是无差异,说明符合平行线检验,说明是符合等级资料的。若该处不符合平行性检验,我们就应该重新选择多项无序Logistic回归。
小结
Logistic回归的主要用途主要有三个
1.发现风险因素
2.进行预测,即基于现有的来对未知的进行预测
3.进行判别,即给一个标准让你建模,再对一个未知的数据进行判别。
以上就是多项Logistic回归和有序Logistic回归在SPSS中的操作与结果解读。本期推文中提到的35、37数据附在链接中,敬请大家点击下方“阅读原文”并在