logistic回归基本理论
一、概念
多重线性回归模型:应变量为区间(定量)变量,且理论上要求其服从正态分布等LINE(线性、独立、正态、等方差)假定条件。
Logistic回归:与多重线性回归类似,区别在于:应变量的类型不同,通过一组预报变量(自变量),采用Logistic回归,可以预测一个分类变量每一类发生的概率。应变量为分类变量,预报变量可以是区间变量、分类变量或区间和分类变量的混合。如果自变量均为区间变量也可以采用判别分析等方法进行分析。
分类变量分为:有序分类变量(即有序多项分类变量)和无序分类变量(也称为名义变量)。无序分类变量分为二项分类变量和无序多项分类变量。
例子:有效和无效(二项分类变量),很不满意、不满意、满意、很满意(有序多项分类变量),索尼、诺基亚、苹果、三星(无序多项分类变量)。