文章目录
一、线性回归假设条件(LINE)二、 残差分析1. 线性检验2. 正态性检验3. 独立性检验4. 方差齐性检验5.其他残差图一、线性回归假设条件(LINE)
线性(Linear)自变量与因变量之间存在线性关系正态性(Normal)
残差 ϵ \epsilon ϵ 服从正态分布N(0, σ 2 \sigma^2 σ2) 。其方差 σ 2 \sigma^2 σ2 = var ( ϵ i \epsilon_i ϵi ) 反映了回归模型的精度, σ 2 \sigma^2 σ2 越小,用所得到回归模型预测y的精确度愈高独立性(Independence)
任意两个观测残差的协方差为0 ,也就是要求自变量间不存在多重共线性问题方差齐性(Equal Variance)
在给定x的情况下, ϵ \epsilon ϵ 的条件方差为常数 σ 2 \sigma^2 σ2
二、 残差分析
1. 线性检验
相较于图一(残差随机分布),图二的残差明显呈现了某种二次型趋势,说明回归模型没有抓住数据的某些非线性特征
2. 正态性检验
通过直方图和QQ-plot进行检验
3. 独立性检验
如下图,若残差图是曲线的的,则表明违反了独立性假设
4. 方差齐性检验
由于不满足回归分析中的方差齐性的前提假设,异方差将可能带来以下几个问题:
对使用最小二乘法(OLS)求解参数时 ,参数估计值虽然无偏,但不是最小方差线性无偏估计参数显著性检验失效回归方程的应用效果不理想
造成异方差的原因:
模型缺少了某些解释变量,缺省变量本身的方差被包含在了随机误差的方差中模型本身选取有误,比如原来是非线性的,结果使用了线性模型样本量过少、测量误差、异常数据、时序分析或者使用面板数据等
异方差检验
坐标选择:纵坐标为残差 e i e_{i} ei,横坐标视情况而定,可选择: x , y ^ x,\hat{y} x,y^或者观测时间或序号判断:散点随机散布、无规律则表明满足基本假设,有明显规律或者呈现一定趋势,则有异方差性