(三)回归检验

 在利用回归模型进行预测时,需要对回归系数、回归方程进行检验,以判定预测模型的合理性和适用性。检验方法有方差分析、相关检验、t检验、F检验。 对于一元回归,相关检验与t检验、F检验的效果是等同的,因此,在一般情况下,通过其中一项检验就可以了。对于多元回归分析,t检验与F检验的作用却有很大的差异。

1.方差分析

通过推导,可以得出:
∑(yi—y-)2=  ∑(yi—yi’)2+∑(yi—y-)2  
其中:
∑(yi’—y-)2=TSS,称为偏差平方和,
反映了n个y值的分散程度,又称总变差。
∑(yi—yi’)2=RSS,称为回归平方和,
反映了x对y线性影响的大小,又称可解释变差。
∑(yi—yi’)2=ESS,称为残差平方和,
根据回归模型的假设条件,ESS是由残差项e造成的,它反映了除x对y的线性影响之外的一切使y变化的因素,其中包括x对y的非线性影响及观察误差。因为它无法用x来解释,故又称未解释变差。
   所以,TSS=RSS+ESS
    其实际意义是总变差等于可解释变差与未解释变差之和。
   在进行检验时,通常先进行方差分析,一方面可以检验在计算上有无错误;另一方面,也可以提供其他检验所需要的基本数据。
   定义可决系数R2, 
R2  =RSS/TSS
R2  的大小表明了y的变化中可以用x来解释的百分比,因此,R2  是评价两个变量之间线性关系强弱的一个指标。可以导出,
R2  = RSS/TSS=∑(yi—yi’)2  /∑(yi—y-)2 
           =1- ESS/ TSS=1-∑(yi—y-)2   /∑(yi—y-)2 

2.相关系数检验

 相关系数是描述两个变量之间的线性相关关系的密切程度的数量指标,用R表示。

R在—1和1之间,
当R=1时,变量x和少完全正相关;
当R=-1时,为完全负相关;
当0<R<1时,为正相关;
当-1<R<0时,为负相关。
当R=0时,变量x和y没有线性关系。
所以,R的绝对值越接近1,表明其线性关系越好;
反之,R的绝对值越接近0,表明其线性关系越不好。
只有当R的绝对值大到一定程度时,才能采用线性回归模型进行预测。在计算出R值后,可以查相关系数检验表(见书附表1)。
在自由度n—2(n为样本个数)和显著性水平a(一般取a=0.05)下,
若R大于临界值,则变量x和y之间的线性关系成立;
否则,两个变量不存在线性关系。

   3.t检验

   即回归系数的显著性检验,以判定预测模型变量x和y之间线性假设是否合理。因为要使用参数t值,故称为t检验。回归常数a是否为0的意义不大,通常只检验参数b。

其中:Sb是参数b的标准差,n为样本个数。
S为回归标准差,
    tb服从t分布,可以通过t分布表(见本书附表2)查得显著性水平为a,自由度为n—2的数值t(a/2,n—2)。与之比较,若tb的绝对值大于t,表明回归系数显著性不为0,参数的t检验通过,说明变量x和y之间线性假设合理。若tb的绝对值小于或等于t,表明回归系数为0的可能性较大,参数的‘检验未通过,回归系数不显著,说明变量x和y之间线性假设不合理。

   4,F检验

   即回归方程的显著性检验。是利用方差分析,检验预测模型的总体线性关系的显著性。

统计量F服从F分布,可以通过F分布表(见书附表3),查找显著性水平为a,自由度为n=1,n=n—2的F值Fa(1,n—2)。
将F与Fa(1,n—2)比较:
若F大于Fa(1,n—2),则回归方程较好地反映了变量x和y之间的线性关系,回归效果显著,方程的F检验通过,意味着预测模型从整体上是适用的;
若F小于或等于Fa(1,n—2),说明回归方程不能很好地反映变量x和y之间的关系,回归效果不显著,方程的F检验未通过,预测模型不能采用。