16回归方程的验证( 二 )


①(a)图是最为 “健康” 的点图了,没有明显的模式,分部的也比较均匀 。
②(b)图它违背了独立性假设,它的点图表现出一种曲线模式.我们甚至可以稍稍预测一下接下来的误差走向 。而如果残差真的存在独立性,我们应该无法进行这样的预测才对
③(c)图违背了方差为常数的假设,可以看出,其参差的变异性在随着x x x 的值变化,x取值越小,残差越小,x取值越大,残差取值越大 。因此,其变异性非常量,违背了方差为常数的假设 。
④(d)图当然也很明显,单独值得一提的是违背了零均值假设
在检验点图的模式时,要注意防止随机考察模式存在的“罗夏效应()” 。考察点图的零假设是这些假设都完整无缺,只有在点图中能够系统清楚给出的可识别的模式才能作为比较的证据 。
6.总结
除了上述提到的图形化方法外,还有几种可用于评估回归假设有效性的诊断假设测试 。如上所述,AD测试可用于判断残差与正态分布的符合程度 。为评价是否存在违反常数方差的假设,可采用’s test或’s test 。评价是否违背了独立性假设,可采用- test或其他可运行的测试 。(’s test在本博客《08 因子分析(进阶版)》有叙述到 。)
7.获得线性变换
比如,有些变量的关系就不是线性关系,如果用线性回归的话,就会出问题 。比如以下的情况:
可以进行对数表换之后,才好进行熟悉的线性回归 。当然,我们这里介绍的是其中一种方法 。那就是、和Tukey在他们出版的Dataand 一书中建议采用“凸规则”发现获得线性性状的转换方法 。
观察”x down, y down“的第三象限,与上个点图有相同的曲线形状 。对我们的曲线来说,来自凸规则的启发式规则是“xdown,ydown” 。这意味着我们将转换变量x,方法是将x在梯度上的位置降低1个或多个点 。对y也采用同样的方法 。所有未转换变量的当前位置为1 。凸规则建议我们对字母块的频率和点值,要么运用平方根进行转换,要么运用自然对数进行转换,这样就可能会得到两个变量之间存在的线性关系 。