一元线性回归方程为什么取均值为零

85次

问题描述:

一元线性回归为什么叫回归

推荐答案

2023-10-24 00:30:25

原因一:为了让估计出的回归系数是无偏估计。

总体参数的估计值必须符合一些好的特性才行,比如无偏性,相合性(一致性),有效性之类的,否则你的估计值就是瞎猜。如果假定误差均值为零,则最小二乘估计出来的回归系数就是无偏的。

一个估计量并不是说无偏就一定好,也可以有偏。如果有偏,只要它和无偏估计量相比较“均方误差”更小,则我们就可以选用有偏的估计量。比如岭回归得到的回归系数就是有偏估计量,但是它比最小二乘得到的回归系数均方误差更小。

如果假定误差期望为零,再加上其它几个假定就能保证回归系数是“最佳线性无偏估计量”,也就意味着最小二乘方法不是瞎猜,是科学的,并且在众多科学的方法中它都是比较好的。

上面是原因一,一般的教科书都会提到。再说另外一个更重要的原因,这个原因几乎没什么书会提到。

原因二:为了让总体回归方程可以被估计。

总体线性回归模型为 y=a+bx+u,a为截距,为了方便,假设只有一个自变量x(其实你可以把这个x当成很多个x),u为误差项。对y求期望有: E(y|x)=E(a+bx|x)+E(u|x)。如果E(u|x)不为零,意味着E(y|x)的值由E(a+bx|x)和E(u|x)决定。假设E(y|x)=6,则E(a+bx|x)=4和E(u|x)=2是一组解,E(a+bx|x)=3和E(u|x)=3也是一组解,...,嗯,也就是回归系数将有无穷解,结果就是总体回归方程无法通过样本去估计,也就是无解(无穷解对于回归方程来说就是无解),这才是最大的问题所在。为了让总体回归方程可以估计,只有假定误差期望为零。

原因二是最重要的原因,附带的带来了“原因一”这个额外好处。

其他答案

2023-10-24 00:30:25

一元线性回归模型误差的均值为零。

因为一元线性回归模型的基本原理是通过一个直线来拟合数据点的分布趋势,因此模型的预测值与实际值之间必然存在误差。

这些误差的和尽可能小是模型优化的目标,而均值为零是因为误差在正值和负值之间的概率是相同的,即对于正负误差值的总和应该是零。

此外,一元线性回归模型也假设误差服从均值为零的正态分布,因此误差的均值也应该是零。

值得延伸的是,如果发现误差的均值不为零,就可能存在模型偏倚的情况,需要进行进一步的分析和调整。

知道问答相关问答

(c)2008-2025 自学教育网 All Rights Reserved 汕头市灵创科技有限公司
粤ICP备2024240640号-6