作业帮 > 语文 > 作业

一元回归方程和多元回归方程中同一自变量的回归系数正负号不一致是正常的吗?

来源:学生作业帮 编辑:神马作文网作业帮 分类:语文作业 时间:2024/11/19 17:53:54
一元回归方程和多元回归方程中同一自变量的回归系数正负号不一致是正常的吗?
我觉得不应该出现这种情况啊,若为正就应该始终为正,为负就应该始终为负.虽然大小可能会有所不同.
一元回归方程和多元回归方程中同一自变量的回归系数正负号不一致是正常的吗?
不一定正常,但是有的时候我们的确会遇到这种情况,这可能意味着我们新加入的其他解释变量可以作为原来解释变量的“渠道变量”;或者是你的过去的回归漏掉了重要的其他解释变量.
这么说可能比较晦涩,我举两个例子,都是我实际遇到或者在课本上看到的:
(1)这个例子是CHARLS数据的例子,在研究CHARLS数据的过程里,研究者发现“女性记忆词汇的数目少于男性”(一元回归,对性别和记忆词汇的数目,记忆词汇的数目是一个在实际调查里做的测试的结果),也就是说,在关于“记忆词汇”的回归里,“性别是女性”这个虚拟变量前面的系数是负的.但是控制教育变量后(多元回归,再加入教育变量),却发现“性别是女性”这项前面的系数变成正的了,这意味着“在同样的教育条件下,女性的记忆力更强“,而第一个一元回归之所以会得出女性的记忆数目少(系数负)的结论,是因为中国平均而言,女性的受教育程度低.也就是说,我们的第一个回归漏掉了重要的解释变量教育……或者说,教育是解释”为什么女性记忆词汇少“这个问题的”渠道变量“.
具体地说,一元回归和多元回归都不是错误的结论,而是讲述的不同的故事,一元回归是说”平均而言女性记得少“,多元回归是说”同样教育下女性记得多“,两者不矛盾!而且得出了不同的结论反而更好,因为你找到了”为什么一元回归会得出那样的结论“的原因.
(2)这个例子是伍德里奇课本上的经典案例:在一个研究犯罪率的研究里,研究者让犯罪率和失业率进行回归,一般正常来说,失业率越高犯罪率应该越高,因为失去工作的人更可能参与抢劫、偷窃等犯罪活动,但是这个研究的一元回归发现,失业率前面的系数是负的!后来这个研究者加入了一个控制变量——五年前相应地区的失业率(这是一种计量控制方法,相当于控制了很多没有加入的变量,你可以理解为是加入了一个”文化传统、社会结构“这样类型的变量),控制了其他因素后,系数变成正的了.
这个例子是说,你可能是在一元回归里忽略了很多重要变量.一元回归的结果是可能是错误的.
为什么会有这样的效应呢?这是因为如果遗漏了重要变量,回归的结果会有偏误:真正的X1的系数B1会偏误为(如果我们假设X2是被遗漏的变量),B1(有偏)=B1(无偏)+B2*L12 .其中L12是X1、X2的相关系数,B2是X2的无偏系数,如果B2*L12很大的话,可能会改变B1(有偏)的方向.例如例子1里,B1(无偏)是正的(女性记忆力好),B2是正的(教育多,记忆力好),L12是负的(女性教育相对男性少),由于B2*L12的绝对值很大,导致了B1(有偏)变成负的了.