2.為什麽叫控制變量?試想這樣壹個場景,要解釋參加補習班和學習成績的關系,不能只找兩個人看他們是否參加補習班和學習成績。通過對比,我們發現上補習班的同學學習成績更好,所以上補習班和學習成績是正相關的。這裏有很多不可控的因素,比如上了補習班的那個學生學習成績更好,在家學習時間更長,上課更專心等等。所以,如果妳想知道補習班和學習成績的關系,妳需要找到至少兩個在其他方面相同或高度相似的同學,比如最初的學習成績,在家學習的時間長短,學習習慣等。這些因素都是壹樣的,然後對比自己是否上補習班,才能得出正確的結論。這裏,最初的學習成績、在家學習的時間長短和學習習慣是控制變量。我們對這些變量本身不感興趣。之所以把它們放入回歸方程,主要是為了“控制”對被解釋變量有影響的缺失因素,避免缺失變量出現偏差,所以這些次要變量稱為控制變量。控制變量是如何“控制”的,有壹個很好的答案。
控制變量是如何被“控制”的?