티스토리 뷰
예제
Cattaneo(2010)에 사용되었고, STATA의 예제 파일에 들어가 있는 자료를 이용하여 설명해보자.
여기에서 정책은 임신 중 산모의 흡연 여부이고, 성과지표는 태아의 몸무게이다.
즉, 임신 중 산모가 흡연을 했을 경우 태아의 건강에 어떤 영향을 미치는지 살펴보자.
cattneo2.dta
자료를 불러 들이자.
. use http://www.stata-press.com/data/r15/cattaneo2.dta, clear
(Excerpt from Cattaneo (2010) Journal of Econometrics 155: 138-154)
산모의 임신 중 흡연여부(mbsmoke)에 따라서 태아의 평균 몸무게가 어떤 영향을 받는지 아래와 같이 확인해볼 수 있다.
. tab mbsmoke , summarize(bweight )
| Summary of infant birthweight
1 if mother | (grams)
smoked | Mean Std. Dev. Freq.
------------+------------------------------------
nonsmoker | 3412.9116 570.68711 3,778
smoker | 3137.6597 560.89305 864
------------+------------------------------------
Total | 3361.6799 578.81962 4,642
엄마가 흡연한 경우 3137.7 그램, 엄마가 흡연하지 않은 경우 태아의 몸무게는 3412.9 그램이다.
엄마가 흡연한 경우가 태아의 몸무게가 약 275.3그램 정도 낮다.
이러한 차이가 통계적으로 얼마나 유의한지는 간단한 t-검정을 통해서 확인해볼 수 있다.
. ttest bweight , by(mbsmoke )
Two-sample t test with equal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
nonsmoke | 3,778 3412.912 9.284683 570.6871 3394.708 3431.115
smoker | 864 3137.66 19.08197 560.8931 3100.207 3175.112
---------+--------------------------------------------------------------------
combined | 4,642 3361.68 8.495534 578.8196 3345.025 3378.335
---------+--------------------------------------------------------------------
diff | 275.2519 21.4528 233.1942 317.3096
------------------------------------------------------------------------------
diff = mean(nonsmoke) - mean(smoker) t = 12.8306
Ho: diff = 0 degrees of freedom = 4640
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000
ttest
를 이용해 수행한 검정 결과에 따르면 t-값은 12.8로 두 경우 몸무게가 동일하다는 귀무가설은 쉽게 기각됨을 알 수 있다.
아래와 같이 산포도를 이용해서 산모의 연령과 태아의 몸무게와의 관계를 산모의 흡연 여부별로 그려볼 수 있다.
. tw ///
> (scatter bweight mage if mbsmoke == 0, mcolor(blue%10)) ///
> (scatter bweight mage if mbsmoke == 1, mcolor(red%30)), ///
> legend(order(1 "non-smoker" 2 "smoker"))

먼저 OLS을 이용하여 흡연이 태아의 건강에 어떤 영향을 미치는지 추정해보자.
태아의 몸무게에 영향을 줄 수 있는 통제변수들을 포함하고 나면, 산모의 흡연이 태아에 미치는 효과에 대한 OLS 추정치가 아래에 제시되어 있다.
추정결과에 따르면, 산모가 흡연을 하는 경우 태아의 몸무게가 그렇지 않은 경우보다 217.5그램 정도 작았다.
그리고 그 차이는 통계적으로 매우 유의하였다.
. reg bweight mbsmoke mmarried mage fage medu prenatal1
Source | SS df MS Number of obs = 4,642
-------------+---------------------------------- F(6, 4635) = 45.97
Model | 87323259.4 6 14553876.6 Prob > F = 0.0000
Residual | 1.4676e+09 4,635 316625.885 R-squared = 0.0562
-------------+---------------------------------- Adj R-squared = 0.0549
Total | 1.5549e+09 4,641 335032.156 Root MSE = 562.7
------------------------------------------------------------------------------
bweight | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
mbsmoke | -217.4837 22.04908 -9.86 0.000 -260.7104 -174.2571
mmarried | 151.8161 21.95516 6.91 0.000 108.7735 194.8586
mage | 2.078444 1.917485 1.08 0.278 -1.680739 5.837628
fage | -.209314 1.115846 -0.19 0.851 -2.396903 1.978275
medu | 5.018118 3.743567 1.34 0.180 -2.321055 12.35729
prenatal1 | 46.00335 22.36723 2.06 0.040 2.152928 89.85377
_cons | 3146.009 51.68509 60.87 0.000 3044.682 3247.337
------------------------------------------------------------------------------
이러한 OLS 추정치는 선택편의가 있을 수 있다.
이러한 선택편의를 최소화 하기 위해서 PSME를 이용해 흡연의 위험성을 다시 추정해보자.
. teffects psmatch (bweight) (mbsmoke mmarried mage fage medu prenatal1 )
Treatment-effects estimation Number of obs = 4,642
Estimator : propensity-score matching Matches: requested = 1
Outcome model : matching min = 1
Treatment model: logit max = 16
------------------------------------------------------------------------------
| AI Robust
bweight | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
ATE |
mbsmoke |
(smoker |
vs |
nonsmoker) | -229.4492 25.88746 -8.86 0.000 -280.1877 -178.7107
------------------------------------------------------------------------------
추정결과에 따르면, 흡연 산모의 태아가 비흡연 산모의 태아보다 229.4 그램 작은 것으로 보인다.
흡연의 악영향은 12 그램 정도 더 큰 것으로 보인다.
앞에서 설명했듯이 산모의 흡연 결정 과정을 고려했을 때 흡연의 악영향은 좀 더 큰 것으로 보인다.
즉, 선택편의를 고려하지 않은 OLS 추정치의 경우 과소추정할 수 있다는 것이다.
. teffects overlap, ///
> ptlevel(1) ///
> line1opts(recast(area) fcolor(red%30) lcolor(red%30) lwidth(none)) ///
> line2opts(recast(area) fcolor(green%30) lcolor(green%30) lwidth(none))
> ///
> legend(ring(0) pos(1) col(1))
note: refitting the model using the generate() option

'STATA' 카테고리의 다른 글
천둥번개와 정책효과: 이중추정법 part 2 (0) | 2018.01.06 |
---|---|
천둥번개와 정책효과: 이중차분추정법 part 1 (0) | 2018.01.04 |
도플갱어 PSME: part 2 (추정) (0) | 2018.01.01 |
도플갱어 PSME : Part 1 (개요) (0) | 2018.01.01 |
단층과 정책효과 추정: Part 3(비모수적 추정) (0) | 2017.12.27 |