티스토리 뷰

STATA

도플갱어 PSME: part 3 (예제 2)

비조 2018. 1. 1. 23:45

예제 

Cattaneo(2010)에 사용되었고, STATA의 예제 파일에 들어가 있는 자료를 이용하여 설명해보자.

여기에서 정책은 임신 중 산모의 흡연 여부이고, 성과지표는 태아의 몸무게이다.

즉, 임신 중 산모가 흡연을 했을 경우 태아의 건강에 어떤 영향을 미치는지 살펴보자.


cattneo2.dta자료를 불러 들이자.

. use http://www.stata-press.com/data/r15/cattaneo2.dta, clear
(Excerpt from Cattaneo (2010) Journal of Econometrics 155: 138-154)


산모의 임신 중 흡연여부(mbsmoke)에 따라서 태아의 평균 몸무게가 어떤 영향을 받는지 아래와 같이 확인해볼 수 있다.


. tab mbsmoke , summarize(bweight )

            |    Summary of infant birthweight
1 if mother |               (grams)
     smoked |        Mean   Std. Dev.       Freq.
------------+------------------------------------
  nonsmoker |   3412.9116   570.68711       3,778
     smoker |   3137.6597   560.89305         864
------------+------------------------------------
      Total |   3361.6799   578.81962       4,642


엄마가 흡연한 경우 3137.7 그램, 엄마가 흡연하지 않은 경우 태아의 몸무게는 3412.9 그램이다.

엄마가 흡연한 경우가 태아의 몸무게가 약 275.3그램 정도 낮다.

이러한 차이가 통계적으로 얼마나 유의한지는 간단한 t-검정을 통해서 확인해볼 수 있다.


. ttest bweight , by(mbsmoke )

Two-sample t test with equal variances
------------------------------------------------------------------------------
   Group |     Obs        Mean    Std. Err.   Std. Dev.   [95% Conf. Interval]
---------+--------------------------------------------------------------------
nonsmoke |   3,778    3412.912    9.284683    570.6871    3394.708    3431.115
  smoker |     864     3137.66    19.08197    560.8931    3100.207    3175.112
---------+--------------------------------------------------------------------
combined |   4,642     3361.68    8.495534    578.8196    3345.025    3378.335
---------+--------------------------------------------------------------------
    diff |            275.2519     21.4528                233.1942    317.3096
------------------------------------------------------------------------------
    diff = mean(nonsmoke) - mean(smoker)                          t =  12.8306
Ho: diff = 0                                     degrees of freedom =     4640

    Ha: diff < 0                 Ha: diff != 0                 Ha: diff > 0
 Pr(T < t) = 1.0000         Pr(|T| > |t|) = 0.0000          Pr(T > t) = 0.0000


ttest를 이용해 수행한 검정 결과에 따르면 t-값은 12.8로 두 경우 몸무게가 동일하다는 귀무가설은 쉽게 기각됨을 알 수 있다.


아래와 같이 산포도를 이용해서 산모의 연령과 태아의 몸무게와의 관계를 산모의 흡연 여부별로 그려볼 수 있다.

. tw  ///
>         (scatter bweight mage if mbsmoke == 0, mcolor(blue%10)) ///
>         (scatter bweight mage if mbsmoke == 1, mcolor(red%30)), ///
>         legend(order(1 "non-smoker" 2 "smoker"))


먼저 OLS을 이용하여 흡연이 태아의 건강에 어떤 영향을 미치는지 추정해보자.


태아의 몸무게에 영향을 줄 수 있는 통제변수들을 포함하고 나면, 산모의 흡연이 태아에 미치는 효과에 대한 OLS 추정치가 아래에 제시되어 있다.


추정결과에 따르면, 산모가 흡연을 하는 경우 태아의 몸무게가 그렇지 않은 경우보다 217.5그램 정도 작았다.


그리고 그 차이는 통계적으로 매우 유의하였다.

. reg bweight mbsmoke  mmarried mage fage medu prenatal1 

      Source |       SS           df       MS      Number of obs   =     4,642
-------------+----------------------------------   F(6, 4635)      =     45.97
       Model |  87323259.4         6  14553876.6   Prob > F        =    0.0000
    Residual |  1.4676e+09     4,635  316625.885   R-squared       =    0.0562
-------------+----------------------------------   Adj R-squared   =    0.0549
       Total |  1.5549e+09     4,641  335032.156   Root MSE        =     562.7

------------------------------------------------------------------------------
     bweight |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
     mbsmoke |  -217.4837   22.04908    -9.86   0.000    -260.7104   -174.2571
    mmarried |   151.8161   21.95516     6.91   0.000     108.7735    194.8586
        mage |   2.078444   1.917485     1.08   0.278    -1.680739    5.837628
        fage |   -.209314   1.115846    -0.19   0.851    -2.396903    1.978275
        medu |   5.018118   3.743567     1.34   0.180    -2.321055    12.35729
   prenatal1 |   46.00335   22.36723     2.06   0.040     2.152928    89.85377
       _cons |   3146.009   51.68509    60.87   0.000     3044.682    3247.337
------------------------------------------------------------------------------

이러한 OLS 추정치는 선택편의가 있을 수 있다.


이러한 선택편의를 최소화 하기 위해서 PSME를 이용해 흡연의 위험성을 다시 추정해보자.

. teffects psmatch (bweight) (mbsmoke  mmarried mage fage medu prenatal1 )

Treatment-effects estimation                   Number of obs      =      4,642
Estimator      : propensity-score matching     Matches: requested =          1
Outcome model  : matching                                     min =          1
Treatment model: logit                                        max =         16
------------------------------------------------------------------------------
             |              AI Robust
     bweight |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
ATE          |
     mbsmoke |
    (smoker  |
         vs  |
 nonsmoker)  |  -229.4492   25.88746    -8.86   0.000    -280.1877   -178.7107
------------------------------------------------------------------------------


추정결과에 따르면, 흡연 산모의 태아가 비흡연 산모의 태아보다 229.4 그램 작은 것으로 보인다.

흡연의 악영향은 12 그램 정도 더 큰 것으로 보인다.


앞에서 설명했듯이 산모의 흡연 결정 과정을 고려했을 때 흡연의 악영향은 좀 더 큰 것으로 보인다.

즉, 선택편의를 고려하지 않은 OLS 추정치의 경우 과소추정할 수 있다는 것이다.


. teffects overlap, ///
>         ptlevel(1) ///
>         line1opts(recast(area) fcolor(red%30) lcolor(red%30) lwidth(none))  ///
>         line2opts(recast(area) fcolor(green%30)  lcolor(green%30)  lwidth(none))
>  ///
>         legend(ring(0) pos(1) col(1))
note: refitting the model using the generate() option


공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
글 보관함