삼중차분추정법 이중차분법으로 추정한 추정치가 진정한 정책효과가 아닐 수도 있다. 정책이 없었어도 두 그룹간의 차이가 발생할 수 있는 경우가 있을 수도 있다. 예컨대 다른 요인들이 처리군과 통제군에 서로 다른 영향을 경우, 이중차분 추정법을 이용하면 마치 정책이 효과가 있는 것처럼 추정되었을 경우가 있다. 이런 경우 이중차분 추정치가 강건한지 확인해볼 필요가 있다. 강건성 확인을 위해서 정책과 상관없는 그룹에 대해서 이중차분 추정을 해보는 수가 있다. 이 경우에 추정된 정책효과는 정책과 무관하게 처리군과 통제군 사이의 차이로 볼 수 있다. 만약, 이렇게 구해진 이중차분 추정치가 0이라면 큰 문제가 없겠지만, 그렇지 않다면 좀 더 살펴볼 필요가 있다. 삼중차분추정법은 두 이중차분 추정치를 다시 차분하는 것이..
이중차분추정 환경의 변화가 이른바 준실험적(quasi-experimental) 혹은 자연실험(natural experimental)적 환경이 발생할 수 있다. 정책평가의 경우에는 준실험적 상황을 자주 사용하게 된다. 특히, 우리나라의 경우에는 정치적인 이유로 정책이 느닷없이 시행되는 경우가 많기 때문에 의도치 않은 준실험적 환경이 주어지는 경우가 많다. 학술적 연구에서도 정책효과를 식별하기 위해 준자연적 상황을 자주 사용하게 된다. 이중차분추정을 이용한 대표적인 연구는 Card & Krueger(1994, 이하 CK)의 연구이다. CK는 최저임금이 실업에 미치는 효과를 추정하였다. CK는 뉴저지주의 최저임금이 4.25 에서 5.05로 199년 4월 1일을 전후하여 상승한 점에 초점을 맞추었다. CK는 1..
예제 Cattaneo(2010)에 사용되었고, STATA의 예제 파일에 들어가 있는 자료를 이용하여 설명해보자. 여기에서 정책은 임신 중 산모의 흡연 여부이고, 성과지표는 태아의 몸무게이다. 즉, 임신 중 산모가 흡연을 했을 경우 태아의 건강에 어떤 영향을 미치는지 살펴보자. cattneo2.dta자료를 불러 들이자. . use http://www.stata-press.com/data/r15/cattaneo2.dta, clear (Excerpt from Cattaneo (2010) Journal of Econometrics 155: 138-154) 산모의 임신 중 흡연여부(mbsmoke)에 따라서 태아의 평균 몸무게가 어떤 영향을 받는지 아래와 같이 확인해볼 수 있다. . tab mbsmoke , sum..
추정 매칭은 처리군에 속해 있는 사람과 동일한 사람을 통제군에서 골라내는 작업을 지칭한다. 보통 처리군에 속한 사람의 특성 $X$와 동일한(혹은 유사한) $X$를 가진 사람을 통제군에서 골라내어 성과변수 $Y$를 비교한 것이다. 하지만 매칭해야할 $X$의 차원이 커지면, 매칭이 거의 불가능해진다(curse of dimensionality). $X$ 대신 어떤 점수를 계산하여 이 점수가 동일하면 유사한 사람이라고 볼 수 있다면 차원의 문제는 어느 정도 개선할 수 있게 된다. 이 때 이 점수를 성향점수(propensity score)라고 하고 보통 아래와 같이 정의한다. $$ P(x)=\Pr(T_{i}=1|X_{i}=x) $$ 성향점수 매칭 추정을 하기 위해서는 몇 가지 가정이 필요하지만 여기에서는 소개하..
개요* 좀 더 자세한 내용은 "정책분석을 위한 STATA"에 나와 있습니다. 정책평가의 핵심은 정책의 효과를 추정하는 것이다. 최근에는 임의실험을 통해서 정책을 평가하는 것이 인기이다. 실제로 다양한 필드 실험 혹은 실험실 내의 실험이 진행되고 있기도 하다. 하지만 모든 정책이 임의실험을 할 수 있는 것이 아니다. 비용 문제, 윤리 문제, 기간 문제 등 다양한 이유로 임의실험이 불가능한 경우가 많다. 따라서 임의실험이 불가능한 경우에 어떤 방법을 이용해서 평가를 할 수 있는지에 대해서 생각해볼 필요가 있다. 여기에서는 그런 방법 중 하나인 성향점수매칭추정법(PSME, propensity score matching estimation)에 대해서 소개하고자 한다. 특별히 정책효과가 모든 사람에게 동일한 것이..
비모수적 추정 앞의 Part 2에서의 추정치에서도 편의가 발생하는 것은 특정한 함수형태를 가정하였기 때문이다(혹은, 회귀불연속설계의 가정이 만족되지 않아서 일 수도 있다). 비모수적 추정은 다음의 값을 추정하는 것이다. $$ \hat{\delta} = \lim_{s \downarrow \tau} E[Y|X = \tau] - \lim_{s \uparrow \tau} E[Y|X = \tau] $$ 예전에는 계산상 어려움 때문에 모수적 형태를 가정하고 추정하는 경향이 있었다. 하지만 STATA 에서는 rdrobust 라는 추정명령어가 있기 때문에 이를 사용하면 함수형태에 대한 가정없이도 비교적 쉽게 추정할 수 있다. 동일한 자료를 rdplot을 이용해서 다시 그려보자. 아래 그림에 그 결과가 제시되어 있다. ..
모형의 추정 RDD 모형 추정을 위해, 잠재 성과에 대한 다음과 같은 모형을 생각해볼 수 있다. $$ E[Y_{0i} | X_{i} ] = \alpha + \beta X_{i} $$ $$ Y_{1i} = Y_{0i} + \rho $$ 위 모형에 따르면 정책효과는 $\rho$가 된다. 관측되는 변수는 다음과 같이 정의할 수 있다. $$ Y_{i} = T_{i} Y_{1i} + (1-T_{i}) Y_{0i} = Y_{0i} + T_{i} ( Y_{1i} - Y_{0i} ) $$ 위 식에 $ Y_{0i}$를 대입하면, 아래 회귀식을 도출할 수 있다. $$ Y_i = \alpha + \beta X_i + \rho T_i + \eta_i $$ 위의 방정식은 선형관계를 가정했을 경우이고, 비선형인 경우에는 일반적으..
일반적인 회귀모형을 생각해보자. 아래 그림은 설명변수 $X$(covariate)와 성과변수 $Y$와의 관계를 산포도로 그린 것이다. . clear . set more off . use rd_1, clear . scatter y_original x /// > , xtitle(Covariate) ytitle(Outcome) ms(O) mcolor(green%30) /// > title("Covariate and outcomes") 위 산포도에 따르면, $X$가 증가하면서 $Y$도 증가하는 경향이 있는 것으로 보인다. 이러한 상관관계를 선형모형으로 추정한 것이 아래 그림의의 붉은색 실선이다. 파란색 점선은 비모수적으로 추정한 선형식이다. . tw (scatter y_original x , ms(O) mcolo..