티스토리 뷰
삼중차분추정법
이중차분법으로 추정한 추정치가 진정한 정책효과가 아닐 수도 있다.
정책이 없었어도 두 그룹간의 차이가 발생할 수 있는 경우가 있을 수도 있다.
예컨대 다른 요인들이 처리군과 통제군에 서로 다른 영향을 경우, 이중차분 추정법을 이용하면 마치 정책이 효과가 있는 것처럼 추정되었을 경우가 있다.
이런 경우 이중차분 추정치가 강건한지 확인해볼 필요가 있다.
강건성 확인을 위해서 정책과 상관없는 그룹에 대해서 이중차분 추정을 해보는 수가 있다.
이 경우에 추정된 정책효과는 정책과 무관하게 처리군과 통제군 사이의 차이로 볼 수 있다.
만약, 이렇게 구해진 이중차분 추정치가 0이라면 큰 문제가 없겠지만, 그렇지 않다면 좀 더 살펴볼 필요가 있다.
삼중차분추정법은 두 이중차분 추정치를 다시 차분하는 것이다.
예컨대 Katz(1996)의 연구를 살펴보자.
“Targeted Jobs Tax Credit(이하 TJTC)”은 1978년에 도입된 세액공제 제도이다.
TJTC는 취약계층의 18세에서 24세 사이의 청년을 고용하는 고용주에게 세제혜택(세액공제)을 주는 정책이었다.
TJTC는 1989년에 지원 대상 노동자의 연령이 18-22세로 축소되는 변화를 겪었다.
23-24세의 취약계층 청년을 고용해서는 더 이상 세제 혜택을 받을 수 없게 된 것이다.
Katz(1996)에 따르면 식별전략은 다음과 같다.
정책이 없어진 그룹에 미친 효과를 추정하는 것이 목적이다.
먼저,
(i) 23-24세의 취약계층과 비취약계층을 비교하여 고용율의 이중차분 추정치를 계산하였다.
(ii) 18-22세의 취약계층과 비취약계층의 고용율의 이중차분 추정치를 계산하였다.
그런 다음 (i)과 (ii)를 다시 차분하여 삼중차분 추정치를 계산하였다.
위의 삼중차분추정은 이중차분추정과 마찬가지로 간단한 회귀모형을 통해서 추정할 수 있다.
간단한 실습을 통해서 삼중차분 추정치를 구해보자. 실습파일을 열어보자.
. use ddd, clear
이 파일의 경우 실제 정책의 분석이 되는 그룹과 정책과는 무관한 그룹을 구분할 수 있는 이항변수인 $\lambda$가 포함되어 있다.
먼저 정책이 시행된 그룹을 대상으로 하여 이중차분 추정을 해보자.
단순한 이중차분 추정치는 약 3.21=(6.04-2.03)-(1.92-1.12) 정도이다.
. format y %9.2f
. tab time treat if lambda == 1, sum(y) mean standard
Means and Standard Deviations of y
| treat
time | 0 1 | Total
-----------+----------------------+----------
0 | 1.12 2.03 | 1.73
| 0.94 0.96 | 1.05
-----------+----------------------+----------
1 | 1.92 6.04 | 4.68
| 1.05 1.03 | 2.20
-----------+----------------------+----------
Total | 1.52 4.03 | 3.20
| 1.07 2.24 | 2.27
그리고 이를 회귀분석으로 추정하면 아래와 같이 추정할 수 있다.
. reg y treat##time if lambda == 1, robust
Linear regression Number of obs = 1,340
F(3, 1336) = 1828.23
Prob > F = 0.0000
R-squared = 0.8071
Root MSE = .99629
------------------------------------------------------------------------------
| Robust
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
1.treat | .9061956 .0779205 11.63 0.000 .7533357 1.059056
1.time | .8028324 .094601 8.49 0.000 .6172496 .9884151
|
treat#time |
1 1 | 3.208963 .1156672 27.74 0.000 2.982054 3.435872
|
_cons | 1.120597 .0632067 17.73 0.000 .9966017 1.244592
------------------------------------------------------------------------------
이번에는 정책과 상관없는 경우에 위약처리를 생각하고 DID 추정치를 다시 계산해보자.
. tab time treat if lambda == 0, sum(y) mean standard
Means and Standard Deviations of y
| treat
time | 0 1 | Total
-----------+----------------------+----------
0 | 1.89 3.58 | 3.06
| 1.05 0.95 | 1.25
-----------+----------------------+----------
1 | 3.48 5.03 | 4.55
| 1.06 0.95 | 1.22
-----------+----------------------+----------
Total | 2.69 4.31 | 3.81
| 1.32 1.19 | 1.44
. reg y treat##time if lambda == 0, robust
Linear regression Number of obs = 660
F(3, 656) = 246.28
Prob > F = 0.0000
R-squared = 0.5371
Root MSE = .98434
------------------------------------------------------------------------------
| Robust
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
1.treat | 1.689279 .1212972 13.93 0.000 1.451101 1.927456
1.time | 1.591627 .1476805 10.78 0.000 1.301644 1.881611
|
treat#time |
1 1 | -.1427032 .1724714 -0.83 0.408 -.4813658 .1959595
|
_cons | 1.891743 .103613 18.26 0.000 1.68829 2.095196
------------------------------------------------------------------------------
삼중차분추정치는 아래와 같이 구할 수 있다.
회귀분석 결과에 따르면 DDD 추정치는 3.35로서 다시 단순 삼분추정 추정치와 일치한다.
앞의 세 추정치를 비교해보면 DDD 회귀식의 계수들이 어떤 의미를 갖는지 알 수 있다.
실제 정책 그룹의 경우 먼저 DDD 회귀식의 첫 번째 3개의 항은 위약 그룹의 DID 추정결과와 정확히 일치한다.
이는 lambda = 0 인 경우의 계수들이기 때문이다.
treat#lambda는 정책 시행 이전의 정책 그룹과 통제군간의 차이의 차이를 보여주고 있다.
time#lambda 는 policy 그룹과 placebo 그룹의 공통 추세의 차이를 보여주고 있다.
. reg y treat##time##lambda, robust
Linear regression Number of obs = 2,000
F(7, 1992) = 927.43
Prob > F = 0.0000
R-squared = 0.7667
Root MSE = .99237
-----------------------------------------------------------------------------------
| Robust
y | Coef. Std. Err. t P>|t| [95% Conf. Interval]
------------------+----------------------------------------------------------------
1.treat | 1.689279 .1211716 13.94 0.000 1.451642 1.926915
1.time | 1.591627 .1475276 10.79 0.000 1.302303 1.880952
|
treat#time |
1 1 | -.1427032 .1722929 -0.83 0.408 -.4805964 .1951901
|
1.lambda | -.7711459 .1212955 -6.36 0.000 -1.009025 -.5332666
|
treat#lambda |
1 1 | -.7830829 .1440845 -5.43 0.000 -1.065655 -.5005107
|
time#lambda |
1 1 | -.788795 .1752794 -4.50 0.000 -1.132545 -.4450448
|
treat#time#lambda |
1 1 1 | 3.351666 .2075509 16.15 0.000 2.944627 3.758706
|
_cons | 1.891743 .1035057 18.28 0.000 1.688752 2.094734
-----------------------------------------------------------------------------------
'STATA' 카테고리의 다른 글
Cheat Sheet for Policy Evaluation (1) | 2018.01.29 |
---|---|
정책분석을 위한 STATA 출간 (0) | 2018.01.22 |
천둥번개와 정책효과: 이중차분추정법 part 1 (0) | 2018.01.04 |
도플갱어 PSME: part 3 (예제 2) (0) | 2018.01.01 |
도플갱어 PSME: part 2 (추정) (0) | 2018.01.01 |