티스토리 뷰
산포도 깔끔하게 그리기
산포도를 그릴 때 복잡하게 모두 표시하는 것보다는 x변수를 몇 개의 구간으로 나누고, 그 때의 평균(혹은 중위수) y를 표시하는 것이 깔끔하게 보일 보인다.
특히 최근에 RD 가 유행하면서 이런 식의 그림을 그려야할 경우가 많다.
Stata에서는 다양한 방식으로 그릴 수 있는데 최근에 발표된 binscatter를 이용하면 비교적 편하게 작업을 할 수 있다.
필요한 경우 다음과 같이 binscatter 를 설치하자.
ssc install binscatter, replace
다음과 같이 자료를 읽어들이자. 그리고 연령대와 인종을 다음과 같이 한정하자.
. sysuse nlsw88, clear
(NLSW, 1988 extract)
. keep if inrange(age,35,44) & inrange(race,1,2)
(158 observations deleted)
먼저 scatter 를 이용하여 임금과 근속간의 관계를 그려보자.
. scatter wage tenure, color(%50)
그러면 아래와 같은 산포도를 얻을 수 있다.
색깔 등을 조정할 수는 있지만 아주 깔끔해보이지는 않고, 관측치가 더 많은 경우에는 추세를 파악하는데에도 큰 도움이 되지는 않는다.
binscatter를 이용하면 아래와 같이 비교적 깔끔하게 그릴 수 있다.
. binscatter wage tenure, mcolor(pink%30) lcolor(blue%70) scheme(scient
> ific)
RD의 경우에도 아래와 같이 비교적 쉽게 그릴 수 있다.
. binscatter wage tenure, ///
> rd(2.5) mcolor(pink%30) lcolor(blue%70 red%70 green%70) ///
> scheme(s2color)
'graphs' 카테고리의 다른 글
cdf 그리기 (0) | 2018.10.04 |
---|---|
히스토그램 그리기 (0) | 2018.10.03 |
bgshade 이용하기 (0) | 2018.09.30 |
radar 그래프 (0) | 2018.09.29 |
penalized-spline regression fitting (0) | 2018.09.29 |