3차원 그래프 그리기 Stata 그래프에서 가장 아쉬운 지점 중 하나가 3차원 그래프가 거의 없고, 나와 있는 것도 만족스럽지 못한 것이 사실이다.2017년에 배포된 surface는 비교적 쉽게 3차원 그래프를 그릴 수 있다. 다만, 다양한 각도로 로테이션이 되지 않는 것은 아쉬운 점이다.필요한 경우 다음과 같이 surface를 설치하자. ssc install surface, replace 다음과 같이 자료를 만들자. . clear . set obs 900 number of observations (_N) was 0, now 900 . gen x = int((_n - mod(_n-1,30) -1 ) /30 ) . gen y = mod(_n-1,30) . gen z = normalden(x, 15, 2)*..
명령어 자동화* 아래는 Stata Blog(10월 9일 Vince Wiggins, Vice President, Scientific Development)에 있는 블로그 내용을 축약해서 정리한 것입니다. 자주 쓰는 명령어를 자동화 시켜놓으면 매우 편리하다. . sysuse auto, clear (1978 Automobile Data) 다음과 같이 price 변수를 정규화 시켜보자. . sum price Variable | Obs Mean Std. Dev. Min Max -------------+--------------------------------------------------------- price | 74 6165.257 2949.496 3291 15906 . gen priceN = (price ..
confidence ellipse 그리기 1변수인 경우에는 신뢰구간이 되지만 2변수인 경우에는 신뢰타원이 된다.신뢰타원을 쉽게 그리기는 좀 어려운데 Stata에서는 ellip 을 이용하여 그릴 수 있다.필요한 경우 다음과 같이 ellip를 설치하자. ssc install ellip, replace 다음과 같이 자료를 읽어들이자. . sysuse auto, clear (1978 Automobile Data) 먼저 ellip 을 이용하여 confidence ellipse를 그려보자. . ellip mpg weight, /// > means color(green%50) lp(solid) /// > by(foreign , note("") ) /// > plot(scatter mpg weight, color(pi..
추정계수 그리기 기존의 관행에 따르면 추정결과를 표로 보고하는 것이 보통이다.하지만 최근에는 한 눈에 알아볼 수 있게 그림을 이용하여 보고하는 경우가 늘어나고 있다. 모형간 비교를 해야할 때에는 그래프로 추정결과를 보여주면 가독성이 개선되는 것도 사실이다. 예컨대, 분위회귀에서는 다양한 분위에 대한 추정결과를 표로 정리하는 것보다는 그래프로 정리하면 훨씬 보기가 좋다.Stata에서는 margins를 이용해도 되지만 최근에 ssc 더해진 coefplot 을 이용하면 쉽게 그릴 수 있다.필요한 경우 다음과 같이 coefplot을 설치하자. ssc install coefplot, replace 다음과 같이 자료를 읽어들이자. 그리고 분석의 편의를 위해 표본을 rep78이 3이상인 경우로 한정하자. . sysu..
신뢰구간 그리기 바그래프 혹은 특정 값에 대한 신뢰구간을 표시할 필요가 있는 경우가 왕왕 있다.Stata에서는 cibplot 혹은 cibar 을 이용하여 그릴 수 있다.필요한 경우 다음과 같이 cibplot 혹은 cibar 을 설치하자. ssc install cibplot, replace ssc install cibar, replace 다음과 같이 자료를 읽어들이자. . webuse total, clear 먼저 cibplot 를 이용하여 heartatk의 평균을 sex 별로 그리고, 신뢰구간을 표시하도록 하자. . cibplot heartatk ,by(sex ) baropts(fcolor(green%50) lwidth(none)) 그러면 아래와 같은 그림을 얻을 수 있다.최근에는 cibplot 보다는 c..
분포함수 그리기 분포함수는 확률변수를 분포를 파악하는 좋은 방법 중 하나이다.pdf는 경우에 따라 존재하지 않을 수 있지만, cdf는 정의가 잘 되기 때문이다.Stata에서는 cdfplot 을 이용하여 그릴 수 있다.필요한 경우 다음과 같이 bihist 혹은 byhist를 설치하자. ssc install cdplot, replace 다음과 같이 자료를 읽어들이자. . sysuse auto, clear (1978 Automobile Data) 먼저 cdfplot 를 이용하여 length의 cdf를 그려보자. . cdfplot length , opt1(color(%50)) (0 observations deleted) 그러면 아래와 같은 누적분포함수를 얻을 수 있다.동일한 cdf를 국산/수입차에 따라서 그릴 ..
히스토그램 그리기 히스토그램은 확률변수를 분포를 파악하는 가장 좋은 방법 중 하나이다.하나의 범주 변수가 2개의 값을 가질 때, 비교를 목적으로 각 범주별로 히스토그램을 그릴 필요가 있다.Stata에서는 bihist 혹은 byhist 를 이용하여 그릴 수 있다.필요한 경우 다음과 같이 bihist 혹은 byhist를 설치하자. ssc install bihist, replace 혹은 ssc install byhist, replace 다음과 같이 자료를 읽어들이자. 그리고 연령대와 인종을 다음과 같이 한정하자. . sysuse nlsw88, clear (NLSW, 1988 extract) 먼저 bihist 를 이용하여 결혼 여부에 따라 임금의 히스토그램을 그려보자. . bihist wage, by(marri..
산포도 깔끔하게 그리기 산포도를 그릴 때 복잡하게 모두 표시하는 것보다는 x변수를 몇 개의 구간으로 나누고, 그 때의 평균(혹은 중위수) y를 표시하는 것이 깔끔하게 보일 보인다.특히 최근에 RD 가 유행하면서 이런 식의 그림을 그려야할 경우가 많다.Stata에서는 다양한 방식으로 그릴 수 있는데 최근에 발표된 binscatter를 이용하면 비교적 편하게 작업을 할 수 있다.필요한 경우 다음과 같이 binscatter 를 설치하자. ssc install binscatter, replace 다음과 같이 자료를 읽어들이자. 그리고 연령대와 인종을 다음과 같이 한정하자. . sysuse nlsw88, clear (NLSW, 1988 extract) . keep if inrange(age,35,44) & inr..