신뢰구간 그리기 바그래프 혹은 특정 값에 대한 신뢰구간을 표시할 필요가 있는 경우가 왕왕 있다.Stata에서는 cibplot 혹은 cibar 을 이용하여 그릴 수 있다.필요한 경우 다음과 같이 cibplot 혹은 cibar 을 설치하자. ssc install cibplot, replace ssc install cibar, replace 다음과 같이 자료를 읽어들이자. . webuse total, clear 먼저 cibplot 를 이용하여 heartatk의 평균을 sex 별로 그리고, 신뢰구간을 표시하도록 하자. . cibplot heartatk ,by(sex ) baropts(fcolor(green%50) lwidth(none)) 그러면 아래와 같은 그림을 얻을 수 있다.최근에는 cibplot 보다는 c..
분포함수 그리기 분포함수는 확률변수를 분포를 파악하는 좋은 방법 중 하나이다.pdf는 경우에 따라 존재하지 않을 수 있지만, cdf는 정의가 잘 되기 때문이다.Stata에서는 cdfplot 을 이용하여 그릴 수 있다.필요한 경우 다음과 같이 bihist 혹은 byhist를 설치하자. ssc install cdplot, replace 다음과 같이 자료를 읽어들이자. . sysuse auto, clear (1978 Automobile Data) 먼저 cdfplot 를 이용하여 length의 cdf를 그려보자. . cdfplot length , opt1(color(%50)) (0 observations deleted) 그러면 아래와 같은 누적분포함수를 얻을 수 있다.동일한 cdf를 국산/수입차에 따라서 그릴 ..
히스토그램 그리기 히스토그램은 확률변수를 분포를 파악하는 가장 좋은 방법 중 하나이다.하나의 범주 변수가 2개의 값을 가질 때, 비교를 목적으로 각 범주별로 히스토그램을 그릴 필요가 있다.Stata에서는 bihist 혹은 byhist 를 이용하여 그릴 수 있다.필요한 경우 다음과 같이 bihist 혹은 byhist를 설치하자. ssc install bihist, replace 혹은 ssc install byhist, replace 다음과 같이 자료를 읽어들이자. 그리고 연령대와 인종을 다음과 같이 한정하자. . sysuse nlsw88, clear (NLSW, 1988 extract) 먼저 bihist 를 이용하여 결혼 여부에 따라 임금의 히스토그램을 그려보자. . bihist wage, by(marri..
산포도 깔끔하게 그리기 산포도를 그릴 때 복잡하게 모두 표시하는 것보다는 x변수를 몇 개의 구간으로 나누고, 그 때의 평균(혹은 중위수) y를 표시하는 것이 깔끔하게 보일 보인다.특히 최근에 RD 가 유행하면서 이런 식의 그림을 그려야할 경우가 많다.Stata에서는 다양한 방식으로 그릴 수 있는데 최근에 발표된 binscatter를 이용하면 비교적 편하게 작업을 할 수 있다.필요한 경우 다음과 같이 binscatter 를 설치하자. ssc install binscatter, replace 다음과 같이 자료를 읽어들이자. 그리고 연령대와 인종을 다음과 같이 한정하자. . sysuse nlsw88, clear (NLSW, 1988 extract) . keep if inrange(age,35,44) & inr..
백그라운드 쉐도우 그래프 타임시리즈 그래프를 그릴 때에는 특정 기간을 백그라운드에 표시할 필요가 있는 경우가 많다.기재부, 한국은행, KDI 등에서도 그러한 그래프를 다양하게 많이 사용한다. 특정 사건이 발생한 시기를 표시할 때 사용된다. 예컨대, 경기침체 시기의 경제성장률을 표시하시할 때백그라운드로 해당 기간을 표시하게 된다.통상적으로는, 엑셀에서 필요한 기간 동안 막대 그래프로 다른 축을 하나 추가하는 방식으로 하는 것이 보통이다.Stata에서는 다양한 방식으로 그릴 수 있는데 최근에 발표된 bgshade를 이용하면 비교적 편하게 작업을 할 수 있다.필요한 경우 다음과 같이 bgshade 를 설치하자. ssc install bgshade, replace 다음과 같이 자료를 읽어들이자. . sysuse..
Radar 그래프 radar 혹은 spider 프롯팅을 해보자 필요한 경우 다음과 같이 radar 를 설치하자. ssc install radar, replace 다음과 같이 자료를 읽어들이자. . sysuse auto, clear (1978 Automobile Data) 그리고 다음과 같이 radar 를 이용하여 radar 플롯을 그려보자. 선색깔과 모양은 적당히 옵션을조정하면 된다. . radar make turn mpg trunk if foreign, /// > title(Foreign cars) aspect(1) /// > legend(pos(6) ring(1) row(1)) /// > lc(red%30 blue%40 pink%30) labsize(*.7) (52 observations delete..
Penalized-spline line 추정 Rupper et al.(2003)에 기반하여 y를 x에 penalized-spline regression을 하고 이를 이용하여 함수를 플롯팅을 하자.필요한 경우 다음과 같이 pspline 를 설치하자. ssc install pspline, replace 다음과 같이 자료를 읽어들이자. . use http://fmwww.bc.edu/repec/bocode/l/lidar.dta, clear (Light detection and ranging (LIDAR) data) 그리고 다음과 같이 pspline 를 이용하여 . pspline logratio range, g(fitted) nograph (pilot goodness-of-fit chi2(35) = 411.98;..
2변수의 밀도함수의 추정 두 확률변수의 결합분포함수를 추정하고 이를 heat-map 을 이용하여 시각화할 수 있다.필요한 경우 다음과 같이 tddens 를 설치하자. ssc install tddens, replace 가장 흔한 자료 중 하나인 auto.dta 를 다음과 같이 불러들이자. . sysuse auto, clear (1978 Automobile Data) 그리고 다음과 같이 tddens를 이용하여 . tddens price mpg 그러면 아래와 같은 그래프를 얻을 수 있다. 다만, 옵션을 조정해서 다양한 형식의 그래프로 발전시키기에는 제약이 많은 것 같다.
"고객을 알아야 산다" 은행권, 상반기 빅데이터 대전조직정비·인력영입 몸 푼 은행권 올해부터 빅데이터 활용 본 게임 기사입력 : 2018년02월19일 10:51최종수정 : 2018년02월19일 10:51가 +가 -프린트[뉴스핌=최유리 기자] 은행권이 올해 상반기 빅데이터 대전에 돌입한다. 지난해 관련 조직 정비와 외부 인력 영입으로 몸을 풀었다면, 올해는 맞춤형 금융상품 추천부터 상품 기획, 리스크 관리 등 은행의 고유 업무에 빅데이터를 적용해 본 게임에 나선다.19일 은행권에 따르면 신한은행, 농협은행, 우리은행 등이 올 상반기 빅데이터를 활용한 맞춤형 상품 추천 서비스를 선보인다.경쟁의 불을 당기는 곳은 신한은행이다. 오는 22일 통합 모바일 플랫폼 '쏠(SOL)'을 출시하고 빅데이터에 기반의 금융 ..
PICK 안내빅데이터 시대, 누구나 알아야 할 데이터 리터러시본문듣기 설정기사입력2018.02.11 오전 10:21최종수정2018.02.11 오전 10:24좋아요 화나요 좋아요 평가하기71요약봇beta 글자 크기 변경하기 SNS 보내기빅데이터 활용에 대한 관심과 더불어 데이터의 중요성을 인지하는 사회의 분위기가 확대되고 있습니다. 데이터 없이는 생존이 불가능한 시대로 접어들고 있다고 해도 과언이 아닐 텐데요. 공공, 민간의 다양한 분야에서 데이터를 활용해 가치를 창출해내기 위한 여러 시도를 하고 있는 것만 봐도 이를 알 수 있습니다. 데이터의 중요성이 확대되고 이를 활용하기 위한 시도가 증가하는 시대에, 우리가 알아야 할 것은 무엇일까요? 정보 포화의 상태에서 정보를 선별해 수용하기 위한 정보 검색 능력..