• HOME > 도서정보 > 분야별도서 > 컴퓨터 / 정보공학
  • 분야별도서 [컴퓨터 / 정보공학]
Stata로 뚝딱뚝딱
(Stata 14 version 이상)
역/저자 김완석
ISBN 9788964214053
판형 188 * 240
페이지 280
정가 25,000 원
 
통계분석을 위해, 해당 이론과 통계 패키지로 통계적 계산을 실행하는 방법을 공부한다. 그러나 실제 통계분석을 할 시, 막상 오래 걸리는 부분은 데이터를 정리하고 취합하는 부분이다. 내가 원하는 데이터는 하늘에서 뚝 떨어진 데이터가 아니기 때문이다. 그러니까 통계 패키지로 통계적 계산을 실행할 때 사용되는 데이터는 이미 정리가다 되어 깨끗이 정제된 데이터인 것이다. 요즘은 단순히 통계학뿐만 아니라 데이터 과학이니, 인공지능이 대두되고 있지만, 이들 역시 데이터 정리가 선행돼야 함을 고려하면, 데이터 정리를 잘 하는 능력은 결코 무시할 수 없는 능력이라 하겠다.
나의 경우 데이터 정리는 전부 Stata로 한다. Stata의 명령어는 통계분석은 몰라도 데이터를 정리하고, 데이터 관리(Data Management)하는 데 있어서는 최강이기 때문이다. 이 책을 보다보면 알겠지만 정렬하는 sort 명령어와 이와 관련된 by접두어, 그리고 데이터 구조를 쉽게 바꾸게 하는 reshape 명령어는 정말 매력적인 명령어이다. Stata 명령어가 기본적으로 일관되고 직관적인데 그 특징이 이들 명령어에 그대로 적용되기 때문이다. 특히 reshape 명령어는 R프로그래밍의 reshape2 패키지의 reshape함수, SAS의 transpose 프로시저보다 문법이 쉬우면서 강력하다(물론 통계 패키지를 Stata로 처음 접했으면 reshape 명령어가 낯설 수 있지만). 그리고 반복문은 다른 통계 패키지보다 문법이 쉬우며 반복 작업을 다른 통계 패키지보다 쉽게 수행할 수 있다.
이 책은 여러 통계 패키지 중에서 Stata란 통계용 계산기로 데이터를 정리하는 데 있어 꼭 필요하며 기초가 되는 부분을 공부할 수 있도록 집필하였다. Stata를 사용하면서 터득한 내용과 나만의 팁을 개인 블로그(blog.naver.com/sanzo213)에 정리해왔는데, 블로그 내용이 책의 내용의 기반이 되었으며 또한 이 책의 경우 블로그에 없는 내용들도 일부 추가하였다.
Stata와 관련해선 통계분석 책은 여러 권이 존재하지만, 데이터 정리와 관련된 책은 부족했던 것이 사실이다. 이 책을 통하여 Stata로 데이터를 쉽게 정리할 수 있었으면 한다. 더 나아가 Stata와 친숙해져서 데이터 정리뿐만 아니라 Stata의 모르는 여러 부분을 독자가 스스로 찾아내는 능력이 배양되었으면 한다.