이 책은 전공 점추정과 구간추정, 그리고 최대우도와 분산분석까지, 머신러닝과 품질관리등 많은 산업군에서 기본적으로 필요한 통계 지식을 다루고 있습니다. 산업공학과 커리큘럼으로 보자면 기초통계와 응용통계학 1 수준의 범위가 되는 것 같습니다. 하지만 매우 상세한 설명과 이해하기 쉬운 도식으로 처음 통계를 접하거나 자신이 없는 분들이 접하기에 좋을 것 같습니다. 특히 처음에 많이 헷갈리는 부분인 평균과 분산에 따른 데이터 분포 차이와 공분산을 매트릭스로 설명하는 부분 등은 저에게도 직관적인 이해에 많은 도움이 되었습니다.
이 책은 통계적인 개념을 알려줄 뿐 아니라 요근래 머신러닝에 많이 사용되는 파이썬과 넘파이(numpy), 판다스(pandas)와 같은 라이브러리를 활용하여 통계량을 계산하고 분산분석과 선형 모델을 개발하는 등 이론과 실기를 동시에 나가는 전공 수업과 비슷한 커리큘럼을 가지고 있습니다.
아마 많은 분들이 전공 과목으로 통계학을 들을 때, 손으로 계산하거나 엑셀, 미니탭, R과 같은 툴을 이용하여 계산했을 것입니다. 그리고 아직도 위와 같은 고전적인 툴을 이용하여 통계학을 설명하는 책들이 많습니다. 물론 위에서 언급된 툴들이 강력하고 활용도가 높은 것은 사실이지만, 지금 통계학을 공부하고자 하는 분들의 대부분은 머신러닝과 딥러닝에 관심을 가지고 있을 것이고, 그렇기 때문에 위에서 언급한 미니탭과 R보다는 많이 사용되는 파이썬으로 공부하기를 원할 것입니다. 그러한 점에서 이 책은 독자의 니즈를 꿰뚫어본 책이라고 생각됩니다.
이 책을 보기 전까지 파이썬으로 R처럼 분산분석이나 회귀모델, 통계적 검정을 유연하게 할 수 있을까라는 생각을 했었는데, statsmodels라는 라이브러리를 통해서 R을 사용하는 것 처럼 활용할 수 있다는 것을 새로 알게되었습니다. R과 비슷한 API와 출력 형식을 사용하므로 기존에 R로 통계를 배웠던 분들도 거부감 없이 활용할 수 있을 것 같습니다.
총평
저는 요 근래 입시를 준비하며 통계 개념들을 다시 살펴보기 위해서 여러 책들을 찾아보고 있었습니다. 그리고 참고하기 위해 찾아본 많은 책들은 빠르게 훑어보기에 너무 딱딱하거나 너무 얕은 범위를 다루고 있었습니다. 기존에 통계를 공부한 적이 있는 사람이라면 가볍게 리뷰할 수 있는 책, 그리고 처음 공부하는 분들에게는 자주 사용되는 내용을 좌절감을 느끼지 않으며 공부할 수 있는 책입니다. 이러한 관점에서 이 책을 한 마디로 요약하자면 ‘적당한 범위와 적당한 수준의 범위를 다루는 실용적인 책’이라고 할 수 있을 것 같습니다.
본 책은 한빛미디어로부터 제공받았으며 책 이외의 요구사항이나 보수를 제공받지 않은 주관적인 리뷰입니다.
'공부를 끄적끄적 > 책 리뷰' 카테고리의 다른 글
[리뷰]파이썬과 대스크(Dask)를 활용한 고성능 데이터 분석 (0) | 2020.10.24 |
---|---|
해커, 광기의 랩소디 – 동기부여를 위한 고전 명작 (0) | 2020.09.27 |
R교과서 - Learning R Programming (0) | 2020.07.08 |
클라우드 네이티브 - 기초부터 탄탄하게 (0) | 2020.07.05 |
[리뷰]줄리아를 생각하다 - Let's Julia! (0) | 2020.05.31 |