본문 바로가기
Books/서평

[서평] 파이썬의 첫 걸음, 판다스를 학습한다 <Do it! 데이터 분석을 위한 판다스 입문(2023, 개정판)>

by #FF0000 2023. 12. 8.

파이썬의 첫 걸음, 판다스를 학습한다 <Do it! 데이터 분석을 위한 판다스 입문(2023, 개정판)>

 

 

 

 


 

책 소개

저자 : 다니엘 첸 (Daniel Y. Chen)

제목 : Do it! 데이터 분석을 위한 판다스 입문 개정판

번역 : 시진

출판사 : 이지스퍼블리싱

출간 연도 : 2023. 11.

원문 제목 : Pandas for Everyone

원문 출간 연도 : 2022. 12.

페이지 : 총 400쪽


 

 

 

 

Do it! 데이터 분석을 위한 판다스 입문 | 다니엘 첸 - 교보문고

Do it! 데이터 분석을 위한 판다스 입문 | 파이썬 기초 문법만 알아도 OK! 테슬라 주식, 빌보드 차트 등 16개의 현실 데이터와 115개의 예제로 판다스의 기본을 확실히 익히자!이미 1만여 명의 독자가

product.kyobobook.co.kr

 

Do it! 데이터 분석을 위한 판다스 입문 이 5년만에 개정판으로 돌아왔다. 판다스(pandas)는 파이썬에서 가장 많이 활용되는 라이브러리 중 하나로, numpy와 sklearn, tenserflow, matplotlob 등의 다양한 데이터 분석에 사용되는 라이브러리를 사용하기 위한 사전 데이터 셋 정제에 주로 사용된다. 

이번 개정판에서는 판다스의 주요 용어, 원리와 개념을 토대로 넘파이, 맷플롯립, 시계열 데이터 등의 파이썬 데이터 분석의 기본기 학습을 안내한다.


 

 

 12개의 챕터로 구성된 이번 개정판은 10일의 학습 플랜을 제시한다. 판다스의 핵심 개념과 데이터 시각화 방법의 학습과 더불어 함수의 활용을 통한 데이터 분석 적용법을 안내하며, 마무리로 시계열 분석에 대해 설명한다.

판다스는 데이터 전처리에 필수적으로 사용되는 라이브러리로, 데이터의 로드부터 분석을 위한 데이터 프레임 형성까지의 전처리 앞 부분을 담당한다.


 

 

책을 읽으면서 좋았던 점으로 첫번째, 실제 데이터 분석에 사용되는 용어들이 책에 수록되어 있고, 이를 명확하게 설명하고 있는 점이다. 파이썬 입문서에서 다루는 기본 용어 정리가 파이썬 사용의 기본기를 안내한다면, '판다스 입문'은 파이썬을 활용하여 데이터 분석에 사용되는 용어에 대해 안내한다. 파이썬의 기본서를 완독하고 판다스 입문을 이어 학습한다면 데이터 분석 학습에 명확한 시나리오로 학습이 가능한 점이 책의 강점이다. 

 

 

또한 현업 데이터 분석가들이 데이터 전처리에서 중요하게 설명하는 'tidy data'에 대해서도 다루고 있어 판다스 라이브러리 학습방향이 '데이터 분석'을 위함임을 명확히 알 수 있었다. 표준화 혹은 정규화 되어있는, 결측치가 없고 이상치가 적은, 컬럼이 명확하고 내부 데이터 셋이 온전한 그러한 이상적인 데이터는 실제로는 존재하기 어려움을 몇 가지 예시를 통해 판다스의 사용법을 안내하는 점이 인상 깊었다.

 

 

마지막으로 책을 읽으며 이 책을 데이터 분석에 관심있는 지인들에게 추천해야겠다고 생각하게 된 7장의 데이터 결합과 분해 파트가 이번 개정판에서 가장 실용적인 파트였다고 생각한다. 단순히 concat과 merge의 사용에서 한단계 더 나아가 glob 함수를 활용한 데이터 로드와 리스트컴프리헨션으로 루프 처리를 하는 설명이 판다스를 보다 잘 활용할 수 있도록 안내하고 있어서 책 구성의 강점으로 느껴졌다. (데이터의 다대일 병합과 일대일 병합을 sql과 비교하여 설명하는 점도 독자의 이해도를 높이는 방안으로 보인다)

 

 


마치며

생성형 AI와 인공지능 그리고 데이터 분석까지 데이터 사이언스는 어제보다는 오늘, 그리고 내일 더 빠른 속도로 발전하고 있다. 데이터의 가치 역시 그 중요성이 더욱 높아지는 오늘날 데이터 분석은 그 자체로 지표를 산출하는 방법이고, 머신러닝과 딥러닝을 위한 전반부 단계를 포함한다. 이러한 과정에서 필수적인 파이썬의 기본 라이브러리로 판다스는 데이터 정제에 다양한 방법을 제공한다. 이번 판다스 입문 개정판은 '데이터 분석을 위한' 이라는 부제에 딱 맞는 파이썬의 판다스를 담백하고 명확하게 사용 할 수 있도록 설명한다.

데이터 분석에 관심이 있다면, 파이썬을 보다 잘 사용하고 싶다면 이번 이지스퍼블리싱의 'do it! 데이터 분석을 위한 판다스 입문 개정판'의 일독을 추천한다.

 

 

 

[이지스퍼블리싱 출판사에서 도서를 제공받아 작성된, 글쓴이의 주관적인 견해가 포함된 서평 입니다.]