본문 바로가기

혼공학습단(한빛미디어)

[혼공단13기] 혼자 공부하는 데이터 분석 with 파이썬 - 1주차

 

 

 

혼자 공부하는 데이터 분석 with 파이썬 - 예스24

혼자 해도 충분하다! 1:1 과외하듯 배우는 데이터 분석 자습서이 책은 독학으로 데이터 분석을 배우는 입문자가 ‘꼭 필요한 내용을 제대로 학습’할 수 있도록 구성했습니다. 뭘 모르는지조차

www.yes24.com

https://www.yes24.com/Product/Goods/116253011

 

25년도 새해, 혼공단 13기를 시작합니다.

23년 여름 혼공단 10기로 시작한 프로그래밍 언어 기초 학습이 벌써 2년을 향해 나아가네요.

10기 혼공머신 / 11기 SQL / 12기 자바

그리고 현재 13기 데이터 분석

 

Start.


 

 

1주차(25.1.6 - 1.12) Chapter 01 데이터 분석을 시작하며

학습정리

데이터 분석

  • 데이터에서 유의미한 패턴과 통찰을 도출하기 위해 데이터를 수집, 정리, 시각화, 모델링, 해석하는 과정을 의미
  • 의사결정이나 문제 해결에 필요한 정보를 제공

데이터 과학

  • 데이터 분석을 포함한 더 넓은 개념
  • 통계, 프로그래밍, 머신러닝, 데이터 엔지니어링 등의 기술을 활용
  • 데이터로부터 유용한 지식을 생성하는 학문이자 실천 영역

파이썬

  • 쉽고 간결한 문법과 강력한 라이브러리 생태계를 갖춘 프로그래밍 언어
  • 데이터 분석, 머신러닝, 웹 개발 등 다양한 분야에서 사용
  • Pandas, NumPy, Matplotlib, Seaborn 같은 라이브러리와 함께 자주 활용

판다스:

  • 파이썬의 데이터 분석 라이브러리, 테이블 형태의 데이터를 다루는 데 최적화
  • 데이터 정리, 조작, 분석을 위한 다양한 기능을 제공

데이터프레임:

  • 판다스에서 제공하는 2차원 데이터 구조로, 행(row)과 열(column)로 구성된 테이블 형식
  • 엑셀 스프레드시트와 비슷하며, 데이터의 정리와 분석에 자주 사용

시리즈:

  • 판다스의 1차원 데이터 구조로, 배열(array)과 유사
  • 한 열(column)의 데이터 또는 라벨이 지정된 값의 집합
  • 데이터프레임의 구성 요소 중 하나

 


 

기본미션

▶ p.81 확인문제 4번 풀이

 

Q4. 판다스 read_csv() 함수의 매개변수 설명이 옳은 것은 무엇인가요?

①header 매개변수의 기본값은 1로 CSV 파일의 첫 번째 행을 열 이름으로 사용합니다.
②names 매개변수에 행 이름을 리스트로 지정할 수 있습니다.
③encoding 매개변수에 csv 파일의 인코딩 방식을 지정할 수 있습니다.
④dtype 매개변수를 사용하려면 모든 열의 데이터 타입을 지정해야 합니다.

 

>> 정답 : 3번, encoding 매개변수에 csv 파일의 인코딩 방식을 지정할 수 있습니다.

 

sol)

  • header 매개변수:
    • 기본값은 0, CSV 파일의 첫 번째 행을 열 이름으로 사용
    • (header=1은 두 번째 행을 열 이름으로 사용)
  • names 매개변수:
    • 열 이름을 리스트로 지정 O, 행 이름은 지정 X 
  • encoding 매개변수:
    • CSV 파일의 인코딩 방식을 지정 (encoding='utf-8' 또는 encoding='cp949')
  • dtype 매개변수:
    • 특정 열의 데이터 타입만 지정, 모든 열의 타입을 지정할 필요는 없음. (dtype={'column1': int, 'column2': float})

 

 

 

추가미션

p. 71 ~ 73 남산 도서관 데이터를 코랩에서 데이터프레임으로 출력하고 화면 캡처하기