본문 바로가기
멋쟁이사자처럼 AI School 8기(fin)/TIL(Today I Learn)

[멋쟁이사자처럼 AI스쿨] Day23 TIL

by #FF0000 2023. 1. 30.

 

 

ㅁ 데이터를 분석하는 이유?

=> 데이터를 어떻게 보여줄 것인가? 요약? 전체?

 

ㅁ 파이썬 시각화

=> matpoltlib, 정적 시각화

단점 : 한글 지원x

한글 폰트 설정 (!pip install koreanize-matplotlib)

 

cf.) plotly : 동적 시각화, javascript

 

 

ㅁ from glob import glob #  '폴더명' 폴더의 '파일명.확장자'에 해당하는 모든 파일 보여줌

    glob("폴더명"/"파일명.확장자")

 

 

ㅁ jupyter notebook 내 ? 사용

  • ? <= 도움말
  • ?? <= 소스코드

 

top : 최빈값

frq : 최빈값의 빈도수

 

 

ㅁ 히스토그램에서 인상적인 부분

  • 수치 데이터일지라도 연속된 데이터가 아니라 끊어진 데이터가 있음을 볼 수 있음.
  • 수치 데이터임에도 범주형으로 볼 수 있는 데이터도 있음을 볼 수 있음.

 

*sort_index()로 정렬 미 이행시

리스트를 생성하여 변수[리스트] 처리

 

 

*결측치(NaN)는 fillna()로 변경(채우기).

.fillna(0)