멋쟁이사자처럼 AI School 8기(fin)/TIL(Today I Learn)
[멋쟁이사자처럼 AI스쿨] Day23 TIL
#FF0000
2023. 1. 30. 12:40
ㅁ 데이터를 분석하는 이유?
=> 데이터를 어떻게 보여줄 것인가? 요약? 전체?
ㅁ 파이썬 시각화
=> matpoltlib, 정적 시각화
단점 : 한글 지원x
한글 폰트 설정 (!pip install koreanize-matplotlib)
cf.) plotly : 동적 시각화, javascript
ㅁ from glob import glob # '폴더명' 폴더의 '파일명.확장자'에 해당하는 모든 파일 보여줌
glob("폴더명"/"파일명.확장자")
ㅁ jupyter notebook 내 ? 사용
- ? <= 도움말
- ?? <= 소스코드
top : 최빈값
frq : 최빈값의 빈도수
ㅁ 히스토그램에서 인상적인 부분
- 수치 데이터일지라도 연속된 데이터가 아니라 끊어진 데이터가 있음을 볼 수 있음.
- 수치 데이터임에도 범주형으로 볼 수 있는 데이터도 있음을 볼 수 있음.
*sort_index()로 정렬 미 이행시
리스트를 생성하여 변수[리스트] 처리
*결측치(NaN)는 fillna()로 변경(채우기).
.fillna(0)