ㅁ 데이터를 분석하는 이유?
=> 데이터를 어떻게 보여줄 것인가? 요약? 전체?
ㅁ 파이썬 시각화
=> matpoltlib, 정적 시각화
단점 : 한글 지원x
한글 폰트 설정 (!pip install koreanize-matplotlib)
cf.) plotly : 동적 시각화, javascript
ㅁ from glob import glob # '폴더명' 폴더의 '파일명.확장자'에 해당하는 모든 파일 보여줌
glob("폴더명"/"파일명.확장자")
ㅁ jupyter notebook 내 ? 사용
- ? <= 도움말
- ?? <= 소스코드
top : 최빈값
frq : 최빈값의 빈도수
ㅁ 히스토그램에서 인상적인 부분
- 수치 데이터일지라도 연속된 데이터가 아니라 끊어진 데이터가 있음을 볼 수 있음.
- 수치 데이터임에도 범주형으로 볼 수 있는 데이터도 있음을 볼 수 있음.
*sort_index()로 정렬 미 이행시
리스트를 생성하여 변수[리스트] 처리
*결측치(NaN)는 fillna()로 변경(채우기).
.fillna(0)
'멋쟁이사자처럼 AI School 8기(fin) > TIL(Today I Learn)' 카테고리의 다른 글
[멋쟁이사자처럼 AI스쿨] Day-25 TIL (0) | 2023.02.01 |
---|---|
[멋쟁이사자처럼 AI스쿨] Day24 TIL (0) | 2023.01.31 |
[멋쟁이사자처럼 AI스쿨] Day22 SQL week3 (0) | 2023.01.27 |
[멋쟁이사자처럼 AI스쿨] Day21 SQL week3 (0) | 2023.01.26 |
[멋쟁이사자처럼 AI스쿨] Day20 SQL week3 (0) | 2023.01.25 |