본문 바로가기
멋쟁이사자처럼 AI School 8기(fin)/WIL(Week I Learn

[멋쟁이사자처럼 AI스쿨] Week7 - WIL

by #FF0000 2023. 2. 2.

 

 

Week6(1.23~1.27) WIL은 설날 + SQL Week3 대체로

이번 Week7 WIL을 작성한다.

 

>  Week7(1.30~2.1) 학습내용

  • Pandas를 통한 파일 저장과 불러오기
    • shape를 통한 행과 열의 수 보기
    • head, tail, sample 을 통한 일부 데이터 가져오기
  • DataFrame의 info(), describe() 등을 통한 요약과 기술통계 값 구하기
    • info()
    • describe()
    • nunique()
    • index
    • columns
    • values
  • Pandas의 DataFrame과 Series의 이해
    • Series : 1차원 벡터구조
    • DataFrame : 2차원 행렬구조
  • 색인하기
    • [컬럼]
    • .loc[행]
    • .loc[행, 열]
    • .loc[조건식, 열]
  • DataFrame의 데이터 타입 이해하기
    • 날짜 데이터의 변환
  • DataFrame 다루기
    • 열(column) 인덱싱
    • 행(index) 인덱싱
    • 행, 열 인덱싱
    • 정렬하기 : sort_values 사용하기
    • 조건식 사용하기
  • 빈도수 구하기
    • 한 개의 변수 : series.value_counts()
    • 두 개의 변수 : pd.crosstab()
  • groupby 와 pivot_table

==========================================================================================

 

ㅁ 데이터 시각화

  • pandas를 이용한 시각화
  • plotly를 사용한 시각화
  • matplotlib을 적용한 시각화

 

파이썬을 활용한 시각화는 크게 동적과 정적으로 카테고리 분류가 가능하다.

동적인 시각화는 javascript 기반의 plotly가 대표적이고

정적인 시각화는 pandas와 seaborn이 대표적이다.

 

 

https://www.youtube.com/watch?v=ZTRKojTLE8M

 

 

https://www.youtube.com/watch?v=ZTRKojTLE8M

 

 

상태기반방식(state base) : 순서대로 그리는 방식. 결과물의 일부를 수정시 해당 코드로 올라가서 수정

                                            plt.

객체지향방식(object oriented): 대상을 지정해 그리는 방식. 결과물의 일부를 수정하기에 유리함. 레이아웃 사전 설정.     

                                                  ax. 

https://www.youtube.com/watch?v=ZTRKojTLE8M

 

ㅁ EDA

 

1. merge를 이용한 key 기준 데이터 병합.

    merge("데이터", left_on="columns", right_on="columns")

오늘코드- 박조은

2. concat을 이용한 axis 기준 데이터 병합