분류 전체보기 (348) 썸네일형 리스트형 [멋쟁이사자처럼 AI스쿨] Week7 - WIL Week6(1.23~1.27) WIL은 설날 + SQL Week3 대체로 이번 Week7 WIL을 작성한다. > Week7(1.30~2.1) 학습내용 Pandas를 통한 파일 저장과 불러오기 shape를 통한 행과 열의 수 보기 head, tail, sample 을 통한 일부 데이터 가져오기 DataFrame의 info(), describe() 등을 통한 요약과 기술통계 값 구하기 info() describe() nunique() index columns values Pandas의 DataFrame과 Series의 이해 Series : 1차원 벡터구조 DataFrame : 2차원 행렬구조 색인하기 [컬럼] .loc[행] .loc[행, 열] .loc[조건식, 열] DataFrame의 데이터 타입 이해하기 .. [멋쟁이사자처럼 AI스쿨] Day-25 TIL 보통은 정규분포 형태가 가장 이상적인 형태입니다. 그런데 현실세계에서는 정규분포 형태의 모양을 띄는 경우가 많지 않습니다. 머신러닝, 딥러닝 등을 할 때는 정규분포 형태로 분포의 모양을 변경해 주기도 합니다. ㅁ 왜도 비대칭도(非對稱度, skewness) 또는 왜도(歪度)는 실수 값 확률 변수의 확률 분포 비대칭성을 나타내는 지표이다. 왜도의 값은 양수나 음수가 될 수 있으며 정의되지 않을 수도 있다. 왜도가 음수일 경우에는 확률밀도함수의 왼쪽 부분에 긴 꼬리를 가지며 중앙값을 포함한 자료가 오른쪽에 더 많이 분포해 있다. 왜도가 양수일 때는 확률밀도함수의 오른쪽 부분에 긴 꼬리를 가지며 자료가 왼쪽에 더 많이 분포해 있다는 것을 나타낸다. 평균과 중앙값이 같으면 왜도는 0이 된다. ㅁ 첨도 첨도(尖度,.. [멋쟁이사자처럼 AI스쿨] Day24 TIL ㅁ EDA Exploratory Data Analysis, 탐색적 데이터 분석 데이터 자체에 대한 해석이 잘못되어 있다면, 해당 데이터에 대한 분석 결과도 잘못될 확률이 매우 큽니다. 데이터에 대한 이해, 즉 데이터가 의미를 정확히 파악하고 해석하고, 그 후에 가정을 설정해야합니다. *.isin() : 조건이 정확히 일치 *.str.contains() : 조건을 포함, 시리즈에서만 사용 가능. 문자열/특정 데이터 타입에서만 사용 가능 https://pandas.pydata.org/docs/reference/series.html#string-handling ㅁ 선 그래프와 막대 그래프 선 그래프 ⇒ 연속된 수치 데이터에 주로 사용합니다. 막대 그래프 ⇒ 연속되지 않은 (주로 범주형) 데이터에 주로 사용합니.. [멋쟁이사자처럼 AI스쿨] Day23 TIL ㅁ 데이터를 분석하는 이유? => 데이터를 어떻게 보여줄 것인가? 요약? 전체? ㅁ 파이썬 시각화 => matpoltlib, 정적 시각화 단점 : 한글 지원x 한글 폰트 설정 (!pip install koreanize-matplotlib) cf.) plotly : 동적 시각화, javascript ㅁ from glob import glob # '폴더명' 폴더의 '파일명.확장자'에 해당하는 모든 파일 보여줌 glob("폴더명"/"파일명.확장자") ㅁ jupyter notebook 내 ? 사용 ? [멋쟁이사자처럼 AI스쿨] mini project #1-2. API mini project part.2 주제 : API - KOSIS의 '미분양주택현황' 조회 수집 Kosis - 미분양주택현황 (https://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1YL202001E&vw_cd=MT_GTITLE01&list_id=107&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=MT_GTITLE01) 주제 선정 이유 : 서울시의 미분양 주택 현황을 '지역구' 기준, 3개년도를 비교 분석하는 데이터 작성 및 시각화 도전. 시각화는 folium을 통한 지도 작성 *api 과제는 PublicDateReader api를 통해 진행 (https://github.com/Financ.. [멋쟁이사자처럼 AI스쿨] mini project #1-1. Web_scraping 늦게쓰는 미니 프로젝트 회고. 오늘은 23년 1월 30일. 22년 12월 19일에 시작했던 멋쟁이 사자처럼 AI스쿨 8기 과정이 시작한지 벌써 1/4 지점이 지난 시점. 지난 1월 18일에시작되고 1월 29일에 마무리 되었던 mini project 회고를 작성한다. (과제 중간 작성하려 했으나, 실패... 다음부터는 중간 작성에 도전!) mini project part.1 주제 : 웹 스크래핑 - 나라장터 '입찰 공고 목록 수집' 나라장터 (https://www.g2b.go.kr/index.jsp) 주제 선정 이유 : 기존에 학습했던 웹 스크래핑의 데이터 및 사이트는 모두 정형화 되어있는 포맷(틀)을 가지고 있어서 마지막 페이지와 table의 tag값, class명 등을 통해 '일괄' 수집 및 처리가 가.. [멋쟁이사자처럼 AI스쿨] Day22 SQL week3 ㅁ Union : 합집합 union all : 중복 포함 결합 union distinct : 중복 제외 결합 ㅁ intersect : 교집합 INTERSECT DISTINCT ㅁ except : 차집합 except DISTINCT ㅁ Sub Query : 다른 SQL문 안에 중첩된 SELECT 문 ㅁ with(Common Table Expressions) with 절은 쿼리 내에서 임시 결과를 정의하고 사용합니다. 주요 사용 목적은 복잡한 추출 과정을 분할하여 단계적으로 처리하면서 전체 데이터 추출과정을 단순화시키는 것 cf) CTE(유사 테이블) [멋쟁이사자처럼 AI스쿨] Day21 SQL week3 ㅁ 조건문 case if(조건 , 참, 거짓) ㅁ join 이전 1 ··· 36 37 38 39 40 41 42 ··· 44 다음