본문 바로가기

멋쟁이사자처럼 AI School 8기(fin)

[멋쟁이사자처럼 AI스쿨] Day-25 TIL 보통은 정규분포 형태가 가장 이상적인 형태입니다. 그런데 현실세계에서는 정규분포 형태의 모양을 띄는 경우가 많지 않습니다. 머신러닝, 딥러닝 등을 할 때는 정규분포 형태로 분포의 모양을 변경해 주기도 합니다. ㅁ 왜도 비대칭도(非對稱度, skewness) 또는 왜도(歪度)는 실수 값 확률 변수의 확률 분포 비대칭성을 나타내는 지표이다. 왜도의 값은 양수나 음수가 될 수 있으며 정의되지 않을 수도 있다. 왜도가 음수일 경우에는 확률밀도함수의 왼쪽 부분에 긴 꼬리를 가지며 중앙값을 포함한 자료가 오른쪽에 더 많이 분포해 있다. 왜도가 양수일 때는 확률밀도함수의 오른쪽 부분에 긴 꼬리를 가지며 자료가 왼쪽에 더 많이 분포해 있다는 것을 나타낸다. 평균과 중앙값이 같으면 왜도는 0이 된다. ㅁ 첨도 첨도(尖度,.. 더보기
[멋쟁이사자처럼 AI스쿨] Day24 TIL ㅁ EDA Exploratory Data Analysis, 탐색적 데이터 분석 데이터 자체에 대한 해석이 잘못되어 있다면, 해당 데이터에 대한 분석 결과도 잘못될 확률이 매우 큽니다. 데이터에 대한 이해, 즉 데이터가 의미를 정확히 파악하고 해석하고, 그 후에 가정을 설정해야합니다. *.isin() : 조건이 정확히 일치 *.str.contains() : 조건을 포함, 시리즈에서만 사용 가능. 문자열/특정 데이터 타입에서만 사용 가능 https://pandas.pydata.org/docs/reference/series.html#string-handling ㅁ 선 그래프와 막대 그래프 선 그래프 ⇒ 연속된 수치 데이터에 주로 사용합니다. 막대 그래프 ⇒ 연속되지 않은 (주로 범주형) 데이터에 주로 사용합니.. 더보기
[멋쟁이사자처럼 AI스쿨] Day23 TIL ㅁ 데이터를 분석하는 이유? => 데이터를 어떻게 보여줄 것인가? 요약? 전체? ㅁ 파이썬 시각화 => matpoltlib, 정적 시각화 단점 : 한글 지원x 한글 폰트 설정 (!pip install koreanize-matplotlib) cf.) plotly : 동적 시각화, javascript ㅁ from glob import glob # '폴더명' 폴더의 '파일명.확장자'에 해당하는 모든 파일 보여줌 glob("폴더명"/"파일명.확장자") ㅁ jupyter notebook 내 ? 사용 ? 더보기
[멋쟁이사자처럼 AI스쿨] mini project #1-2. API mini project part.2 주제 : API - KOSIS의 '미분양주택현황' 조회 수집 Kosis - 미분양주택현황 (https://kosis.kr/statHtml/statHtml.do?orgId=101&tblId=DT_1YL202001E&vw_cd=MT_GTITLE01&list_id=107&seqNo=&lang_mode=ko&language=kor&obj_var_id=&itm_id=&conn_path=MT_GTITLE01) 주제 선정 이유 : 서울시의 미분양 주택 현황을 '지역구' 기준, 3개년도를 비교 분석하는 데이터 작성 및 시각화 도전. 시각화는 folium을 통한 지도 작성 *api 과제는 PublicDateReader api를 통해 진행 (https://github.com/Financ.. 더보기
[멋쟁이사자처럼 AI스쿨] mini project #1-1. Web_scraping 늦게쓰는 미니 프로젝트 회고. 오늘은 23년 1월 30일. 22년 12월 19일에 시작했던 멋쟁이 사자처럼 AI스쿨 8기 과정이 시작한지 벌써 1/4 지점이 지난 시점. 지난 1월 18일에시작되고 1월 29일에 마무리 되었던 mini project 회고를 작성한다. (과제 중간 작성하려 했으나, 실패... 다음부터는 중간 작성에 도전!) mini project part.1 주제 : 웹 스크래핑 - 나라장터 '입찰 공고 목록 수집' 나라장터 (https://www.g2b.go.kr/index.jsp) 주제 선정 이유 : 기존에 학습했던 웹 스크래핑의 데이터 및 사이트는 모두 정형화 되어있는 포맷(틀)을 가지고 있어서 마지막 페이지와 table의 tag값, class명 등을 통해 '일괄' 수집 및 처리가 가.. 더보기
[멋쟁이사자처럼 AI스쿨] Day22 SQL week3 ㅁ Union : 합집합 union all : 중복 포함 결합 union distinct : 중복 제외 결합 ㅁ intersect : 교집합 INTERSECT DISTINCT ㅁ except : 차집합 except DISTINCT ㅁ Sub Query : 다른 SQL문 안에 중첩된 SELECT 문 ㅁ with(Common Table Expressions) with 절은 쿼리 내에서 임시 결과를 정의하고 사용합니다. 주요 사용 목적은 복잡한 추출 과정을 분할하여 단계적으로 처리하면서 전체 데이터 추출과정을 단순화시키는 것 cf) CTE(유사 테이블) 더보기
[멋쟁이사자처럼 AI스쿨] Day21 SQL week3 ㅁ 조건문 case if(조건 , 참, 거짓) ㅁ join 더보기
[멋쟁이사자처럼 AI스쿨] Day20 SQL week3 ㅁ SQL 숫자 함수 Round round 함수는 해당 항목 레코드의 숫자를 반올림하여 출력 Trunc trunc 함수는 해당 항목 레코드의 숫자를 내림(절삭)하여 출력 mod 함수는 해당 항목 레코드의 숫자를 나누기하여 나머지를 출력 power 함수는 해당 항목 레코드의 숫자를 제곱하여 출력 sqrt 함수는 해당 항목 레코드의 제곱근을 출력 ㅁ 문자열 함수 SUBSTR 문자열의 일부만 출력 LEFT 문자열을 왼쪽에서 얼만큼 자를 지 설정한 후에 조회 RIGHT 문자열을 오른쪽에서 얼만큼 자를 지 설정한 후에 조회 CONCAT 여러 문자열을 하나로 연결 연결연산자(||)으로도 연결 LOWER 문자열을 모두 소문자로 변경 UPPER 문자열을 모두 대문자로 변경 INITCAP 앞에 문자만 대문자로 REPLA.. 더보기