본문 바로가기

전체 글297

[멋쟁이사자처럼 AI스쿨] TIL(23.3.21) XGBoost, LightBGM portable 이식성이 높다 다른 프로그래밍 언어를 지원하기 적합한 구조로 설계, 여러 언어 지원. 배깅 병렬트리를 여러 개 생성, 오버피팅에 좀 더 덜 취약. 랜덤포레스트, ExtraTree 부스팅 순차적으로 트리를 생성, 오버피팅에 좀 더 취약하며, 개별 트리의 성능이 중요할 때 사용. GBM, XGBoost, LightGBM, CatBoost XGBoost xgboost는 GBT에서 병렬 학습을 지원하여 학습 속도가 빨라진 모델. 기본 GBT에 비해 더 효율적이고, 다양한 종류의 데이터에 대응할 수 있으며 이식성이 높음. 모든 가능한 트리를 나열하여 최적 트리를 찾는 것은 거의 불가능 2차 근사식을 바탕으로 한 손실함수를 토대로 매 iteration마다 하나의 leaf로부터 가지를 늘려나가는 것이.. 2023. 3. 21.
[멋쟁이사자처럼 AI스쿨] TIL(23.3.20), RandomSearchCV 한쪽에 치우쳐진 데이터 -> 모델이 골고루 학습하기 어려움 -> log1p로 정규분포에 가깝게 만들어줘 모델이 학습하기 쉽도록 해줌! Label Smoothing 이란? log1p - 회귀 모델에서 사용할 수 있는 레이블 스무딩(Label Smoothing) 기법 예시 ) - 데이터 정규화(regularization)에 많이 사용되는 테크닉이며 모델의 일반화 성능을 높여주기도 한다. - label을 있는 그대로 사용하는 것이 아닌, 조금 Smooth 하게 만들어 정규화 시키는 것이다 Boosting 부스팅은 약한 트리 모델을 여러개를 순차적으로 연결해서 강한 트리 모델을 만들어 내는 앙상블 방식 RandomizedSearchCV parameter 종류 - n_iter : CV 가 검증을 해볼 파라미터 조.. 2023. 3. 20.
[불공단] 코딩은 처음이라 with 자바, week1 원글 url : https://cafe.naver.com/codingbeginner/5683 코딩 언어의 3대장 자바 입문기, 코딩은 처음이라 with 자바 2. 스터디 하신 흔적을 이미지로 올려주세요! ▶ 실습중인 이미지, 도서와 모니터이미지, 스터디 기록이 담겨있는 도서 이미지 등 평소 파이썬을 활용해 데이터 분석(E... cafe.naver.com 1. 스터디 진행 중인 도서 정보가 담겨 있는 URL을 남겨주세요. ▶ 상단 글감 첨부, 온라인 서점 도서 링크 등 코딩은 처음이라 with 자바저자유동환출판영진닷컴발매2022.04.25. 2. 스터디 하신 흔적을 이미지로 올려주세요! ▶ 실습중인 이미지, 도서와 모니터이미지, 스터디 기록이 담겨있는 도서 이미지 등 ​ ​ 평소 파이썬을 활용해 데이터 분.. 2023. 3. 18.
[진짜쓰는 실무엑셀] 3주 챌린지 - week1 week1. 23.3.11- 3.17 스터디 노트 1. 주요 단축키 빠른 채우기 실행 : ctrl + E 셀 서식 대화상자 : ctrl + 1 연속된 범위 선택 : ctrl + A 새로운 행, 열 삽입 : ctrl + + 표의 끝까지 한번에 선택 : ctrl + shift + 방향키 숫자 서식(#,##0) : ctrl + shift + 1 백분율 서식(%) : ctrl + shift + 5 2. 데이터는 '숫자'와 '문자'로 구분. 2-1. 엑셀에서 '숫자'와 '문자'를 구분해서 사용해야 하는 이유 1. 셀 값이 숫자처럼 보이지만, 문자 형태로 지정되면 오류로 인식. 2. 숫자의 '문자' 형태 입력시 수식 계산 불가(필터 제외) 2-2. 숫자와 문자를 구분하는 방법 1. 숫자는우측정렬, 문자는 좌측정렬을.. 2023. 3. 17.
[멋쟁이사자처럼 AI스쿨] TIL(23.3.17 ) - 태블로3 with 강승일 태블로 week3 대시보드 대시보드 생성 시 유의점 1. 복수 개의 시트로 구성 시트들 간의 상호 작용 존재 발견 > 탐색 > 인사이트의 과정 2. 대시보드를 보는 사람이 누구인가?. > 한 눈에 주요 지표를 알 수 있도록 구성 3. 어떤 디바이스로 대시보드를 보는가? > 디바이스에 따라 구성하는 대시보드의 형태가 다름. 4. Sweet Spot > 특정한 화면을 볼 때 시선이 가장 먼저, 가장 많이 가는 곳 5. 직접 참여 유도 > Data Literacy 관점. 매개변수, 대시보드 동작 활용 => 청중의 참여 유도 6. 빠른 시간 내 탐색 및 인사이트를 찾도록 구성 > 콘텐츠 제작자의 의도대로 활용할 수 있도록 가이드 제공 Wrap up ▶ 대시보드는 제작자의 만족을 위해서가 아니라 보는 사람 기준으.. 2023. 3. 17.
[멋쟁이사자처럼 AI스쿨] week13 - WIL AIS8 week13 23.3.13 - 3.15, 머신러닝 0601 파일 회귀 모델을 사용해 보기 회귀 모델의 평가 측정 공식 R square Score, MAE, MSE, RMSE, RMSLE 알아보기 ExtraTreeRegressor 모델 사용 CrossValidation 사용 어떤 피처를 선택하는게 중요한지 => Baseline 점수 만들기 0602 파일 로그를 변환하고 다시 원래 값으로 복원하는 방법 GridSearchCV Gradient Boosting 모델 모델의 성능을 향상시키는 다양한 방법 데이터 수집: 교육 예제의 수 늘리기 특성 처리: 더 많은 변수 추가 및 특성 처리(전처리, feature engineering) 향상 모델 파라미터 튜닝: 학습 알고리즘에서 사용하는 교육 파라미터의 대.. 2023. 3. 16.