본문 바로가기

전체 글

(338)
[코칭스터디 8기] 데이터 사이언스 2022 수료. 코칭스터디 8기 데이터 사이언스 2022 수료.(리드부스터) 22.10.27 - 11.24
[멋쟁이사자처럼 AI스쿨] TIL(23.2.28) * 비즈니스 데이터 분석 Q. 왜 고객의 가치를 평가해야 할까? A. 한정된 자원 -> 효율을 극대화하기 위해 고객 가치 평가, 차별화 마케팅 전략 수립 필 * AARRR > 시장 진입 단계에 맞는 특정 지표를 기준으로 서비스의 상태를 가늠 할 수 있는 효율적인 기준. > 현 시점 가장 핵심적인 지표에 집중 Acquisition : 어떻게 우리 서비스를 접하고 있는가? Activation : 사용자가 처음 서비스를 이용할 때 긍정적인 경험을 제공하는가? Retention : 서비스 재 사용률은 어떻게 되는가? Referral : 사용자가 자발적 바이럴, 공유를 일으키는가? Revenue : 매출로 연결 되고 있는가? Q. 소매, 리테일 서비스에 머신러닝을 어떻게 활용할 수 있는가? A. 고객 분석 - 개..
[멋쟁이사자처럼 AI스쿨] mid project #1. 회고 미드 프로젝트 #1 회고. 23.2.20 - 23.2.26 짧고도 길었던 미드 프로젝트1의 테마는 EDA. 최초, 주제 선정시 아이템은 '노인'이었다. 고령화와 관련된 사안들을 경제, 복지, 건강의 카테고리에서 분석해 보는것이었는데, 자료 수집 및 1차 데이터 EDA가 들어간 시점에서 주제가 너무 광범위하고, 도출될 결론이 너무 당연할 수 있다는 피드백을 받아 결국 폐기... 하지만, 노인에서 파생된 '노인 무임승차'를 소재로 서울교통공사의 적자와 노인 무임승차 연령 상한을 주제로 삼아 새로운 분석을 수행하게 된다. 메인 주제 선정후, 세부 분석의 여러가지 카테고리중, 재무제표를 통한 분석이 필요할 것 같다는 의견이 있었고, 이는 경영학과 출인인 나에게 토스되어 공시된 정보를 통해 회사의 상황을 정확히 ..
[멋쟁이사자처럼 AI스쿨] TIL(23.2.27) 스토리지 사이즈를 줄이는 방법, 파일 사이즈를 효율적으로 관리하는 방법 : paquet. 파일 포맷을 통해 파일 용량을 줄이는 방법, 메모리 사이즈를 줄이는 방법, 메모리를 효율적으로 관리하는 방법 : downcast ㅁ 기존 ETL(data warehouse 구축) 방식에서 ELT (data lake)방식으로 저장 ETL(Extract, Transform, Load)과 ELT(Extract, Load, Transform)는 데이터 웨어하우스에 데이터를 수집, 가공, 저장하는 방법론 중 하나. ETL은 데이터를 추출하여(Extract) 전처리 및 가공(Transform)한 후, 데이터 웨어하우스에 적재(Load). ㅁ 바이너리 프리픽스(binary prefix) ▶ 1024로 나누어서 파일 단위를 표기하..
[서평] 나도코딩의 파이썬 입문(길벗) 이번에 서평할 책은 나도코딩의 파이썬입문 입니다. 1. 책 정보 책 제목 : 코딩 자율학습 - 나도코딩의 파이썬 입문 저자 : 나도코딩 페이지수 : 436p 목차 : 하단 사진 첨부 출판사 : 길벗 2. 저자 소개 나도코딩. 누구나 쉽고 재미있게 코딩을 공부할 수 있도록 다양한 강의를 제공하는 유튜버이자 개발자. 유튜브 https://www.youtube.com/@nadocoding 블로그 https://nadocoding.tistory.com 나도코딩 코딩, 쉽고 재미있게 배우세요 nadocoding@gmail.com www.youtube.com 3.읽기 전 기대 코딩 입문 언어로 추천받는 '파이썬'을 초보자가 쉽게 따라 할 수 있으며, 파이썬 사용을 위한 필수 문법이 책에 담겨 있는가? 4. 서평 책..
[멋쟁이사자처럼 AI스쿨] Day36 - TIL with 통계 독립변수가 범주형인 경우 범주형 변수는 기울기를 곱할 수 없음 연속 변수로 변환하여 모형에 투입 가장 많이 사용하는 것은 더미 코딩 dummy coding 더미 코딩 dummy coding 범주형 변수에 범주가 k 개 있을 경우 k 1 개의 더미 변수를 대신 투입 범주 중에 하나를 기준 reference 로 지정 기본적으로 ABC 순으로 먼저 나오는 것이 기준 변경할 수도 있음 기준를 제외한 범주들은 범주별로 더미 변수를 하나씩 가짐 더미변수는 해당 범주일 경우에만 고려 더미변수의 기울기는 기준과의 차이를 의미
[태블로 신병훈련소] 신병훈련소 10일차 with 17th
[멋쟁이사자처럼 AI스쿨] 통계 4일차 회고 Q. 회귀분석의 종속변수는? ▶ 연속형 선형모형 : y = wx + b 종속변수 : y x가 어떻게 되느냐에 따라서 y가 정해지기 때문에 y를 '종속'변수라 부름 Q. 선형 모형의 식 y = wx + b에서 w의 의미는? ▶ x가 1 변화할때 y 변화량 y = b (x=0) y = w + b (x=1) y = 2w + b (x=2) Q. 선형 모형의 식 y = wx + b에서 b의 의미는? ▶ x가 0일 때 y의 값 Q. 독립변수 x의 기울기가 +이면, 다른 조건이 같을 때 독립변수 x가 증가할 수록 종속변수 y는 ▶ 증가한다. Q. 선형 회귀분석에서 일반적인 추정방법은 잔차분산을 어떻게 만드는 계수를 찾는가? ▶ 최소로 (작을수록 좋다) 잔차 = 실제값 - 예측값 잔차 분산 = 평균(잔차^2) 편차 =..