본문 바로가기

전체 글

(338)
[멋쟁이사자처럼 AI스쿨] TIL(23.4.11) 딥러닝2 딥러닝 학습 개요 1) 기본 네트워크에 대한 동작 방식 학습 2) 심층신경망(DNN), Fully Connected Network(완전연결신경망), Densely Connected Network(밀집신경망) 3) 합성곱신경망(CNN) => 주로 이미지 분류에 사용. (이미지, 텍스트, 정형데이터) 4) 순환신경망(RNN) => 순서가 있는 데이터, 시계열데이터, 자연어처리 등에 주로 사용 flatten -> 2차원 이미지를 1차원으로 만들어줌 dense -> unit의 개수 (하이퍼 파라미터) 네트워크를 깊게 쌓으면 대체적으로 성능이 좋아지나, 과적합 문제 발생 가능. dropout, 여러가지 전처리, batch 사용 기울기소실 문제는 네트워크를 깊게 쌓았을 때 back propagation 과정에서 발..
[멋쟁이사자처럼 AI스쿨] TIL(23.4.10) 딥러닝 17주차 학습 목표 1) 기본 네트워크에 대한 동작 방식 학습 2) 심층신경망(DNN), Fully Connected Network, Densely Connected Network 3) 합성곱신경망(CNN) => 이미지, 텍스트 다 사용가능하지만 주로 이미지 분류에 사용 4) 순환신경망(RNN) => 순서가 있는 데이터, 시계열데이터, 자연어처리 등에 주로 사용 딥러닝 => 비정형(이미지, 영상, 텍스트, 음성)데이터에 대한 피처를 추출할 때 알고리즘 내부에서 추출 CNN(Convolutional Neural Network) 합성곱신경망, 시각적 이미지를 분석하는 데 사용, 현재 가장 많이 사용되고 있는 알고리즘 RNN(Recurrent Neural Network)의 약자로, 순환 신경망, 입력과 출력을..
[멋쟁이사자처럼 AI스쿨] TIL(23.4.7) 알고리즘, 자료구조 week2(with 이호준)
[멋쟁이사자처럼 AI스쿨] TIL(23.3.31) 알고리즘, 자료구조 week1(with 이호준) 알고리즘 성능 분석 필요성 알고리즘 측정 방법 1. 시간 복잡도(Time Complexity) : 얼마나 오랜 시간이 걸렸는가 2. 공간 복잡도(Space Complexity) : 얼마나 많은 공간을 사용하였는가 자료구조는 왜 필요할까? 새로운 자료형 개발 기존 자료형의 효율적 사용 대용량 자료형의 효율적 관리 => 문제 해결을 위해 자료구조 : 컴퓨터에서 자료를 효율적으로 관리하고 구조화시키는 방법 스택 : 데이터를 쌓아서 관리하는 구조(후입선출) 큐 : 선입선출 Q. 다음중 스택이 될 수 없는 것은? 1, 2, 3, 4, 5를 순서대로 투입 1. 1, 2, 3, 4, 5 2. 5, 4, 3, 2, 1 3. 3, 2, 1, 5, 4 4. 3, 2, 1, 5, 4, 5. 1, 3, 2, 5, 4, -> ..
[불공단] 코딩은 처음이라 with 자바, week3 1. 도서 정보 코딩은 처음이라 with 자바저자유동환출판영진닷컴발매2022.04.25. 2. 스터디 내용 ch6. 객체 지향 속으로 객체 지향 핵심 1. 자바 언어는 클래스의 추상적인 개념으로 인터페이스(interface)를 제공 2. 자바 인터페이스는 메서드 선언부와 public 상수를 가질 수 있음 3. 인터페이스로 객체를 생성할 때는 구체(concrete) 클래스가 있어야 함 4. 인터페이스를 사용하는 이유는 다형성(polymorphism)에 있음 5. 인터페이스를 사용하면 일반화된 객체를 더 잘 사용할 수 있음 6. 잘 정의된 인터페이스는 수백 줄의 코드를 간결하게 설명 7. 자식 클래스는 부모 클래스의 public 멤버 변수와 메서드를 상속. 8. 자식 클래스는 최대한 부모 클래스로 선언하여 ..
[멋쟁이사자처럼 AI스쿨] TIL(23.3.29) svd, 토픽모델링 Numpy 대규모의 수학연산 시 속도 지연을 보완 행렬, 다차원 배열 쉽게 처리 데이터 구조 외 수치계산을 위한 효율적으로 구현된 기능 제공 Numpy가 빠른 이유 벡터화 → 간결하고 읽기 쉬움 코드는 표준 수학적 표기법과 비슷, 버그가 적음 내부적으로 반복 사용 x 산술 연산 및 논리적, 비트 단위, 기능적 등의 모든 연산이 브로드캐스트 방식으로 동작 (벡터, 행렬 연산) Numpy의 zeros, ones, zeros_like, ones_like → 삼각 행렬 마스크 numpy 배열 생성 numpy 정렬 numpy 브로드캐스팅(Broadcasting) > 모양이 다른 배열들 간의 연산이 어떤 조건을 만족했을 때 가능해지도록 배열을 자동적으로 변환하는 것 1. 맴버가 하나인 배열은 어떤 배열에나 브로드캐..
[진짜쓰는 실무엑셀] 3주 챌린지 - week3 week3. 23.3.25- 3.31 스터디 노트 1. 실무 데이터 시각화의 핵심 요소 직장인에게 데이터 시각화란, "내가 보여주고자 하는 (또는 상대방이 보고 싶어하는) 주제를 이해하기 쉽게 효과적으로 전달하는 것" A 보고서 → 직관적인 내용 파악의 어려움 '무엇을 전달하고 싶은지'에 대한 주제 불분명 제품별 판매량 분석시 '판매량' 기준 내림차순 정렬이 필요하나, 제품 이름 기준 오름차순 정렬 상태. 보고서 내용의 숫자 단위 및 천 단위 구분 기호 누락 B 보고서 → 직관적인 내용 파악의 용이함 판매량 기준 내림차순 정렬 및 스파크 라인 차트 배치 천 단위 구분 기호 추가 판매량이 급격하게 감소한 항목 강조 시각화 차트 구성시 고려할점 디자인 요소는 '색감' 무엇을 전달할지 명확하게 표현 어떻게 전..
[멋쟁이사자처럼 AI스쿨] TIL(23.3.28) 텍스트 분석, 자연어처리2 0802 실습 단어-벡터화 결과를 모델로 예측하기 - ‘코로나’라는 단어가 들어가는 문장을 보건으로, 나머지를 교통으로 분류 - sklearn의 featureselection.text의 CountVectorizer 사용하여 df[‘문서’]를 벡터화 - CountVectorizer는 bow(bag of words)라는 벡터화 기법. 단어의 출현빈도만 고려하고 순서는 무시하여 의미를 잃을 수 있다는 단점이 있음. - DecisionTreeClassifier로 분류하고, 다양한 시각화를 진행함 0803 실습 KoNLPy 형태소 분석기를 사용해 조사, 어미, 구두점을 제거하고, 모델로 분류하기 - 정규표현식 사용해 한글, 영문, 숫자만 남기고 제거하기 - Okt 클래스를 이용해 형태소 분석하기 morphs → ..