본문 바로가기

딥러닝

[멋쟁이사자처럼 AI스쿨] TIL(23.4.18) 전이학습 전이 학습 하나의 문제에서 학습된 기능을 가져와 유사한 새 문제에 활용하는 것으로 구성 일반적으로 데이터 세트의 데이터가 너무 적어 전체 규모 모델을 처음부터 훈련할 수 없는 작업에 대해 수행 ex) 너구리를 식별하는 방법을 학습한 모델의 기능은 타누키를 식별하기 위한 모델을 시작하는 데 유용 전이 학습의 일반적인 워크플로우 이전에 훈련된 모델에서 계층을 가져옵니다. 향후 훈련 라운드 동안 포함된 정보가 파괴되지 않도록 동결하십시오. 동결된 레이어 위에 학습 가능한 새 레이어를 추가합니다. 그들은 이전 기능을 새로운 데이터 세트에 대한 예측으로 바꾸는 방법을 배웁니다. 데이터 세트에서 새 레이어를 교육합니다. 마지막 선택적 단계는 위에서 얻은 전체 모델(또는 그 일부)을 고정 해제하고 매우 낮은 학습률로.. 더보기
[멋쟁이사자처럼 AI스쿨] TIL(23.4.17) CNN 이미지의 사이즈가 불규칙하면 학습을 할 수 없기 때문에 리사이즈할 크기를 지정 # 이미지가 너무 작으면 왜곡이 되거나 특징을 잃어버릴 수도 # 하지만 계산량이 줄어들어 학습속도가 빨라짐 # 이미지가 너무 크면 확대를 하여 왜곡이 될 수도 있지만, 더 자세하게 학습 # 하지만 계산량이 많아서 시간이 오래 소요 => 원본이미지, 계산 시간, 계산 성능에 대한 신뢰를 고려해서 설정 CNN(합성곱신경망) Convolution Neural Network -다층 퍼셉트론(MLP)로 이미지를 flat하게 펼쳐 학습하면 이미지의 지역적 정보(topological information) 소실 >> 합성곱층의 뉴런은 수용 영역(receptive field)안에 있는 픽셀에만 연결하여 이미지의 지역적 정보를 보유 - 다층 .. 더보기
[멋쟁이사자처럼 AI스쿨] TIL(23.4.12) 딥러닝3 TensorFlow => scikit-learn style API 와 유사 PyTorch => NumPy API 와 유사 batch => 작게 지정하면 학습을 더 빠르게 진행할 수 있으나, 클래스가 여러개인 분류 문제에서 클래스가 불균형하게 학습하지 않도록 주의가 필요합니다 sigmoid => activation function 으로 사용했지만, 기울기 소실 문제 때문에 활성화 함수(activation function)로는 잘 사용하지 않고 이진 분류의 출력을 확률 값으로 만들어 줄 때 사용합니다. 0~1사이의 값으로 출력합니다. softmax => 분류의 output logit 값에 대한 확률 변환을 할 때 사용합니다. 클래스의 수 만큼 출력이 되며 모든 클래스를 다 더했을 때 1이 됩니다. 클래스가 .. 더보기
[멋쟁이사자처럼 AI스쿨] TIL(23.4.11) 딥러닝2 딥러닝 학습 개요 1) 기본 네트워크에 대한 동작 방식 학습 2) 심층신경망(DNN), Fully Connected Network(완전연결신경망), Densely Connected Network(밀집신경망) 3) 합성곱신경망(CNN) => 주로 이미지 분류에 사용. (이미지, 텍스트, 정형데이터) 4) 순환신경망(RNN) => 순서가 있는 데이터, 시계열데이터, 자연어처리 등에 주로 사용 flatten -> 2차원 이미지를 1차원으로 만들어줌 dense -> unit의 개수 (하이퍼 파라미터) 네트워크를 깊게 쌓으면 대체적으로 성능이 좋아지나, 과적합 문제 발생 가능. dropout, 여러가지 전처리, batch 사용 기울기소실 문제는 네트워크를 깊게 쌓았을 때 back propagation 과정에서 발.. 더보기
[멋쟁이사자처럼 AI스쿨] TIL(23.4.10) 딥러닝 17주차 학습 목표 1) 기본 네트워크에 대한 동작 방식 학습 2) 심층신경망(DNN), Fully Connected Network, Densely Connected Network 3) 합성곱신경망(CNN) => 이미지, 텍스트 다 사용가능하지만 주로 이미지 분류에 사용 4) 순환신경망(RNN) => 순서가 있는 데이터, 시계열데이터, 자연어처리 등에 주로 사용 딥러닝 => 비정형(이미지, 영상, 텍스트, 음성)데이터에 대한 피처를 추출할 때 알고리즘 내부에서 추출 CNN(Convolutional Neural Network) 합성곱신경망, 시각적 이미지를 분석하는 데 사용, 현재 가장 많이 사용되고 있는 알고리즘 RNN(Recurrent Neural Network)의 약자로, 순환 신경망, 입력과 출력을.. 더보기