본문 바로가기
혼공학습단(한빛미디어)

[혼공단 10기] 혼자 공부하는 머신러닝 + 딥러닝(혼공머신) - 3주차

by #FF0000 2023. 7. 23.

혼공단10기 - 혼자 공부하는 머신러닝 + 딥러닝(혼공머신)

4장. 다양한 분류 알고리즘

 

기본 미션

04-1.로지스틱 회귀 확인 문제 2번 풀이

 

로지스틱 회귀가 이진 분류에서 확률을 출력하기 위해 사용하는 함수는 무엇인가요?

▷시그모이드 함수

  • 로지스틱 회귀가 이진 분류에서 확률을 출력하기 위해 사용하는 함수로, 
  • 선형 방정식의 출력을 0에서 1사이의 값으로 압축하며 이진 분류를 위해 사용한다.
  • (값이 무한하게 큰 음수일 경우 0에 가깝게 되고 무한하게 큰 양수가 될때는 1에 가까운 값이 된다.)
  • 정의역의 절댓값이 커질수록 기울기가 0에 수렴하게 되므로 역전파 과정에서 기울기값이 점차 사라지는 기울기 소실 문제가 발생한다.

 

 

 

선택 미션 

04-2 과대적합/과소적합 

 

import numpy as np
import matplotlib.pyplot as plt

sc = SGDClassifier(loss='log_loss', random_state=42)

train_score = []
test_score = []

classes = np.unique(train_target)

for _ in range(0, 300):
    sc.partial_fit(train_scaled, train_target, classes=classes)

    train_score.append(sc.score(train_scaled, train_target))
    test_score.append(sc.score(test_scaled, test_target))
   
plt.plot(train_score, label='train_score')
plt.plot(test_score, label='test_score')
plt.xlabel('epoch')
plt.ylabel('accuracy')
plt.legend(loc='lower right')
plt.title('에포크와 과대/과소적합')
plt.show()