본문 바로가기
혼공학습단

[혼공단 10기] 혼자 공부하는 머신러닝 + 딥러닝(혼공머신) - 1주차

by #FF0000 2023. 7. 9.

 

혼공단10기 - 혼자 공부하는 머신러닝 + 딥러닝(혼공머신)

1주차  ~ 23. 7. 9

 

1장. 나의 첫 머신러닝

01-1. 인공지능과 머신러닝, 딥러닝

키워드 정리

인공지능

사람처럼 학습하고 추론할 수 있는 지능을 가진 시스템을 만드는 기술. 강인공지능(인공일반지능, 영화 속 인공지능)과 악인공지능(현실에서 마주하고 있는 인공지능)

머신러닝

규칙을 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야. 사이킷런.

딥러닝

인공 신경망. 텐서플로&파이토치

 

 

01-2. 코랩과 주피터 노트북

확인문제.

1. 구글에서 제공하는 웹 브라우저 기반의 파이썬 실행 환경은?

▷ 코랩

 

2. 코랩 노트북에서 쓸 수 있는 마크다운 중 기울임 꼴로 쓰는 것은?

▷ _혼공머신_ (*혼공머신*)

 

3. 코랩 노트북은 어디에서 실행 되는가?

▷ 구글 클라우드

 

 

01-3. 마켓과 머신러닝

K-최근접 이웃 알고리즘 실습 코드 정리.

 

matplotlib을 활용한 시각화

 

확인문제.

1. 데이터를 표현하는 하나의 성질로써, 국가 데이터의 경우 인구 수, GDP, 면적 등이 하나의 국가를 나타내는데, 머신러닝에서 이런 성질을 무엇이라 부르는가?

▷ 특성(feature)

 

2. 가장 가까운 이웃을 참고하여 정답을 예측하는 알고리즘이 구현된 사이킷런 클래스는?

▷ KNeighborsClassifier(k-최근접 이웃 알고리즘)

 

3. 사이킷런 모델을 훈련할 때 사용하는 메서드?

  fit()

 

4. 코드 완성

 

2장. 데이터 다루기

02-1. 훈련 세트와 테스트 세트

 

확인문제.

1. 머신러닝 알고리즘의 한 종류로서 샘플의 입력과 타깃(정답)을 알고 있을 때 사용할 수 있는 학습 방법은?

  지도 학습

 

2. 훈련 세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못하는 현상?

  샘플링 편향(훈련 세트나 테스트 세트가 잘못 샘플링 되어 전체 데이터를 대표하지 못하는 현상)

 

3. 사이킷런은 입력 데이터(배열)가 어떻게 구성?

  행 : 샘플, 열 :  특성

 

 

 

02-2. 데이터 전처리

 

확인문제.

1. 스케일 조정 방식의 하나로 특성값을 0에서 표준편차의 몇 배수만큼 떨어져 있는지로 변환한 값

  표준점수

 

2. 테스트 세트의 스케일 조정시 어떤 데이터의 통계 값을 사용?

  훈련 세트