본문 바로가기
멋쟁이사자처럼 AI School 8기(fin)

[멋쟁이사자처럼] 통계학 day2 정리

by #FF0000 2023. 2. 15.

 

 

신뢰 구간은 통계량 ± 오차범위

신뢰구간 = 구간 추정 방법

통계량: 표본에서 계산한 값 통계량은 모수와 차이가 있다

-> 표본 오차 오차가 어느 정도 날지를 이론적으로 예측하거나 시뮬레이션을 해서 오차범위를 구하면

통계량 ± 오차범위로 신뢰구간을 구하여 추정

 

신뢰 수준이 높을수록 신뢰 구간은 넓다

▶ 신뢰수준 : 얼마나 많은 경우를 포함하는가?

  • 95% 신뢰수준 : 95%의 경우는 포함, 5% 배제
    • 한정적 경우만 반영 -> 오차범위도 작아지게 됨
  • 99% 신뢰수준 : 99%의 경우는 포함, 1% 배제
    • 더 많은 경우를 반영 -> 오차범위가 커지게 됨

 

 

표본이 클수록 신뢰 구간은 좁다

표본이 커지면 커질수록 통계량은 모수 근처에서 나오게 됨.

데이터를 많이 모으면 통계량이 정확하다. = 오차가 적다

신뢰구간 = 통계량 ± 오차범위

 

 

두 집단의 평균을 비교할 때, 보통 귀무 가설의 형태는 두 집단의 평균은 같다(차이가 없다)

  • 평균은 같다 : 평균A - 평균B = 0
    • 0이라는 숫자 하나로 정확하게 나오는 구체적 가설.
  • 평균은 다르다 : 평균A - 평균B = 1, 2, 3....
    • 무한히 다양한 흐리멍텅한 가설 -> 입증/반증이 어려움

 

 

귀무가설은 P < 유의수준 에서 기각

 

신뢰수준이 99%이면, 유의수준 1%에 해당

유의수준 5% = 신뢰수준 95%

 

 

유의수준을 낮추면 p-값은 어떻게 됩니까? 

변함 없음

신뢰구간은 신뢰수준에 따라서 변함

p는 유의수준에 따라서 변하지 않음

-> 통계적 가설검정과 p 를 오랫동안 써온 중요한 이유

-> 과거에는 통계를 손으로 계산했기 때문에 한번만 계산하면 되는 p가 유용 

 

 

두 집단의 평균을 비교할 때, 귀무가설을 기각할 경우의 해석은?

두 집단의 평균에는 차이가 있다.

 

 

두 집단의 평균을 비교할 때, 귀무가설을 기각하지 못할 경우의 해석은?

결론을 유보한다.

 

 

유의수준은 무엇과 같습니까?

 

 

귀무가설 참/거짓 -> 사실의 영역

귀무가설 기각/기각x => 검정의 영역

 

 

동일 조건에서 1종 오류가 감소하면 2종 오류는 증가

 

 

신뢰수준이 높다(별의별 경우를 다 생각한다)

-> 오차 범위가 더 넓어짐

-> 이럴 수도 있고, 저럴 수도 있다

-> 의사결정을 하기가 어렵다

-> 그런 의미에서 정보가 적다고 하는 것