본문 바로가기

통계 이모저모/수리통계학

[수리통계학] 42. 가설검정

728x90
반응형

[Ref] 수리통계학 (송명주, 전명식)

안녕하세요, 이번 포스팅에서는 가설검정에 대해서 배워보도록 하겠습니다.

가설검정은 앞선 신뢰구간의 확장판이라고 보시면 됩니다.

가설검정에는 크게 어려운 계산과정이나 수식이 없기 때문에 용어의 정의에 대해서 명확하게 아는것이 매우 중요합니다.

단순 가설과 복합 가설의 차이를 한 눈에 보기 쉬운 예제를 들어보도록 하겠습니다.

예를 들어, 정규분포의 평균과 분산을 저희가 모르고 있는 상태입니다. 가설을 설정하되, 평균과 분산이 각각 0과 1이라고 가정할 때, 이는 분포를 N(0,1)로 완전히 결정하는 가설이므로 단순가설입니다. 반면에, 평균이 1보다 클것이다 라고 가정하는 것은 복합가설에 속한다고 할 수 있지요.

다음으로 배워볼 개념으로 귀무가설 (Null Hypothesis)와 대립가설 (Alternative Hypothesis)입니다.

예를 들어서, 어느 학급의 남자와 여자의 성적에 있어서 차이가 없을 것이라는 것이 일반적으로 받아들여지는 가설이라고 합시다.

연구자가 이 가설에 대한 반대로 "남자와 여자의 성적에 차이가 있다" 라는 것을 증명하고자 할 때, 연구자의 가설이 대립가설이 되고, "남자와 여자의 성적에 있어서 차이가 없을 것이다" 가 귀무가설이 됩니다.

다음으로, 검정통계량은 예를 들어서, 어느 학급을 평균 시험점수에 대한 가설을 검정할 때, 표본평균을 사용할 때, 검정한다면 표본평균이 검정통계량이 됩니다.

다음으로 제 1종오류와 제 2종 오류에 대해서 알아보도록 하겠습니다.

두 가지 오류는 나중에, 데이터 분석 공부할 때도 중요한 개념이니 잘 알아두시는 것이 좋습니다.

귀무가설이 참인데 거짓이라고 판단하는 것이 제 1종오류, 귀무가설이 거짓인데 참으로 판단하는 것이 제 2종 오류입니다.

이 두가지를 굉장히 헤깔려하시는 분들이 많습니다.

외우는 방법을 한가지 알려드리면, 심장병을 진단하는 과정을 생각해봅시다.

귀무가설은 물론 "이 환자가 심장병이 없을것이다" 일테고 대립가설로 "이 환자가 심장병이 있다" 일 것입니다.

대립가설이 사실인가를 검증하기 위해서 여러가지 검사를 진행하지요.

이 때, 제 2종오류는 매우 치명적으로 작용하지만, 제 1종오류는 치명적이지는 않습니다.

왜냐하면, 제 2종오류의 경우 심장병 환자를 아니라고 판정하게 되면 큰일이 납니다.

반면에 심장병 환자가 아닌데 심장병 환자라고 진단한 경우, 추가적인 검사를 통해서 해결될 수 있습니다.

즉, 외울 때, 이 케이스를 기억하셔서, 심각한 오류는 제 2종오류로 외우시면 됩니다.

일반적으로, 제 1종오류를 유의수준이라고 많이 표현합니다.

통계적 가설 검정을 할때, 유의수준을 최소화 하는 방향으로 진행합니다.

다음으로 검정력 함수에 대해서 정의해보도록 하겠습니다.

지금까지 배운 내용은 예제를 통해 복습해보도록 하겠습니다.

 

반응형