본문 바로가기

통계 이모저모/수리통계학

[수리통계학] 34. 충분통계량

728x90
반응형

[Ref] 수리통계학 (송명주, 전명식)

안녕하세요, 이번 포스팅에서는 최소분산 비편향추정량 (MVUE)를 구하는 두 번째 방법을 배우기 전에 알아두어야 할 충분 통계량 개념에 대해서 배워보도록 하겠습니다.

"우선 과연 충분 통계량이란 무엇인가??" 가 먼저 선행되야겠지요?

예를 들어서 설명드리면 쉽게 이해할 수 있을겁니다.

확률 변수 X가 모수가 p인 베르누이 분포를 따른다고 합시다.

이 때, 우리는 100개의 Sample을 X1 ~ X100을 가지고 있습니다.

X1 ~ X100을 모두 사용해서 모수 p를 예측할 수 있지만, 단지 X1부터 X100까지 전부 더한 값 하나로도 모수 p를 예측할 수 있습니다.

과연 두 방법중에서 뭐가 더 효율적이면서 좋은 추정량일까요??

바로 후자 입니다. 100개의 추정량을 사용하는 것보다, 다 더한 값인 하나의 추정량을 사용하는 것이 당연히 좋겠죠??

하지만 여기서 중요한 것은, X1부터 X100까지 전부 더한 값이 실제로 100개의 추정량을 다 사용하는 것과 비교하여, p를 예측할만한 설명력이 있는가입니다. 만약 설명력을 충분하게 갖추었다고 생각되면 '충분통계량'으로 정의됩니다.

이제 제대로 된 정의를 알아봅시다.

쉽게 말해서 통계량 조건부 분포가 모수 theta에 의존하지 않는다는 것은 S(X)가 이미 theta에 대한 모든 정보를 설명하고 있기 때문에, S(X)가 주어지고 나머지 정보는 theta를 설명하는 데 아무런 쓸모가 없다는 뜻입니다.

이렇게 생각하시면 이해가 되시죠?

그럼 아까의 예에서 100개의 추정량을 다 더한 값이 실제로 충분통계량인지를 증명해볼까요?

이렇게 증명이 됩니다.

다음포스팅에서는 충분통계량을 더 쉽게 구하는 방법인 인수분해 정리에 대해서 배워보도록 하겠습니다.

반응형