본문 바로가기

통계 이모저모

(71)
[공간 통계] 3. Spatial Weights Matrix 안녕하세요, 이번 포스팅에서는 공간가중행렬(Spatial Weights Matrix)에 대해서 알아보도록 하겠습니다. 공간가중행렬은 다음과 같이 정의됩니다. 즉, 공간 가중행렬은 특정 관측치 i에 대해서, j 관측치와의 관계가 이웃이라면 1의 값을 가지게 되며, 이웃이 아니라면 0의 값을 가지게 됩니다. 그렇다면 이웃을 결정하는 기준은 어떻게 될까요?? 가장 자주 쓰이는 기준은 총 3개가 있습니다. 한번 알아보도록 할까요? ​ ① Binary Contiguity Weights Binary Contiguity Weights 는 쉽게 말해서 근접하고 있는 경우를 이웃으로 보는 접근법입니다. 쉽게말해서 위와 같은 그림이 있을 때, 1의 이웃은 2,4,5가 될 수 있으며, 3의 이웃은 6과 5가 되겠네요. 이를..
[공간 통계] 5. Moran`s I 안녕하세요, 이번 포스팅에서는 공간 자기상관성을 살펴보는 지표중에서 가장 유명한 Moran`s I에 대해서 배워보도록 하겠습니다. Moran`s I 는 공간에서 전역 자기상관성이 있는가에 대한 통계량입니다. ​ 일반적으로, 전체 공간에 대해서 귀무가설로 Spatial Randomness, 즉 아무런 패턴이 존재하지 않는다고 가정합니다. 하지만, 양의 자기상관 관계나 음의 자기상관 관계가 나타나면, Moran`s I 를 통해서 귀무가설을 기각할 수 있습니다. ​ Moran`s I 통계량에 대한 식은 위와 같습니다. I값은 -1과 1사이의 값을 가집니다. 그리고 Z 값이 통계량이 되며, Z 검정을 통해서 전역 공간 패턴의 통계적 유의성을 판단하게 됩니다. ​ Moran`s I 의 한계점으로는, 전역 자기상관..
[공간 통계] 2. Spatial Autocorrelation 안녕하세요, 이번 포스팅에서는 공간 통계에서 가장 중요한 개념으로 다루어지는 공간자기상관계수에 대해서 배워보도록 하겠습니다. 자기상관계수(Autocorrelation)는 자기 자신과 근처에 있는 관측치와의 유사성(Similarity)를 나타내는 지표입니다. 일반적으로 자기상관성이 높은 관측치의 경우, 근처의 관측치들과 비슷한 값을 가지며, 자기상관성이 음수로 높게 나타나는 경우, 근처의 관측치와 상반된 값을 가집니다. 자기상관계수는 2가지 측면에서 볼 수 있습니다. 첫번째는 시계열 분석에서 쓰이는 Temporal Autocorrelation 입니다. Temporal Autocorrelation 시간적으로 자기상관관계가 어느 정도 존재하는지에 대한 지표입니다. 즉, 특정 시간에서의 관측치가 이전 시차의 관..
[수리통계학] 44. 균일최강력 검정법 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 저번 포스팅에서 배운 최강력 검정법과 비슷한 균일최강력 검정법에 대해서 배워보도록 하겠습니다. ​ 최강력 검정법을 복합가설로 확장헀을 때, 균일최강력 검정법으로 될 수 있습니다. 최강력 검정법에 대한 문제를 풀 때, 네이만-피어슨 정리를 사용하면 대립가설의 모수의 값에 의존하지 않고, 단지 귀무가설의 모수보다 크거나 작거나 한 사실만 사용합니다. 즉, 귀무가설의 모수보다 클 경우, 어떠한 값을 가지던 최강력 검정법의 기각영역이 되는 것이지요. 이와 같이 어떤 검정밥법이 복한 대립가설하에서의 모든 가능한 모수의 값에 대하여 최강력 검정법이 되는 경우 이를 균일최강력 검정법이라고 합니다. ​ 균일 최강력 검정법은 네이만-피어슨 정리를 사..
[수리통계학] 43. 최량검정법 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅부터는 다양한 검정법에 대해서 배워볼 예정입니다. 우선 가장 단순한 검정법인 최량검정법부터 배워보도록 하겠습니다. ​ 일반적으로 항상 옳은 결과를 가져다주는 검정법이 가장 최선이지만, 실제로 표본에서 주어지는 정보만을 가지고는 모집단의 특성에 대한 완벽한 결과를 내기는 어렵습니다. 그렇기 때문에, 옳은 결과를 가져다주는 빈도가 가장 높은 검정법을 찾는것이 분석자의 목표입니다. 검정에 있어서 발생하는 2가지 오류인 제 1종오류와 제 2종오류는 Trade-off 관계를 가지고 있기 때문에, 한 쪽을 감소시키면 다른 쪽이 증가하게 됩니다. 따라서, 이 두 개의 오류를 가장 최소로 할 수 있는 타협점을 찾아야 합니다. ​ 최량검정법은 검정력함수를 ..
[수리통계학] 42. 가설검정 [Ref] 수리통계학 (송명주, 전명식) ​ 안녕하세요, 이번 포스팅에서는 가설검정에 대해서 배워보도록 하겠습니다. 가설검정은 앞선 신뢰구간의 확장판이라고 보시면 됩니다. ​ 가설검정에는 크게 어려운 계산과정이나 수식이 없기 때문에 용어의 정의에 대해서 명확하게 아는것이 매우 중요합니다. 단순 가설과 복합 가설의 차이를 한 눈에 보기 쉬운 예제를 들어보도록 하겠습니다. 예를 들어, 정규분포의 평균과 분산을 저희가 모르고 있는 상태입니다. 가설을 설정하되, 평균과 분산이 각각 0과 1이라고 가정할 때, 이는 분포를 N(0,1)로 완전히 결정하는 가설이므로 단순가설입니다. 반면에, 평균이 1보다 클것이다 라고 가정하는 것은 복합가설에 속한다고 할 수 있지요. ​ 다음으로 배워볼 개념으로 귀무가설 (Null ..
[수리통계학] 41. 구간 추정 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 구간 추정에 대해서 배워보도록 하겠습니다. 구간 추정은 고등학교 확률과 통계 부분에서도 배우기도 했을텐데, 깊게 공부해보지는 못하셨을것입니다. 구간 추정에서 바로, 신뢰 구간이라는 중요한 용어가 등장합니다. 신뢰 구간은 어찌보면 통계에서 굉장히 중요한 개념입니다. 어떤 추정량에 대해서, 신뢰도를 평가하기 위한 지표이기도 하죠. ​ 그러면 본격적으로 신뢰구간의 정의에 대해서 배워보도록 하겠습니다. 즉, 정의를 쉽게 말씀드리자면, 모수 theta가 어떠한 하한과 상한 사이에 존재할 확률이 1-alpha 값을 가진다면 그 하한과 상한을 신뢰구간의 하한과 상한으로 정의하는 것입니다. ​ 이처럼 신뢰구간은 상한과 하한의 사이로 정의되기도 하지..
[수리통계학] 40. 최대 가능도 추정량의 점근적 성질 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 최대 가능도 추정량의 점근적 성질에 대해서 배워보도록 하겠습니다. 지금 배울 정리는 굉장히 중요한 부분입니다. 이 정리가 시사하는 바가 무엇이냐면, 최대 가능도 추정량의 표본 N이 무한대로 커지면, 다음과 같이 형태의 정규 분포를 따른 다는 것입니다. ​ 예제를 통해 보도록 할까요?? ​