본문 바로가기

통계 이모저모/공간 통계

(11)
[공간 통계] 11. Spatial Autoregressive model with GMM 이전 포스팅에서 배운 Spatial Autoregressive model을 GMM을 통해서 추정하는 방법에 대해서 배워보도록 하겠습니다. ​ 해당 방법은 아래 논문에 자세히 서술되어 있습니다. Klier, T., & McMillen, D. P. (2008). Clustering of auto supplier plants in the United States: generalized method of moments spatial logit for large samples. Journal of Business & Economic Statistics, 26(4), 460-471. ​ ​ 이 때 u가 moment condition으로 작용합니다.
[공간 통계] 10. Generalizd method of moments (GMM) Generalizd method of moments (GMM)을 배우기 앞서, 식 하나로 요약해서 정리하면 아래와 같다. 이 때, 함수 f는 moment condition을 나타낸다. ​ 그렇다면 우선, moment condition에 대해서 정의를 해야한다. 우리는 적률이 무엇인지를 안다는 전제하에 진행하도록 하겠다. moment condition이란 관측치 Y와 모수 theta에 대한 함수로써, 기댓값을 취하였을 때, 0을 가지는 조건을 만족한다. GMM의 기본적인 아이디어로, E를 표본평균으로 대체한다. ​ 대수의 법칙에 의해서 Sample size: T가 무한대로 커짐에 따라, 위 두식은 같아진다. 위 조건을 최대한 만족하기 위해서, moment condition을 최대한 0에 가깝에 만들어주는 ..
[공간 통계] 9. Spatial Autoregressive model Spatial Autoregressive model은 아래와 같이 정의된다. 이 때 rho는 y값에 대한 자기상관을 반영하는 coefficient이고, W1은 이에 대한 공간 가중 행렬, beta는 일반 회귀 계수와 같은 역할을 한다. Lambda는 오차항 내에서의 자기상관을 반영하는 coefficient이다. ​ 일반적으로, lambda = 0이라고 가정할 때, Spatial lag model이라고 정의하며, 반대로 rho = 0 이라고 가정할 때, Spatial Error model로 정의된다. ​ 이 때, 유의할 점은 공간 가중 행렬 W는 대각 원소가 모두 0이며, 각 행의 합은 1로 Normalize 되어 있어야 한다. ​ 이번 포스팅에서는 Spatial lag model에 대해서만 다뤄보도록 하..
[공간 통계] 8. 공간 회귀 분석 (Spatial regression) 안녕하세요. 이번 포스팅에서는 공간 회귀 분석에 대해서 간략하게 리뷰해보도록 하겠습니다. 공간 회귀 분석은 공간 상에서 회귀 모형을 적합할 때 사용됩니다. ​ 일반적인 회귀 분석은 모든 공간에 상관없이 데이터에 회귀 계수를 추정하게 됩니다. 하지만, 실제 공간 데이터에서 공간에 따라 변수들의 영향이 달라질 수 있습니다. ​ 쉽게 예를 들어서, 사람의 행복 지수를 회귀 분석한다고 했을 때, 두 가지 변수: 돈, 종교가 있을 수 있습니다. 종교 국가에서는 종교가 행복 지수에 더 큰 영향을 미치는 반면, 자본 주의 국가에서는 돈이 더 큰 영향을 미칩니다. 이 처럼, 공간 마다 변수들의 영향도에 차이를 줄 수 있는 방법이 공간 회귀입니다. ​ 이러한 공간 회귀 모델로는 GWR : Geographically We..
[공간 통계] 7. Heterogeneity 안녕하세요. 이번 포스팅에서는 Heterogeneity 라는 개념에 대해서 배워보도록 하겠습니다. Heterogeneity 의 공간의 의미에서는 공간에 따라 변화하는 것을 의미합니다. Heterogeneity의 반대말로는 Homogeneity 가 있습니다. ​ 회귀문제를 예시를 들어볼게요. Homogeneity에 따르면 모든 경우의 수에 대해서 회귀 계수 베타가 같은 경우입니다. 보통 일반적으로 만날 수 있는 경우죠. ​ 하지만 Heterogeneity는 회귀계수가 관측치에 따라 달라질 수 있다고 가정합니다. Extreme Heterogeneity 를 따른다면, 모든 관측치마다 고유한 회귀계수 베타를 가집니다. ​ 보통 Extreme Heterogeneity 까지는 아니라도, 공간 회귀 모형에서는 지역에..
[공간 통계] 6. Getis-ord 안녕하세요, 이번 포스팅에서도 전역 공간 자기상관성을 확인하는 지표를 배워보도록 하겠습니다. 저번 포스팅에서 배운 Moran`s I 에는 한 가지 단점이 있었습니다. 그건 바로, Moran`s I는 전체 공간에서 특이한 패턴이 나타나는 지점이 있는지를 알 수 있지만, 그 특이한 패턴이 핫스팟인지 혹은 콜드스팟인지를 확인할 수 있는 방법이 없었습니다. 이러한 단점 때문에, Moran`s I라는 개념을 생각해낸 학자가 Getis-Ord 라는 새로운 개념을 도입하였습니다. Getis-Ord의 식은 위와 같습니다. Moran`s I와 마찬가지로 Z 통계량을 생성하여, Z 검정이 진행됩니다. 이 때, G값이 음수이면 콜드스팟을 나타내며, 양수이면 핫스팟을 나타내게 됩니다. ​
[공간 통계] 4. Spatial scan statistics 안녕하세요, 이번 포스팅에서는 Spatial scan statistics에 대해서 배워보도록 하겠습니다. ​ Spatial scan statistics 방법은 통계학의 관점에서 공간 상의 핫스팟을 찾아내는 기법중에서 정말 유명한 방법입니다. ​ 원리는 매우 간단합니다. 예를 들어서, 데이터를 질병의 발생 유무를 나타내는 (0,1) binary 데이터가 공간상에 원 모양으로 찍혀 있다고 해봅시다. 그리고 우리는 귀무가설로 모든 공간에서 질병이 발생할 확률은 모수가 p인 베르누이 분포를 따른다고 가정합니다. 물론 이 때, 가설은 포아송 분포여도 되고, 어떤 분포든 가정하기 나름입니다. ​ 만약에 위의 그림 처럼 핫스팟이 존재한다면, 핫 스팟 내부 공간에서는 관찰된 바에 의하면 질병이 일어날 확률이 핫 스팟 ..
[공간 통계] 3. Spatial Weights Matrix 안녕하세요, 이번 포스팅에서는 공간가중행렬(Spatial Weights Matrix)에 대해서 알아보도록 하겠습니다. 공간가중행렬은 다음과 같이 정의됩니다. 즉, 공간 가중행렬은 특정 관측치 i에 대해서, j 관측치와의 관계가 이웃이라면 1의 값을 가지게 되며, 이웃이 아니라면 0의 값을 가지게 됩니다. 그렇다면 이웃을 결정하는 기준은 어떻게 될까요?? 가장 자주 쓰이는 기준은 총 3개가 있습니다. 한번 알아보도록 할까요? ​ ① Binary Contiguity Weights Binary Contiguity Weights 는 쉽게 말해서 근접하고 있는 경우를 이웃으로 보는 접근법입니다. 쉽게말해서 위와 같은 그림이 있을 때, 1의 이웃은 2,4,5가 될 수 있으며, 3의 이웃은 6과 5가 되겠네요. 이를..