본문 바로가기

통계 이모저모/공간 통계

[공간 통계] 3. Spatial Weights Matrix

728x90
반응형

안녕하세요, 이번 포스팅에서는 공간가중행렬(Spatial Weights Matrix)에 대해서 알아보도록 하겠습니다.

공간가중행렬은 다음과 같이 정의됩니다.

즉, 공간 가중행렬은 특정 관측치 i에 대해서, j 관측치와의 관계가 이웃이라면 1의 값을 가지게 되며, 이웃이 아니라면 0의 값을 가지게 됩니다.

그렇다면 이웃을 결정하는 기준은 어떻게 될까요??

가장 자주 쓰이는 기준은 총 3개가 있습니다. 한번 알아보도록 할까요?

① Binary Contiguity Weights

Binary Contiguity Weights 는 쉽게 말해서 근접하고 있는 경우를 이웃으로 보는 접근법입니다.

쉽게말해서 위와 같은 그림이 있을 때, 1의 이웃은 2,4,5가 될 수 있으며, 3의 이웃은 6과 5가 되겠네요. 이를 행렬로 나타내보면 다음과 같습니다.

$\begin{grid}\cell{0000}0&\cell{0000}1&\cell{0000}0&\cell{0000}1&\cell{0000}1&\cell{0000}0\\\cell{0000}1&\cell{0000}0&\cell{0000}0&\cell{0000}1&\cell{0000}1&\cell{0000}0\\\cell{0000}0&\cell{0000}0&\cell{0000}0&\cell{0000}0&\cell{0000}1&\cell{0000}1\\\cell{0000}1&\cell{0000}1&\cell{0000}0&\cell{0000}0&\cell{0000}1&\cell{0000}0\\\cell{0000}1&\cell{0000}1&\cell{0000}1&\cell{0000}1&\cell{0000}0&\cell{0000}0\\\cell{0000}0&\cell{0000}0&\cell{0000}1&\cell{0000}0&\cell{0000}0&\cell{0000}0\end{grid}$

0 1 0 1 1 0
1 0 0 1 1 0
0 0 0 0 1 1
1 1 0 0 1 0
1 1 1 1 0 0
0 0 1 0 0 0

일반적으로 Binary Contiguity Weights는 2가지로 나눌 수 있습니다.

Source: Lloyd, C. (2010). Spatial data analysis: an introduction for GIS users. Oxford university press

이 2가지 방식은 체스에서 따온걸로 생각됩니다. Queen은 특정 점에서 양옆, 위아래, 대각선까지 총 8개의 방향을 이웃으로 정의하며, Rook은 양옆, 위아래 총 4개의 방향을 이웃으로 정의합니다.

② Disance-based Weights

Disance-based Weights는 말 그대로 거리 기반으로 이웃을 정의합니다. 즉, 특정 거리보다 가까우면 이웃, 멀면 이웃이 아니라고 정의됩니다.

이 방법의 단점으로는 특정점의 다른 점들과의 거리가 최소 거리보다 다 크다면, 이웃이 없는 고립된 점이 생길 수 있다는 것입니다. 따라서 최소 거리를 정할 때, 각 관측치별 가장 큰 최단거리보다는 작게 크게 정해야합니다.

③ K-nearest Neighbors Weights

마지막으로 K-nearest Neighbors Weights 입니다. K-nearest Neighbors Weights는 머신러닝의 KNN 방법과 비슷한 메커니즘인데, 가장 근접한 K개의 점을 이웃으로 인식합니다.

마지막으로 공간가중행렬은 그대로 쓰이지 않고 정규화하여 사용하게 됩니다.

① Row Standardized Weights

Row Standardized Weights는 행단위로 정규화합니다.

② Stochstic Weights

Stochastic Weights는 전체 행렬을 정규화합니다.

반응형