본문 바로가기

통계 이모저모

(71)
[공간 통계] 1. Spatial Randomness 안녕하세요, 이번 포스팅부터는 공간 통계를 다루어 보도록 하겠습니다. 현재 빅데이터의 공간에서의 활용은 굉장한 관심을 받고 있습니다. 예를 들어서, 범죄 데이터를 활용하여 범죄가 많이 일어나는 지역을 발견 (Hot spot Analysis)하여 그 지역에 경찰을 더 많이 배치하는 방안을 제시할 수도 있고, 택시 승하차 데이터를 활용하여 택시의 승차가 많이 발생하는 시간과 지역을 발견하여 택시 배치를 유동적으로 하는 방안을 제시 할 수도 있습니다. ​ 첫번 째 포스팅에서는 공간 통계의 가장 기초부터 배워보도록 하겠습니다. 공간 통계의 귀무가설 (Null hypothesis)는 Spatial randomness에 기초하고 있습니다. Spatial randomness는 공간상에서 어떠한 사건이 발생할 확률이 ..
[응용통계] 15. 마코프 체인 (Markov Chains) (6) 연습문제 안녕하세요. 이번 포스팅에서는 마코프 체인에 대한 마지막 복습으로써, 연습문제를 가지고 왔습니다. 다들 완벽하게 마스터하시길 바랍니다. ​ Quastion 1. ​ A taxi driver provides service in two zones of a city. Fares picked up in zone A will have destinations in zone A with probability 0.6 or in zone B with probability 0.4. Fares picked up in zone B will have destinations in zone A with probability 0.3 or in zone B with probability 0.7. The driver’s expected..
[응용통계] 14. Gambler`s Ruin 안녕하세요, 이번 포스팅에서는 마코프 체인에서 유명한 세 번째 예제입니다. 그것을 이름 그대로, '도박하는 사람들은 결국에 망한다' 입니다. ​ 내기에 총 N원이 존재한다고 가정합시다. 그리고 저의 시작 금액은 i원이고, 한 판당 1원의 배당을 걸어서 제가 0원이 되서 파산하거나 N원이 되서 내기를 이기면 도박은 끝나게 된다고 가정합시다. 그리고 제가 이길 확률을 p라고 가정하고, 질 확률은 자연스럽게 1-p 가 되고 이를 q라고 합시다. State 관계는 다음과 같이 그려집니다. 예를 들어서, 도박장에 대해서 도박장이 가지고 있는 돈은 분명히 제 돈보다는 훨씬 많을 것이므로, 제가 도박에서 이길 확률은 거의 0에 가깝습니다. 따라서 도박을 하면 망하게 되있답니다.
[응용통계] 13. Unrestricted Random Walk 안녕하세요, 이번 포스팅에서는 마코프 체인에서 유명한 두 번째 예시인 Unrestricted Random Walk 입니다. Random Walk에서는 주가와 같이 위로 가거나 아래로 가는 것이 랜덤하게 발생합니다. 저희는 p의 확률로 양의 방향 (위쪽)으로 가고, 1-p의 확률로 음의 방향 (아래쪽)으로 가는 마코프 체인을 생각해보겠습니다. 보시다시피 모든 State는 communicate 함을 바로 알 수 있습니다. 따라서, 하나의 class로 표현 되므로, irreducible 합니다. 그리고 0 state에서 n 단계를 거쳐서 0으로 다시 돌아올 확률은 다음과 같이 정의됩니다. n이 짝수 일때만 돌아올 수 있는것을 확인 할 수 있습니다. 이 때, 4p(1-p)는 p가 0.5이면 1이고, 0.5보다 ..
[응용통계] 12. CNC Router 안녕하세요. 이번 포스팅에서는 Markov Chain의 유명한 예제 첫번째로 CNC Router에 대해서 배워보도록 하겠습니다. 문제는 다음과 같습니다. 시설에는 4대의 CNC Router가 존재합니다. 그리고 한 번의 shift 가 진행 될 때, 각각의 CNC Router가 고장날 확률은 0.3으로 일정합니다. CNC Router가 고장이 나면, 수리 센터로 가게되는데, 수리센터에서 CNC Router를 고칠 확률은 다음과 같습니다. (수리센터 직원 2명) - 하나도 못 고칠 확률: 0.2 - 1개만 고칠 확률: 0.6 - 2개 고칠 확률: 0.2 ​ 이 때, 다음 질문들에 답해봅시다. ​ ​
[응용통계] 11. 마코프 체인 (Markov Chains) (5) 안녕하세요, 이번 포스팅에서는 마코프체인의 나머지 진도를 나가보도록 하겠습니다. 저희는 지금부터, State 간의 관계에 대해서 여러가지 정의를 내려보도록 하겠습니다. accessible에 대한 정의는 아주 간단합니다. State i에서 State j로 이동하는 경로가 존재한다면 State i는 State j로부터 accessible한 것입니다. 위의 State Relation에서 0->0, 1->1, 1->2, 1->3, 1->0, 2->1, 2->2, 2->3, 2->0, 3->3 의 관계가 존재합니다. ​ commincate에 대한 정의는 State i 와 State j 가 양방향으로 accessible 한 경우를 나타냅니다. 위의 State 관계에서는 (0,0), (1,1), (1,2), (2,2..
[응용통계] 10. 마코프 체인 (Markov Chains) (4) 연습문제 안녕하세요, 이번 포스팅에서는 지금까지 배운 부분에 대하여 연습문제를 풀어보도록 하겠습니다. ​ Quastion 1. Suppose that whether or not it rains today depends on previous weather conditions through the last three days. Show how this system may be analyzed by using a Markov chain. How many states are needed? 풀이) R : 비가 올 경우의 수, U : 비가 오지 않을 경우의 수하고 정의하자. 다음 날의 비가 오거나 그렇지 않을 확률은 이전 3일동안의 결과에 따라 달라지므로, 3일동안 가능한 경우의 수는 RRR, RRU, RUR, RUU, U..
[응용통계] 9. 마코프 체인 (Markov Chains) (3) 안녕하세요. 이번 포스팅에서는 저번 포스팅이 어려웠기 때문에, 복습하는 의미로 예제를 하나 들고왔습니다. 어느 한 미용실이 있다고 합시다. 미용실에는 커트를 진행하는 1 자리가 있고, 뒤에 기다릴 수 있는 자리가 4자리가 있습니다. 커트는 한 번에 항상 15분이 걸린다고 가정을 하고, 만약에 커트가 끝나고 기다리는 사람이 없다면, 미용사는 무조건 15분을 쉬고 일을 시작합니다. 그리고 15분 동안 손님이 올 확률은 다음과 같습니다. 그리고 State를 미용실에 있는 고객의 수라고 정의하면, 우리는 변환행렬을 정의할 수 있습니다. 시간이 무한대로 지났을 때, 각 State로 배정될 확률을 steady state probability라고 정의합니다. 우리는 이를 행렬을 계속 곱하면서 얻을 수 있습니다. 이처..