본문 바로가기

통계 이모저모/수리통계학

(44)
[수리통계학] 12. 이산형 확률분포 (4) 초기하분포 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 길었던 이산형 확률분포는 이번 포스팅으로 마지막입니다. 마지막은 저희가 다뤘던 분포중에서 가장 어려운분포라고 생각합니다. N개의 공이 r개의 빨간공과 w개의 하얀공으로 구성되어 있을 때, n개의 공을 무작위로 비복원추출 (꺼낸 후 다시 넣지 않음) 하였을 때, 빨간공의 수를 X라 할 때 X가 따르는 분포를 초기하분포라고 합니다. ​ 이제 초기하분포의 평균과 분산을 구해보도록 하겠습니다. ​
[수리통계학] 11. 이산형 확률분포 (3) 기하 분포, 음이항 분포 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅 이산형 확률분포의 세 번째 시간입니다. 이번에는 기하분포와 음이항 분포를 다루어 보도록 하겠습니다. ​ 기하분포는 예를 들어서 주사위를 던지는 시행을 할 때, 5의 눈이 처음 나오기 위해서 몇번을 던져야 하는지에 대한 확률변수라고 생각하시면 쉽습니다. 분포에 대해 이해를 했다면 다음 과정은 무엇인지 기억하나요?? 바로 기댓값과 분산을 알아야합니다. 기하분포에서는 꼭 알아야 할 성질이 있습니다. 바로 '비기억성' 입니다. 비기억성은 쉽게 말해서 3번 성공하는데 시행되는 횟수가 6번이라고 할 때, 3번까지 성공이 없더라도 그 상태에서도 다음번에 성공할 확률이 증가하거나하지 않는다는것 입니다. 다음으로 배워볼 분포는 음이항분포입니다. 음이항 분..
[수리통계학] 10. 이산형 확률분포 (2) 포아송 분포 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서 배워볼 이산형 확률분포는 포아송 분포입니다. 포아송 분포는 우리 일상 생활에 가장 친근하게 발견되는 분포입니다. 예를 들어서, 1시간에 특정 버스가 도착하는 횟수나, 어떤 전화교환대에 1시간동안 걸려오는 전화의 수, 특정 책의 5page당 오타의 수 등이 포아송 분포를 따른다고 합니다. ​ ​ 포아송 분포의 자세한 정의는 포아송 과정에 대해서 알아야합니다. 하지만 이는 수리통계학 내에서는 중요하게 다루지 않기 때문에 생략하도록 하겠습니다. 혹시 자세하게 공부하고 싶으신 분은 아래의 링크에서 해결할 수 있습니다. ​https://analysisbugs.tistory.com/14 이제 포아송 분포의 평균과 분산을 계산해보도록 합시다. 포아..
[수리통계학] 9. 이산형 확률분포 (1) 베르누이 분포 & 이항 분포 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅부터는 여러가지 확률분포에 대해서 다루어 볼려고 합니다. 우선 이산형 확률분포에서 고등학교의 확률과 통계 시간에서 많이 접한 베르누이 분포와 이항 분포에 다루어 보도록 하겠습니다. 예를 들어서, 동전 던지기를 한다고 가정해봅시다. 앞면이 나올 확률이 1/3 이고 뒷면이 나올 확률이 2/3라고 할 때 (찌그러진 동전) 앞면을 1로 가지는 확률변수 X는 p=1/3 인 베르누이 분포를 따른다고 할 수 있습니다. ​ 분포를 배웠으면, 다음으로 알아 볼 것은 무엇일까요?? 바로 기댓값과 분산입니다. 베르누이 분포의 기댓값과 분산은 위와 같이 쉽게 얻을 수 있습니다. ​ 베르누이 분포에 대해 배웠으니 다음 분포는 이항분포입니다. 베르누이 분포를 이해하..
[수리통계학] 8. 확률부등식 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 2개의 중요한 확률부등식을 배워보도록 하겠습니다. 다들 한 번씩 들어보신 부등식 일텐데요~ 바로 마코프 확률부등식과 체비셰프 부등식 입니다. 이 두 가지 부등식은 이 후 수리통계학에서 정리를 증명할 때 자주 쓰이므로, 여러번 봐서 익숙해지는 것이 좋습니다. 또한, 마코프 확률부등식에서 유도되는 체비셰프 부등식도 매우 유용하다. ​
[수리통계학] 7. 조건부 기댓값과 조건부 분산 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 기댓값과 분산 파트의 마지막 부분인 조건부 기댓값과 조건부 분산에 대해서 배워보도록 하겠습니다. 조건부 기댓값은 확률 변수 X,Y에 대해서 X=x가 주어져있을 때 Y값의 기댓값이라고 생각하시면 이해하기 쉬울겁니다. 예제를 통해서 이해 해보도록 합시다. 위의 예제처럼, 조건부 기댓값을 계산하라는 문제가 나오면, 우선 조건부 확률변수를 먼저 구하고, 정의에 대입하여 계산하면 됩니다. 다음으로, 조건부 기댓값의 정리에 대해서 알아보도록 하겠습니다. 이 중에서 이중 기댓값 정리는 굉장히 중요한 개념이므로 꼭 알아두시기 바랍니다. 다음으로 조건부 분산에 대해서 정의해보도록 하겠습니다. 조건부 분산은 분산을 구할 때 E(X)이 조건부 기댓값으로..
[수리통계학] 6. 분산 및 표준편차 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 지난 포스팅에 이어서 분산과 표준편차에 대해서 알려드리도록 하겠습니다. 평소에 분산이 높다, 분산이 적다라는 말을 들어본적이 있으실텐데요. 처음 들었을 때는 이게 무슨소리지? 라는 생각밖에 없을거에요... 저도 그랬거든요! 이번 시간을 통해서 분산에 대해서 완벽하게 공부해놓도록 합시다~ ​ 우선, 분산의 정의는 위와 같습니다. 분산은 확률변수의 흩어짐을 재는 척도로써, 분산이 크면 변수들이 넓게 분포하고 있다는 것을 의미하며, 분산이 작다는 것은 변수들이 조밀하게 분포하는 것을 의미합니다. 그림을 통해 이해를 해봅시다. ​ 다음으로, 분산의 정리에 대해서 배워봅시다. 분산의 정리도 평균의 정리와 마찬가지로 이후 단원들을 배우기 위해서..
[수리통계학] 5. 기댓값 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 오늘 포스팅은 기댓값에 대해서 다루어보도록 하겠습니다. 기댓값은 평균과 비슷한 개념을 가지고 있지만, 엄밀하게 따르면 다릅니다. 평균은 정해진 값들 내에서의 계산되는 값이고, 기댓값은 정해진 값이 아닌 확률변수의 평균을 예측하는 것 입니다. 기댓값은 위와 같이 정의됩니다. 예제를 통해 익숙해지도록 해보겠습니다. 이처럼 x의 평균이 아닌 g(x)의 평균을 구하라는 문제가 나오면은 기댓값 계산 식에서 x가 아닌 g(x)를 대입하여 적분해주시면 됩니다. 다음으로, 기댓값의 성질들에 대해서 알아봅시다. 이 부분에 대해서는 외워 놓는것이 이후의 단원들을 공부하는데 있어서 필수적입니다!!