본문 바로가기

통계 이모저모

(71)
[수리통계학] 7. 조건부 기댓값과 조건부 분산 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 기댓값과 분산 파트의 마지막 부분인 조건부 기댓값과 조건부 분산에 대해서 배워보도록 하겠습니다. 조건부 기댓값은 확률 변수 X,Y에 대해서 X=x가 주어져있을 때 Y값의 기댓값이라고 생각하시면 이해하기 쉬울겁니다. 예제를 통해서 이해 해보도록 합시다. 위의 예제처럼, 조건부 기댓값을 계산하라는 문제가 나오면, 우선 조건부 확률변수를 먼저 구하고, 정의에 대입하여 계산하면 됩니다. 다음으로, 조건부 기댓값의 정리에 대해서 알아보도록 하겠습니다. 이 중에서 이중 기댓값 정리는 굉장히 중요한 개념이므로 꼭 알아두시기 바랍니다. 다음으로 조건부 분산에 대해서 정의해보도록 하겠습니다. 조건부 분산은 분산을 구할 때 E(X)이 조건부 기댓값으로..
[수리통계학] 6. 분산 및 표준편차 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 이번 포스팅에서는 지난 포스팅에 이어서 분산과 표준편차에 대해서 알려드리도록 하겠습니다. 평소에 분산이 높다, 분산이 적다라는 말을 들어본적이 있으실텐데요. 처음 들었을 때는 이게 무슨소리지? 라는 생각밖에 없을거에요... 저도 그랬거든요! 이번 시간을 통해서 분산에 대해서 완벽하게 공부해놓도록 합시다~ ​ 우선, 분산의 정의는 위와 같습니다. 분산은 확률변수의 흩어짐을 재는 척도로써, 분산이 크면 변수들이 넓게 분포하고 있다는 것을 의미하며, 분산이 작다는 것은 변수들이 조밀하게 분포하는 것을 의미합니다. 그림을 통해 이해를 해봅시다. ​ 다음으로, 분산의 정리에 대해서 배워봅시다. 분산의 정리도 평균의 정리와 마찬가지로 이후 단원들을 배우기 위해서..
[수리통계학] 5. 기댓값 [Ref] 수리통계학 (송명주, 전명식) 안녕하세요, 오늘 포스팅은 기댓값에 대해서 다루어보도록 하겠습니다. 기댓값은 평균과 비슷한 개념을 가지고 있지만, 엄밀하게 따르면 다릅니다. 평균은 정해진 값들 내에서의 계산되는 값이고, 기댓값은 정해진 값이 아닌 확률변수의 평균을 예측하는 것 입니다. 기댓값은 위와 같이 정의됩니다. 예제를 통해 익숙해지도록 해보겠습니다. 이처럼 x의 평균이 아닌 g(x)의 평균을 구하라는 문제가 나오면은 기댓값 계산 식에서 x가 아닌 g(x)를 대입하여 적분해주시면 됩니다. 다음으로, 기댓값의 성질들에 대해서 알아봅시다. 이 부분에 대해서는 외워 놓는것이 이후의 단원들을 공부하는데 있어서 필수적입니다!!
[수리통계학] 4. 결합분포 [Ref] 수리통계학 (송성주, 전명식) 안녕하세요. 이번 포스팅에서는 결합분포에 대해서 다루어 보도록 하겠습니다. 실제로 우리가 데이터를 다룰 때, 종속변수와 독립변수 사이의 관계에서 종속 변수 x가 하나만 있는 경우는 마주치는 일이 거의없습니다. 보통 여려개의 x를 가지며, 그에 따라 종속변수가 변하게 되는데, 이 때의 종속변수의 확률분포를 결합분포라고 할 수 있습니다. 결합 확률밀도함수가 위처럼 정의되므로, 우리는 결합 확률분포함수 또한 정의할 수 있습니다. 다음으로 ,주변 확률밀도함수에 대해서 알아보겠습니다. 두 확률변수의 결합분포를 알고 있을 때, 각 변수만의 분포를 따로 구해야 할 경우가 생길 수 있습니다. 이 때, 두 확률변수 X,Y의 결합 확률밀도함수가 fX,Y(x,y)로 주어졌을 때, 두..
[수리통계학] 3. 확률밀도함수 & 확률분포함수 이번 포스팅에서는 확률밀도함수와 확률분포함수에 대해서 알아보도록 하겠습니다. 우선 확률밀도함수는 두 가지로 나눌 수 있습니다. 확률변수 X가 이산형일 때는 확률질량함수 (pmf) 라고 하며, 연속형일 때는 그대로 확률밀도함수 (pdf)라고 합니다. 수식이라서 어렵게 느껴지시겠지만 각 확률변수에 할당된 확률값을 전부 더하면 1이된다는 말입니다. 참쉽죠?? 확률 밀도함수에서도 마찬가지로 확률변수가 정의된 모든영역의 확률을 더하면 (연속형에서는 면적이되겠죠?) 1이된다는 말입니다. ​ 다음으로 분포함수에대해서 알려드리겠습니다. 분포함수 또한 매우 기초적인 내용이지만, 분포함수의 형태를 알면 확률밀도함수를 알 수 있기 때문에 후에 문제를 풀 때 많이 사용됩니다. 한마디로 말해서 F(x)는 확률변수가 x보다 작거..
[수리통계학] 2. 확률변수와 확률분포 안녕하세요. 이번 포스팅에서는 확률변수와 확률분포에 대해서 알아보도록 하겠습니다. 이 두 개의 개념을 확실히 알아두시는게 나중에 대학원 면접이나 통계쪽 직무 면접을 하실 때 도움이 되실 수 있을겁니다. 이 정의에서 한가지 주목하실 것은 확률변수는 특정한 값이 아니라 함수라는 것입니다. 그렇기 때문에, 확률변수의 값은 랜덤한 실험결과에 따라 정해지므로 비결정적입니다. 하지만, 우리는 확률변수에서 나올 수 있는 값들과 그 값들이 나올 가능성은 알 수 있는데, 이를 이 확률변수의 확률분포를 아는 것이라고 할 수 있습니다. 예제를 통해서 두 용어의 정의를 정리해보도록 하겠습니다. 주사위를 한개를 던지는 사건을 생각해봅시다. 주사위의 눈 1 2 3 4 5 6 확률 1/6 1/6 1/6 1/6 1/6 1/6 이 때..
[수리통계학] 1. 확률 [Ref] 송성주, 전명식 - 수리통계학 안녕하세요. 오늘은 수리통계의 기초인 확률에 대해 알아보도록 하겠습니다. 면접을 대비하여 용어의 정의는 알아두는것이 좋습니다. 확률의 정의는 위와 같습니다. 그리고 확률의 성질들에 대해서 알아보도록 하겠습니다. 확률의 성질에 대해서는 기초적으로 이 정도만 알고 있어도 수리통계를 배우는데에는 지장이 없습니다. 다음으로 조건부 확률을 알아 보겠습니다. 조건부 확률은 수리통계에서 아주 중요하게 다루어지는 개념입니다. 또한 통계학과에서 배우는 베이지안 통계학도 조건부 확률에 대한 이해를 바탕으로 하기 때문에 이번 기회에 확실히 알도록 합시다. 즉, 조건부확률은 A사건과 B사건이 동시에 일어날 확률에서 B사건이 확률을 나누어 주면 얻을 수 있습니다. 수식을 그대로 해석해보..