본문 바로가기

데이터 다루기/머신러닝 이론

[머신러닝] Odds vs Odds Ratio

728x90
반응형

안녕하세요. 저번 포스팅에서 Odds (오즈) 에 대해서 배워보았어요.

많은 사람들이 Odds 와 Odds Ratio를 같은 개념으로 알고 계시더라구요.

하지만 이 둘은 엄연히 다른 개념입니다.

Odds에 대해서 복습해볼게요.

Odds는 위와 깉이 어떤 일이 발생할 확률과 발생하지 않을 확률 사이의 비율을 의미해요.

Odds ratio는 Odds 사이의 비율이라 생각하면 됩니다.

그렇다면 Odds ratio로 어떠한 정보를 얻을 수 있을까요??

Mutated gene을 보유한 환자가 없는 환자보다 암에 걸릴 확률이 더 높을지에 대해서 Odds ratio를 계산하면,

6.88배 더 높다는 정보를 얻을 수 있습니다.

즉, Odds ratio는 일반적으로 두 변수 사이의 관계를 나태내며, 큰 값을 가질수록 위 예제에서는 mutated gene의 보유여부가 cancer 여부를 예측하는 데 좋은 변수로 활용된다는 것을 의미합니다.

참조 : StatQuest

반응형