본문 바로가기

데이터 다루기/머신러닝 이론

[Machine Learning] Confusion Matrix

728x90
반응형

안녕하세요. 이번 포스팅에서는 Classification 머신러닝 모델의 성능 평가 지표로 많이 사용되는 Confusion Matrix (혼동 행렬) 에 대해서 배워보고자 합니다.

혼동 행렬에서 사용되는 Accuracy (정확도), Sensitivity (민감도), Specifitify (특이도) 모두 굉장히 쉬운 내용이긴 하지만, 계속 까먹게 되는 점이 있더라구요.

아무래도 정의들이 다 비슷해서 그런 것 같아요.

그래도 계속 외우다보면 성공하는 날이 올 거에요!!

Classification Model 이 심장병 여부를 예측한다고 가정해볼게요.

Confusion Matrix는 위와 같이 정의가 됩니다.

그리고 Accuracy (정확도), Sensitivity (민감도), Specifitify (특이도)는 아래와 같이 정의가 됩니다.

현실 문제에서 Sensitivity 와 Specificity의 중요도는 다르게 작용됩니다.

위와 같은 심장병 예측 문제에서는 우선 심장병 환자에게 심장병임을 알려주는 것이 가장 중요한 요소입니다.

즉, Sensitivity가 굉장히 중요합니다.

분류 모델의 Sensitivity가 작다면, 심장병 환자에게 심장병이 아니라고 진단하는 것인데 매우 심각한 문제입니다.

반응형