본문 바로가기

데이터 다루기/머신러닝 이론

Reducible and Irreducible Errors

728x90
반응형

이번 시간에는 머신러닝의 오차에 대해서 알려드리겠습니다.

첫번째 포스팅에서 머신러닝에 대해서 소개를 드릴 때

라는 식을 기억하실겁니다. 회귀문제를 다룰 때 실제 데이터가 회귀모형에 정확히 적합하지는 않을 것이기 때문에 아무도 알지 못하는 오차항인 ε가 존재하게 됩니다. 오차항은 random variable로 평균이 0이고 분산이 Var(ε)인 정규분포를 따르게 됩니다. 이 때 머신러닝에서 예측한 값을

 

라고 정의해보겠습니다. 이 때 y값과 예측값의 차이의 제곱에 기댓값을 취하면

 

 

으로 표현되게 됩니다.

따라서 머신러닝 알고리즘은 reducible error를 최소로 하는 것을 목표로 하게 됩니다. (Irreducible error는 알지못하는 오차로 조절 x)

반응형

'데이터 다루기 > 머신러닝 이론' 카테고리의 다른 글

[머신러닝] 선형 회귀 분석 (1)  (0) 2019.06.11
모델 평가  (1) 2019.06.11
Bias & Variance Trade-off  (0) 2019.06.11
머신러닝 vs 데이터마이닝  (0) 2019.06.10
머신러닝이란?  (0) 2019.06.10