본문 바로가기

데이터 다루기/머신러닝 이론

머신러닝 vs 데이터마이닝

728x90
반응형

많은 사람들은 머신러닝과 데이터마이닝의 차이를 잘 인지하지 못하고 있다.

이는 머신러닝에서 사용되는 다양한 모델 (ex: 회귀 모델, 분류 모델)이 데이터마이닝에서도 똑같이 사용되기 때문이다.

하지만 머신러닝과 데이터마이닝은 엄격하게 다른 개념이며, 이를 쉽게 설명하는 구절을 찾았기 때문에 인용해보았습니다.

분류나 예측, 군집과 같은 기술, 모델, 알고리즘을 이용해 문제를 해결하는 것을 Computer Science 관점에서는 머신러닝이라고 하고, 통계학 관점에서는 데이터 마이닝이라고 한다. 이러한 현상이 발생한 계기는 1990년대에 들어서면서 실용적인 머신러닝 연구를 위해 통계학에서 다루고 있는 사례들을 컴퓨터 과학자들이 컴퓨터를 이용해 좀 더 효율적인 해결 방안을 찾아내는 과정에서 비롯되었다고 할 수 있다.

머신러닝과 데이터마이닝을 더 명확하게 구분해보자면, 이터 마이닝은 가지고 있는 데이터에서 현상 및 특성을 발견하는 것이 목적인 반면, 머신러닝은 거기에서 그치지 않고, 기존 데이터를 통해 학습을 시킨 후 새로운 데이터에 대한 예측값을 알아내는 데 목적이 있다고 할 수 있다.

- 출처: 밑바닥부터 시작하는 데이터과학

반응형

'데이터 다루기 > 머신러닝 이론' 카테고리의 다른 글

[머신러닝] 선형 회귀 분석 (1)  (0) 2019.06.11
모델 평가  (1) 2019.06.11
Bias & Variance Trade-off  (0) 2019.06.11
Reducible and Irreducible Errors  (0) 2019.06.10
머신러닝이란?  (0) 2019.06.10