머신러닝과 데이터마이닝에 대해서 알아보겠습니다.
- 데이터마이닝
- 통계학적 관점
- 데이터를 분석하여 인사이트를 도출하는 것을 목적
- 머신러닝
- 컴퓨터과학 관점
- 데이터를 이용한 학습을 통해 새로운 예측을 하는 것
데이터마이닝
데이터마이닝과 머신러닝은 유사합니다.
데이터마이닝은 데이터를 분석하여 인사이트를 도출하는 것을 목표로 하고, 머신러닝은 데이터를 이용한 학습을 통해 새로운 예측을 하는것을 목표로 한다고 할 수 있습니다.
데이터마이닝을 활용하는 분야에 분류, 예측, 연관, 군집이 있고, 이를 처리하는 알고리즘이 머신러닝에 사용되는 연관분석(K-근접이웃 알고리즘), 회귀분석(로지스틱 회귀분석), 군집분석(K-평균군집)기술이 사용됩니다.
머신러닝은 데이터 학습과 분석을 위한 알고리즘을 생성하고 발전하는 학문이고, 데이터마이닝은 이를 이용하여 데이터를 분석하여 의미있는 데이터를 도출해내는 것에 목적을 둔다고 할 수 있습니다.
머신러닝
- 지도학습(Supervisied Learning)
- 정답을 알려주고 학습을 진행
- 분류(classification)
- 이산형 데이터(discrete value)
- 집단(Label)을 알려주고 분류
- 사진을 주고 고양이, 사자, 강아지로 분류하게 처리
- 회귀(regression)
- 연속형 데이터(continuous value)
- 어떤 데이터들의 특징(feature)를 토대로 값을 예측
- 결과값은 실수값을 가짐 = 연속성을 가짐 = 그래프
- 아파트값 예측
- A지역 24평, B지역 24평, C지역 32평
- 비지도학습(Unsupervised Learning)
- 정답을 알려주지 않고 데이터 들을 군집화
- 데이터의 숨겨진 특징이나 구조를 발견하는데 사용
- 군집(clustering)
- 연관성이 높은 것들 끼리 묶음
- 실무에서는 적당한 특징, 집단을 알아내기 위한 전처리 방법으로 사용하기도 함
- 강화학습(Reinforcement Learning)
- 보상(reward)을 이용하여 보상이 최대화가 되도록 강화 학습
반응형
'개념' 카테고리의 다른 글
[SSL] SSL Renegotiate denied 오류 (0) | 2021.01.28 |
---|---|
[개념] IPv4와 IPv6 (0) | 2019.10.31 |
[개념] 유니코드 인코딩 UTF와 BOM (0) | 2019.09.17 |
[개념] 한글 문자 인코딩 (0) | 2019.09.17 |
[개념] NoSQL (0) | 2019.08.08 |