본문 바로가기
개념

[개념] 머신러닝과 데이터마이닝

by hs_seo 2019. 9. 24.

머신러닝과 데이터마이닝에 대해서 알아보겠습니다.

  • 데이터마이닝
    • 통계학적 관점
    • 데이터를 분석하여 인사이트를 도출하는 것을 목적
  • 머신러닝
    • 컴퓨터과학 관점
    • 데이터를 이용한 학습을 통해 새로운 예측을 하는 것

데이터마이닝

데이터마이닝과 머신러닝은 유사합니다.

데이터마이닝은 데이터를 분석하여 인사이트를 도출하는 것을 목표로 하고, 머신러닝은 데이터를 이용한 학습을 통해 새로운 예측을 하는것을 목표로 한다고 할 수 있습니다.

데이터마이닝을 활용하는 분야에 분류, 예측, 연관, 군집이 있고, 이를 처리하는 알고리즘이 머신러닝에 사용되는 연관분석(K-근접이웃 알고리즘), 회귀분석(로지스틱 회귀분석), 군집분석(K-평균군집)기술이 사용됩니다.

머신러닝은 데이터 학습과 분석을 위한 알고리즘을 생성하고 발전하는 학문이고, 데이터마이닝은 이를 이용하여 데이터를 분석하여 의미있는 데이터를 도출해내는 것에 목적을 둔다고 할 수 있습니다.

머신러닝

  • 지도학습(Supervisied Learning)
    • 정답을 알려주고 학습을 진행
    • 분류(classification)
      • 이산형 데이터(discrete value)
      • 집단(Label)을 알려주고 분류
        • 사진을 주고 고양이, 사자, 강아지로 분류하게 처리
    • 회귀(regression)
      • 연속형 데이터(continuous value)
      • 어떤 데이터들의 특징(feature)를 토대로 값을 예측
      • 결과값은 실수값을 가짐 = 연속성을 가짐 = 그래프
        • 아파트값 예측
        • A지역 24평, B지역 24평, C지역 32평
  • 비지도학습(Unsupervised Learning)
    • 정답을 알려주지 않고 데이터 들을 군집화
    • 데이터의 숨겨진 특징이나 구조를 발견하는데 사용
    • 군집(clustering)
      • 연관성이 높은 것들 끼리 묶음
    • 실무에서는 적당한 특징, 집단을 알아내기 위한 전처리 방법으로 사용하기도 함
  • 강화학습(Reinforcement Learning)
    • 보상(reward)을 이용하여 보상이 최대화가 되도록 강화 학습
반응형

'개념' 카테고리의 다른 글

[SSL] SSL Renegotiate denied 오류  (0) 2021.01.28
[개념] IPv4와 IPv6  (0) 2019.10.31
[개념] 유니코드 인코딩 UTF와 BOM  (0) 2019.09.17
[개념] 한글 문자 인코딩  (0) 2019.09.17
[개념] NoSQL  (0) 2019.08.08