티스토리 뷰
머신러닝과 데이터마이닝에 대해서 알아보겠습니다.
- 데이터마이닝
- 통계학적 관점
- 데이터를 분석하여 인사이트를 도출하는 것을 목적
- 머신러닝
- 컴퓨터과학 관점
- 데이터를 이용한 학습을 통해 새로운 예측을 하는 것
데이터마이닝
데이터마이닝과 머신러닝은 유사합니다.
데이터마이닝은 데이터를 분석하여 인사이트를 도출하는 것을 목표로 하고, 머신러닝은 데이터를 이용한 학습을 통해 새로운 예측을 하는것을 목표로 한다고 할 수 있습니다.
데이터마이닝을 활용하는 분야에 분류, 예측, 연관, 군집이 있고, 이를 처리하는 알고리즘이 머신러닝에 사용되는 연관분석(K-근접이웃 알고리즘), 회귀분석(로지스틱 회귀분석), 군집분석(K-평균군집)기술이 사용됩니다.
머신러닝은 데이터 학습과 분석을 위한 알고리즘을 생성하고 발전하는 학문이고, 데이터마이닝은 이를 이용하여 데이터를 분석하여 의미있는 데이터를 도출해내는 것에 목적을 둔다고 할 수 있습니다.
머신러닝
- 지도학습(Supervisied Learning)
- 정답을 알려주고 학습을 진행
- 분류(classification)
- 이산형 데이터(discrete value)
- 집단(Label)을 알려주고 분류
- 사진을 주고 고양이, 사자, 강아지로 분류하게 처리
- 회귀(regression)
- 연속형 데이터(continuous value)
- 어떤 데이터들의 특징(feature)를 토대로 값을 예측
- 결과값은 실수값을 가짐 = 연속성을 가짐 = 그래프
- 아파트값 예측
- A지역 24평, B지역 24평, C지역 32평
- 비지도학습(Unsupervised Learning)
- 정답을 알려주지 않고 데이터 들을 군집화
- 데이터의 숨겨진 특징이나 구조를 발견하는데 사용
- 군집(clustering)
- 연관성이 높은 것들 끼리 묶음
- 실무에서는 적당한 특징, 집단을 알아내기 위한 전처리 방법으로 사용하기도 함
- 강화학습(Reinforcement Learning)
- 보상(reward)을 이용하여 보상이 최대화가 되도록 강화 학습
반응형
'개념' 카테고리의 다른 글
[SSL] SSL Renegotiate denied 오류 (0) | 2021.01.28 |
---|---|
[개념] IPv4와 IPv6 (0) | 2019.10.31 |
[개념] 유니코드 인코딩 UTF와 BOM (0) | 2019.09.17 |
[개념] 한글 문자 인코딩 (0) | 2019.09.17 |
[개념] NoSQL (0) | 2019.08.08 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 하둡
- airflow
- 백준
- Tez
- nodejs
- 다이나믹
- HIVE
- Hadoop
- mysql
- emr
- S3
- error
- AWS
- hbase
- 정올
- Python
- SPARK
- 알고리즘
- 하이브
- Linux
- 파이썬
- yarn
- java
- HDFS
- bash
- SQL
- build
- oozie
- ubuntu
- 오류
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함