[spark] 스파크 디플로이 모드(deploy mode)의 cluster, client 의 차이 — 개발자로 살아남기

스파크의 클러스터 타입은 4가지가 있다.

standalone

스파크에 포함된 클러스터 관리자

YARN

Hadoop2의 관리자
https://hadoop.apache.org/docs/current/hadoop-yarn/hadoop-yarn-site/YARN.html

Mesos

Hadoop MapReduce와 다른 응용 서비스를 실행할 수 있는 범용 클러스터 관리자
http://mesos.apache.org/

Kubernetes

컨테이너화된 응용프로그램의 배치, 실행을 관리하는 클러스터 관리자
https://kubernetes.io/

그리고 이 클러스터에 대한 배포 모드(deploy mode)는 2가지가 있다.

client

실행을 호출한 곳에서 드라이버가 생성

cluster

클러스터 내부에서 드라이버가 생성

https://hxquangnhat.com/2015/04/03/overview-spark-deploy-modes/

http://c2fo.io/c2fo/spark/aws/emr/2016/09/01/apache-spark-config-cheatsheet-part2/

https://hxquangnhat.com/2015/04/03/overview-spark-deploy-modes/

저작자표시 비영리 (새창열림)

'빅데이터 > spark' 카테고리의 다른 글

[spark] RDD, DataFrame, DataSet (0)	2018.03.28
[spark] RDD, Transformation, Action, Dependency 용어 (1)	2018.03.28
[spark] 스파크 컨테이너 메모리 오류시 처리 방안 (0)	2018.02.13
[spark] NoSuchElement 오류 해결 방법 (0)	2018.01.08
스파크에서 문자열 utf-8 형식으로 처리하기 (0)	2016.06.20

티스토리툴바