[hadoop] 맵리듀스의 맵퍼 리듀서 개수 설정하기

하둡의 매퍼 리듀서 개수는 입력사이즈에 의해서 설정하는 방법과 사용자가 개수를 설정하는 방법이있다.

<input 파일 용량에 따라 매퍼 개수 설정>

set mapreduce.input.fileinputformat.split.maxsize=268435456;

set mapreduce.input.fileinputformat.split.minsize=134217728;

<input 파일 용량에 따라 리듀서 개수 설정>

set mapred.reduce.tasks=-1;

set hive.exec.reducers.bytes.per.reducer=134217728;

<입력값에 상관없이 개수 매퍼 리듀서 개수 고정>

set mapreduce.job.maps=100;
set mapreduce.job.reduces=100;

* 하둡 위키에 따르면 매퍼의 개수는 하둡이 계산한 매퍼의 개수 이하로는 설정할 수 없다고 한다.

하둡이 매퍼의 개수를 500개로 계산했는데 100개로 설정하면 500개로 처리하게 된다.
https://wiki.apache.org/hadoop/HowManyMapsAndReduces

[hadoop] MR과 TEZ의 차이 (0)	2017.10.24
[hadoop] 하둡 커패시티 스케줄러(capacity-scheduler) (0)	2017.10.18
[hive] tez 실행중 메모리 오류 발생 (0)	2017.09.20
[하둡]HDFS의 헬스 체크 및 커럽트 블럭 삭제하기 (0)	2017.09.18
[hadoop] HDFS 관련 주요 면접 질문 (0)	2017.09.11

티스토리툴바