하둡의 매퍼 리듀서 개수는 입력사이즈에 의해서 설정하는 방법과 사용자가 개수를 설정하는 방법이있다.
<input 파일 용량에 따라 매퍼 개수 설정>
set mapreduce.input.fileinputformat.split.maxsize=268435456;
set mapreduce.input.fileinputformat.split.minsize=134217728;
<input 파일 용량에 따라 리듀서 개수 설정>
set mapred.reduce.tasks=-1;
set hive.exec.reducers.bytes.per.reducer=134217728;
<입력값에 상관없이 개수 매퍼 리듀서 개수 고정>
set mapreduce.job.maps=100;
set mapreduce.job.reduces=100;
* 하둡 위키에 따르면 매퍼의 개수는 하둡이 계산한 매퍼의 개수 이하로는 설정할 수 없다고 한다.
하둡이 매퍼의 개수를 500개로 계산했는데 100개로 설정하면 500개로 처리하게 된다.
https://wiki.apache.org/hadoop/HowManyMapsAndReduces
반응형
'빅데이터 > hadoop' 카테고리의 다른 글
[hadoop] MR과 TEZ의 차이 (0) | 2017.10.24 |
---|---|
[hadoop] 하둡 커패시티 스케줄러(capacity-scheduler) (0) | 2017.10.18 |
[hive] tez 실행중 메모리 오류 발생 (0) | 2017.09.20 |
[하둡]HDFS의 헬스 체크 및 커럽트 블럭 삭제하기 (0) | 2017.09.18 |
[hadoop] HDFS 관련 주요 면접 질문 (0) | 2017.09.11 |