티스토리 뷰
하둡의 매퍼 리듀서 개수는 입력사이즈에 의해서 설정하는 방법과 사용자가 개수를 설정하는 방법이있다.
<input 파일 용량에 따라 매퍼 개수 설정>
set mapreduce.input.fileinputformat.split.maxsize=268435456;
set mapreduce.input.fileinputformat.split.minsize=134217728;
<input 파일 용량에 따라 리듀서 개수 설정>
set mapred.reduce.tasks=-1;
set hive.exec.reducers.bytes.per.reducer=134217728;
<입력값에 상관없이 개수 매퍼 리듀서 개수 고정>
set mapreduce.job.maps=100;
set mapreduce.job.reduces=100;
* 하둡 위키에 따르면 매퍼의 개수는 하둡이 계산한 매퍼의 개수 이하로는 설정할 수 없다고 한다.
하둡이 매퍼의 개수를 500개로 계산했는데 100개로 설정하면 500개로 처리하게 된다.
https://wiki.apache.org/hadoop/HowManyMapsAndReduces
반응형
'빅데이터 > hadoop' 카테고리의 다른 글
[hadoop] MR과 TEZ의 차이 (0) | 2017.10.24 |
---|---|
[hadoop] 하둡 커패시티 스케줄러(capacity-scheduler) (0) | 2017.10.18 |
[hive] tez 실행중 메모리 오류 발생 (0) | 2017.09.20 |
[하둡]HDFS의 헬스 체크 및 커럽트 블럭 삭제하기 (0) | 2017.09.18 |
[hadoop] HDFS 관련 주요 면접 질문 (0) | 2017.09.11 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- mysql
- emr
- 알고리즘
- yarn
- 파이썬
- java
- oozie
- error
- nodejs
- hbase
- SPARK
- HDFS
- Linux
- 다이나믹
- airflow
- bash
- 하이브
- AWS
- ubuntu
- build
- SQL
- Hadoop
- S3
- HIVE
- 오류
- 백준
- Python
- 정올
- 하둡
- Tez
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함