티스토리 뷰
하둡 HDFS는 동작하면서 HDFS에 파일을 생성, 삭제 하는 등의 작업에 대한 트랜잭션 로그를 기록합니다.
해당 로그는 Edits_XXX 이름으로 네임노드의 dfs.namenode.edits.dir 에 설정된 위치에 저장됩니다.
이 트랜잭션 로그는 트랜잭션이 많아질 수록 빠르게 해당 위치에 쌓이게 됩니다.
로그는 세컨더리네임노드를 이용하여 정리할 수 있습니다.
세컨더리네임노드는 다음과 같이 실행합니다.
> hdfs secondarynamenode
세컨더리 네임노드는 설정값에 따라 기본 한시간에 한번씩 Edits 로그를 확인하면서
설정값이상의 파일이나, 트랜잭션 횟수를 넘어서면 Edits 파일을 정리하여 사이즈를 줄여줍니다.
- dfs.namenode.checkpoint.period: 체크포인트 확인 시간
- dfs.namenode.checkpoint.txns: 체크포인트를 확인하는 트랜잭션의 횟수
HDFS 트랜잭션이 많다면 설정을 변경하여 더욱 자주 체크하도록 해주는 것이 좋습니다.
반응형
'빅데이터 > hadoop' 카테고리의 다른 글
[hadoop] YARN REST API를 이용하여 클러스터 사용량 확인 하기 (0) | 2019.01.07 |
---|---|
[hdfs] HDFS 디렉토리 최대값 설정 변경 (0) | 2018.12.10 |
[hadoop] YARN, 맵리듀서 메모리 설정 (0) | 2018.05.17 |
[hadoop] 맵리듀스 동작 순서 (0) | 2018.04.17 |
[hadoop] Ambari, Avro (0) | 2018.03.29 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- HIVE
- 하이브
- error
- 정올
- ubuntu
- nodejs
- SPARK
- 하둡
- bash
- 오류
- 파이썬
- AWS
- S3
- mysql
- hbase
- emr
- HDFS
- Hadoop
- yarn
- 다이나믹
- Linux
- airflow
- Tez
- 백준
- oozie
- java
- SQL
- 알고리즘
- build
- Python
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함