티스토리 뷰
# 예제임
17/10/09 15:19:53 INFO mapreduce.Job: map 67% reduce 0%
17/10/09 15:30:05 INFO mapreduce.Job: Task Id : attempt_1507562353923_0001_m_000000_0, Status : FAILED
AttemptID:attempt_1507562353923_0001_m_000000_0 Timed out after 600 secs
Sent signal OUTPUT_THREAD_DUMP (SIGQUIT) to pid 6230 as user ubuntu for container container_1507562353923_0001_01_000002, result=success
Container killed by the ApplicationMaster.
Container killed on request. Exit code is 143
Container exited with a non-zero exit code 143
하둡 맵리듀스 작업중에 "Sent signal OUTPUT_THREAD_DUMP" 오류를 출력하고 작업이 종료되는 경우가 있습니다.
저의 겨웅 작업을 잘 살펴 보면 오류가 발생한 것이 아니고 작업이 정상적으로 동작하다가 갑자기 죽어서 원인을 파악하는데 어려움이 있었습니다.
증상
- 맵리듀스는 5분 동안 동작에 이상이 없으면 컨테이너를 kill 함
- 맵작업 자체는 정상적으로 동작 중이었고, 오류도 발생하지 않음
- 이 상태로 5분이 되어, 애플리케이션 마스터가 맵을 kill 함
원인
정의 경우 원인은 맵에서 발생한 소켓 통신에서, 소켓이 끊어 진것을 라이브러리가 확인하지 못해서 5분간 작업에 행이 걸렸습니다. 이런 오류가 발생한다면 맵작업 중에서 처리하는 어떤 동작에 행이 걸리는 것은 아닌지 확인하는 것이 좋을 것 같습니다.
반응형
'빅데이터 > hadoop' 카테고리의 다른 글
[hadoop] 우분투에서 snappy 라이브러리를 설치하고, hadoop에서 인식 체크 (0) | 2021.05.06 |
---|---|
[hadoop] 커버로스 하둡에서 HDFS 접근을 위한 델리게이션 토큰 생성 방법 (0) | 2021.04.19 |
[hdfs] ACL설정의 setfacl, getfacl 명령 (0) | 2021.04.06 |
[hadoop] 하둡 설정에서 job.xml:an attempt to override final parameter: fs.defaultFS 경고 (0) | 2021.03.31 |
[hadoop] hadoop에서 openstack-swift 파일 시스템을 연동하기 위한 hadoop-openstack-swifta (0) | 2021.03.29 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- ubuntu
- 하둡
- hbase
- Linux
- airflow
- 다이나믹
- Python
- SPARK
- yarn
- 알고리즘
- Hadoop
- HDFS
- bash
- oozie
- 하이브
- 오류
- mysql
- build
- 백준
- emr
- AWS
- 정올
- 파이썬
- java
- Tez
- SQL
- error
- S3
- nodejs
- HIVE
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
글 보관함