[hdfs] HA 구성된 HDFS의 journalnode 3대 중 1대의 서버가 장애가 발생했을 때 대응 (Journal Storage Directory /hadoop/hdfs/journal/edit/user-hadoop not formatted ; journal id: user-hadoop)

2024. 7. 18. 23:52·빅데이터/hadoop

장애 상황

HA 구성 된 하둡은 3대의 저널 노드(journalnode)를 필요로 하는데 그 중 1대의 노드에 장애가 발생하여 서버가 포맷 되었습니다. 이로 인해 1대의 저널 노드를 새로 구축해야 하는 상황이 되었습니다.

 

오류를 해결하기 위해서 서버를 새로 설치하고 실행하니 다음과 같은 오류가 발생하였습니다.

 

2024-07-18 06:31:25,405 INFO org.apache.hadoop.ipc.Server (IPC Server handler 3 on default port 8485): IPC Server handler 3 on default port 8485, call Call#944181936 Retry#0 org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocol.startLogSegment from 10.189.162.52:37885
org.apache.hadoop.hdfs.qjournal.protocol.JournalNotFormattedException: Journal Storage Directory /hadoop/hdfs/journal/edit/user-hadoop not formatted ; journal id: user-hadoop
    at org.apache.hadoop.hdfs.qjournal.server.Journal.checkFormatted(Journal.java:516)
    at org.apache.hadoop.hdfs.qjournal.server.Journal.startLogSegment(Journal.java:557)
    at org.apache.hadoop.hdfs.qjournal.server.JournalNodeRpcServer.startLogSegment(JournalNodeRpcServer.java:178)
    at org.apache.hadoop.hdfs.qjournal.protocolPB.QJournalProtocolServerSideTranslatorPB.startLogSegment(QJournalProtocolServerSideTranslatorPB.java:188)
    at org.apache.hadoop.hdfs.qjournal.protocol.QJournalProtocolProtos$QJournalProtocolService$2.callBlockingMethod(QJournalProtocolProtos.java:26743)
    at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:528)
    at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:498)
    at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:1038)
    at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:1003)
    at org.apache.hadoop.ipc.Server$RpcCall.run(Server.java:931)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1938)
    at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2855)

 

해결 방법

저널 노드가 포맷되지 않아서 발생한 오류인데, 이미 HDFS가 실행 중이고 동작하는 상황이기 때문에 다시 포맷하거나, 초기화를 하기에는 부담 스러운 상황이었습니다.

 

그래서 기존에 동작하는 저널노드의 디렉토리에서 VERSION 파일의 내용을 동일하게 복사하여 주고, 저널노드를 실행하여 문제를 해결할 수 있었습니다.

 

다음과 같이 hdfs-site.xml 에 설정한 저널노드의 경로에 가면 VERSION 파일이 존재합니다. HDFS 구성을 위한 메타 정보가 들어 있는 파일인데 이 파일의 내용을 cat 명령으로 확인하여, 장애가 발생한 노드에 동일하게 생성하고 실행하면 됩니다.

 

deploy@host-10-0-0-1:/hadoop/hdfs/journal/edit/user-hadoop/current$ ll
total 20
drwxr-xr-x 2 deploy deploy 4096 Jul 18 06:33 ./
drwxr-xr-x 3 deploy deploy 4096 Jul 18 06:33 ../
-rw-r--r-- 1 deploy deploy  167 Jul 18 06:33 VERSION
-rw-r--r-- 1 deploy deploy    8 Jul 18 06:33 committed-txid
-rw-r--r-- 1 deploy deploy    2 Jul 18 06:32 last-promised-epoch
반응형
저작자표시 비영리 동일조건 (새창열림)

'빅데이터 > hadoop' 카테고리의 다른 글

[Tez] Tez 0.10.3과 Hadoop 3.3.6을 연결할 때 발생하는 오류  (0) 2024.09.23
[yarn] 커버로스 적용된 nodemanager에서 Linux Container Executor reached unrecoverable exception 오류  (0) 2022.11.16
[yarn] InvalidResourceRequestException: Invalid resource request, requested memory < 0, or requested memory > max configured, requestedMemory=-1, maxMemory=102400 에러  (0) 2022.11.09
[hadoop] ha 하둡 실행 시 java.lang.IllegalStateException: Could not determine own NN ID in namespace 'ha-hadoop'. Please ensure that this node is one of the machines listed as an NN RPC address, or configure dfs.ha.namenode.id 오류 처리  (0) 2022.08.21
[hdfs] Unable to start failover controller. Parent znode does not exist. 오류 수정  (0) 2022.04.20
'빅데이터/hadoop' 카테고리의 다른 글
  • [Tez] Tez 0.10.3과 Hadoop 3.3.6을 연결할 때 발생하는 오류
  • [yarn] 커버로스 적용된 nodemanager에서 Linux Container Executor reached unrecoverable exception 오류
  • [yarn] InvalidResourceRequestException: Invalid resource request, requested memory < 0, or requested memory > max configured, requestedMemory=-1, maxMemory=102400 에러
  • [hadoop] ha 하둡 실행 시 java.lang.IllegalStateException: Could not determine own NN ID in namespace 'ha-hadoop'. Please ensure that this node is one of the machines listed as an NN RPC address, or configure dfs.ha.namenode.id 오류 처리
hs_seo
hs_seo
Hello World!
    반응형
  • hs_seo
    개발자로 살아남기
    hs_seo
  • 전체
    오늘
    어제
    • 전체 (1140)
      • 개발자 (21)
        • 개발에 유의할 점 (0)
        • 면접 (5)
      • IT 소식 (5)
        • 업계 (1)
      • java (51)
        • 디자인패턴 (3)
        • apache-common (1)
      • 개념 (47)
        • 자료구조 (4)
        • 함수형사고 (8)
        • 디자인패턴 (1)
      • 데이터분석 (1)
      • python (67)
        • 코드조각 (12)
        • 라이브러리 (2)
      • 빅데이터 (418)
        • zookeeper (5)
        • hadoop (78)
        • hdfs (12)
        • hive (127)
        • hbase (16)
        • spark (40)
        • scala (4)
        • trino (3)
        • oozie (41)
        • Hue (9)
        • R (5)
        • sqoop (6)
        • flume (3)
        • elasticsearch (2)
        • airflow (16)
        • kafka (3)
        • kubernetes (10)
        • openstack (3)
        • flink (2)
        • redis (2)
      • 빅데이터 강좌 (2)
      • 알고리즘 (131)
        • 알고리즘 (1)
        • 백준 (61)
        • 정올 (41)
        • 더블릿 (5)
        • 프로그래머스 (1)
      • 프로그래밍 언어 (30)
        • go (4)
        • js (9)
        • .Net (6)
        • Jsp (1)
        • ansible (3)
        • terraform (6)
      • Tools (56)
        • docker (2)
        • macbook (6)
        • maven (3)
        • sublime (1)
      • 프레임워크 (25)
        • [JS] angularjs (2)
        • [JS] node.js (19)
        • [Java] spring (2)
        • Android (2)
      • 데이타베이스 (43)
        • SQLD (5)
        • Oracle (1)
        • MySQL (8)
        • ADsP (2)
      • 리눅스 (25)
        • Bash (61)
      • GCP (5)
      • AWS (34)
        • EC2 (2)
        • EMR (14)
      • 정보보안기사 (4)
        • 네트워크 (1)
      • 개인 (80)
        • 업무실수 (0)
        • 책 (9)
        • 교육 (3)
        • 여행 (17)
        • 영화 (12)
        • 음악 (2)
        • 피규어 (4)
        • 게임 (3)
        • 생각 (7)
        • 기타 (10)
        • 좋은글 (5)
        • 좋은 사이트 (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 미디어로그
    • 위치로그
    • 방명록
  • 링크

    • 빅데이터-하둡,하이브로 시작하기
    • 빅데이터-스칼라, 스파크로 시작하기
    • Kaggle에서 파이썬으로 데이터 분석 시작하기
    • 쉘스크립트 개발 시작하기
    • 개발자가 데이터 분석 준전문가 되기
    • 데브쿠마
  • 공지사항

  • 인기 글

  • 태그

    HDFS
    Tez
    알고리즘
    airflow
    build
    hbase
    파이썬
    nodejs
    Linux
    mysql
    yarn
    AWS
    다이나믹
    오류
    백준
    Hadoop
    SPARK
    Python
    정올
    ubuntu
    bash
    oozie
    하이브
    하둡
    HIVE
    java
    k8s
    emr
    S3
    error
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
hs_seo
[hdfs] HA 구성된 HDFS의 journalnode 3대 중 1대의 서버가 장애가 발생했을 때 대응 (Journal Storage Directory /hadoop/hdfs/journal/edit/user-hadoop not formatted ; journal id: user-hadoop)
상단으로

티스토리툴바