[hadoop-hdfs] HDFS 포맷 하는 방법

2019. 12. 26. 22:47·빅데이터/hdfs

HDFS를 포맷하는 방법에 대해서 알아보겠습니다.

HDFS를 포맷하면 데이터가 모두 사라집니다. 반드시 백업을 해두고 진행하는 것이 좋습니다.

작업 순서

작업 순서는 AWS EMR의 HDFS를 기준으로 작성되었습니다. 각 제조사의 하둡마다 순서가 바뀔수 있지만 전체적인 맥락은 변경되지 않습니다. 

 

  1. 서버 종료
    • 네임노드, 데이타노드 종료를 종료합니다.
    • 모든 노드의 네임노드 프로세스와 데이타노드 프로세스를 종료합니다.
  2. 네임노드 포맷
    • 포맷
    • hdfs namenode -format 명령으로 네임노드를 포맷합니다. 네임노드를 포맷하면 dfs.namenode.name.dir경로의 fsimage와 edits 파일이 초기화 됩니다.
    • 네임노드를 포맷하면 클러스터 ID가 신규로 생성됩니다. 이 정보는 dfs.namednoe.name.dir 아래 VERSION 파일에 있습니다.
  3. 설정변경
    • dfs.namednoe.name.dir 경로 권한을 hdfs 프로세스가 사용가능한 권한으로 변경합니다.
    • 모든 데이터 노드의 dfs.datanode.data.dir 경로에서 VERSION 파일의 clusterID를 신규로 생성된 클러스터 ID로 변경합니다.
  4. 서버 시작
    • 데이타 노드 재시작
    • 네임노드 시작
    • 모든 노드를 시작하고 hdfs dfsadmin -report 명령으로 Live Node에 모든 데이터 노드가 연결되는지 확인합니다. 노드가 연결되지 않으면 네임노드의 로그에서 오류를 확인하고 이를 보고 수정합니다.

VERISON 파일

네임노드와 데이터노드의 정보를 가지고 있는 VERSION파일은 다음과 같은 정보를 담고 있습니다.

네임노드 정보

클러스터 ID와 스토리지 정보 블록풀 정보를 가지고 있습니다.

# namenode VERSION 정보 
clusterID=CID-XX
cTime=0
storageType=NAME_NODE
blockpoolID=BP-XX
layoutVersion=63

데이터노드 정보

스토리지 ID와 클러스터 ID 정보를 가지고 있습니다.

# datanode VERSION 정보 
storageID=DS-XXX
clusterID=CID-XX
cTime=0
datanodeUuid=XXXX-XX
storageType=DATA_NODE
layoutVersion=56
반응형
저작자표시 비영리 동일조건 (새창열림)

'빅데이터 > hdfs' 카테고리의 다른 글

[hdfs] 네임노드의 fsimage 파일 구조  (0) 2022.02.22
[hdfs] webhdfs에 요청을 보냈을 때 Operation category READ is not supported in state standby. Visit https://s.apache.org/sbnn-error 오류 처리  (0) 2021.07.08
[hdfs] HDFS WebHDFS REST API 사용법  (0) 2020.01.09
[hadoop-hdfs] HDFS Archival Storage, SSD & Memory  (0) 2019.08.07
[EMR-HDFS] EMR의 HDFS 운영중 Non DFS Used 용량이 늘어나서 실제 이용할 데이터가 줄어드는 문제  (0) 2019.07.22
'빅데이터/hdfs' 카테고리의 다른 글
  • [hdfs] webhdfs에 요청을 보냈을 때 Operation category READ is not supported in state standby. Visit https://s.apache.org/sbnn-error 오류 처리
  • [hdfs] HDFS WebHDFS REST API 사용법
  • [hadoop-hdfs] HDFS Archival Storage, SSD & Memory
  • [EMR-HDFS] EMR의 HDFS 운영중 Non DFS Used 용량이 늘어나서 실제 이용할 데이터가 줄어드는 문제
hs_seo
hs_seo
Hello World!
    반응형
  • hs_seo
    개발자로 살아남기
    hs_seo
  • 전체
    오늘
    어제
    • 전체 (1140)
      • 개발자 (21)
        • 개발에 유의할 점 (0)
        • 면접 (5)
      • IT 소식 (5)
        • 업계 (1)
      • java (51)
        • 디자인패턴 (3)
        • apache-common (1)
      • 개념 (47)
        • 자료구조 (4)
        • 함수형사고 (8)
        • 디자인패턴 (1)
      • 데이터분석 (1)
      • python (67)
        • 코드조각 (12)
        • 라이브러리 (2)
      • 빅데이터 (418)
        • zookeeper (5)
        • hadoop (78)
        • hdfs (12)
        • hive (127)
        • hbase (16)
        • spark (40)
        • scala (4)
        • trino (3)
        • oozie (41)
        • Hue (9)
        • R (5)
        • sqoop (6)
        • flume (3)
        • elasticsearch (2)
        • airflow (16)
        • kafka (3)
        • kubernetes (10)
        • openstack (3)
        • flink (2)
        • redis (2)
      • 빅데이터 강좌 (2)
      • 알고리즘 (131)
        • 알고리즘 (1)
        • 백준 (61)
        • 정올 (41)
        • 더블릿 (5)
        • 프로그래머스 (1)
      • 프로그래밍 언어 (30)
        • go (4)
        • js (9)
        • .Net (6)
        • Jsp (1)
        • ansible (3)
        • terraform (6)
      • Tools (56)
        • docker (2)
        • macbook (6)
        • maven (3)
        • sublime (1)
      • 프레임워크 (25)
        • [JS] angularjs (2)
        • [JS] node.js (19)
        • [Java] spring (2)
        • Android (2)
      • 데이타베이스 (43)
        • SQLD (5)
        • Oracle (1)
        • MySQL (8)
        • ADsP (2)
      • 리눅스 (25)
        • Bash (61)
      • GCP (5)
      • AWS (34)
        • EC2 (2)
        • EMR (14)
      • 정보보안기사 (4)
        • 네트워크 (1)
      • 개인 (80)
        • 업무실수 (0)
        • 책 (9)
        • 교육 (3)
        • 여행 (17)
        • 영화 (12)
        • 음악 (2)
        • 피규어 (4)
        • 게임 (3)
        • 생각 (7)
        • 기타 (10)
        • 좋은글 (5)
        • 좋은 사이트 (2)
  • 블로그 메뉴

    • 홈
    • 태그
    • 미디어로그
    • 위치로그
    • 방명록
  • 링크

    • 빅데이터-하둡,하이브로 시작하기
    • 빅데이터-스칼라, 스파크로 시작하기
    • Kaggle에서 파이썬으로 데이터 분석 시작하기
    • 쉘스크립트 개발 시작하기
    • 개발자가 데이터 분석 준전문가 되기
    • 데브쿠마
  • 공지사항

  • 인기 글

  • 태그

    Tez
    oozie
    emr
    하둡
    Linux
    mysql
    알고리즘
    HDFS
    Hadoop
    S3
    k8s
    백준
    AWS
    build
    하이브
    hbase
    파이썬
    airflow
    정올
    yarn
    error
    nodejs
    Python
    HIVE
    ubuntu
    SPARK
    java
    오류
    다이나믹
    bash
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
hs_seo
[hadoop-hdfs] HDFS 포맷 하는 방법
상단으로

티스토리툴바