HDFS는 REST API를 이용하여 파일을 조회하고, 생성, 수정, 삭제하는 기능을 제공합니다. 이 기능을 이용하여 원격지에서 HDFS의 내용에 접근하는 것이 가능합니다.
REST API 설정
REST API를 사용하기 위해서는 hdfs-site.xml
에 다음의 설정이 되어 있어야 합니다.
-- webhdfs 사용여부 설정
dfs.webhdfs.enabled=true;
-- webhdfs 포트 설정
dfs.namenode.http-address=0.0.0.0:50070;
REST API 사용 방법
위에서 설정한 http 포트로 curl
명령을 이용하여 ls
명령을 날리는 예제는 다음과 같습니다.
-- /user/hadoop 위치를 조회
$ curl -s http://$(hostname -f):50070/webhdfs/v1/user/hadoop/?op=LISTSTATUS
이 외의 여러 가지 사용 가능한 목록은 하둡의 HDFS문서를 참고하면 됩니다.
https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/WebHDFS.html
반응형
'빅데이터 > hdfs' 카테고리의 다른 글
[hdfs] 네임노드의 fsimage 파일 구조 (0) | 2022.02.22 |
---|---|
[hdfs] webhdfs에 요청을 보냈을 때 Operation category READ is not supported in state standby. Visit https://s.apache.org/sbnn-error 오류 처리 (0) | 2021.07.08 |
[hadoop-hdfs] HDFS 포맷 하는 방법 (0) | 2019.12.26 |
[hadoop-hdfs] HDFS Archival Storage, SSD & Memory (0) | 2019.08.07 |
[EMR-HDFS] EMR의 HDFS 운영중 Non DFS Used 용량이 늘어나서 실제 이용할 데이터가 줄어드는 문제 (0) | 2019.07.22 |