EMR 에서 S3 에 올려져 있는 파일을 확인하는 명령어는
- hadoop fs -ls s3://버켓/
- aws s3 ls s3://버켓
이사의 두개의 커맨드가 존재한다.
이중에서 aws 커맨드를 사용할 것을 추천한다.
이유는 aws 커맨드를 사용하는 것이 더 경량이기 때문이다.
hadoop 커맨드는 java, aws 커맨드는 파이썬으로 구성되어 있어서
hadoop 커맨드를 실행할때는 로드되는 커맨드가 많기 때문에 무겁고, 메모리도 많이 먹게 된다.
꼭 hadoop 커맨드를 사용해야 할 경우가 아니라면 aws 커맨드를 사용할 것을 추천한다.
반응형
'AWS > EMR' 카테고리의 다른 글
[EMR] AWS EMR의 버전 선택 (0) | 2019.11.01 |
---|---|
[AWS-EMR] EMR의 하이브메타스토어 재시작 (0) | 2019.10.10 |
[AWS-EMR] EMR 일관성 보기 설정 (0) | 2019.08.06 |
[AWS-EMR] EMR에서 ResourceManager 같은 서비스 목록 확인, 시작 및 종료 (0) | 2019.07.18 |
[AWS/EMR] AMI v4.x 대의 포트 변경 (0) | 2015.08.13 |