티스토리 뷰
TestDFSIO는 하둡에서 HDFS의 성능을 체크하기 위해서 제공하는 기능입니다. 파일 개수와 사이즈를 지정하여 HDFS의 대역폭과 read, write 시간을 확인할 수 있습니다. 소스코드 하둡 GIT(바로가기)에서 확인할 수 있습니다.
자신이 다운로드 받은 라이브러리 중에서 examples나 test jar 파일에 해당 소스코드가 들어 있습니다. jar파일은 메이븐에서 다운로드 할 수 있습니다. hadoop-mapreduce-client.jobclient*.jar 로 검색하면 됩니다.
mvnrepository.com/artifact/org.apache.hadoop/hadoop-mapreduce-client-jobclient/2.10.0
TestDFSIO 기본 옵션
기본적인 옵션은 read, write, clean 입니다. write를 이용하여 파일을 쓰고, read를 이용하여 파일을 읽고, clean을 이용하여 테스트용 파일을 정리하는 순서로 이용하면 됩니다.
- write: 파일 쓰기
- read: 파일 읽기
- clean
- 처리 결과는 resFile 옵션으로 파일을 지정하지 않으면, 실행 경로에 TestDFSIO_results.log 파일로 저장
- nrFiles: 파일 개수
- size: 파일당 사이즈
$ hadoop jar hadoop-mapreduce-client-jobclient-3.0.0-cdh6.2.0-tests.jar TestDFSIO 19/06/18 04:19:45 INFO fs.TestDFSIO: TestDFSIO.1.8 Usage: TestDFSIO [genericOptions] -read [-random | -backward | -skip [-skipSize Size]] | -write | -append | -truncate | -clean [-compression codecClassName] [-nrFiles N] [-size Size[B|KB|MB|GB|TB]] [-resFile resultFileName] [-bufferSize Bytes] [-rootDir] |
TestDFSIO 사용법
기본적인 사용법과 출력 결과는 다음과 같습니다.
반응형
'빅데이터 > hadoop' 카테고리의 다른 글
[hadoop] YARN 클러스터 사용량 모니터링 스크립트 (0) | 2019.07.03 |
---|---|
[hadoop] The ownership on the staging director /tmp/hadoop-yarn/staging/root/.staging is not as expected 오류 처리 (0) | 2019.06.18 |
[hadoop] 리소스매니저 UI의 Memory Reserved (0) | 2019.05.15 |
[hadoop] 하둡 오존(ozone) - 분산 객체 저장소(Object Storage) (0) | 2019.05.08 |
[hadoop] hdfs namenode 실행중 Invalid URI for NameNode address (check fs.defaultFS): 오류 처리 (0) | 2019.04.16 |
반응형
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 오류
- SPARK
- nodejs
- error
- 하이브
- Tez
- Python
- yarn
- java
- SQL
- ubuntu
- Hadoop
- HDFS
- 하둡
- hbase
- Linux
- mysql
- AWS
- 다이나믹
- HIVE
- oozie
- 알고리즘
- 파이썬
- airflow
- 백준
- S3
- emr
- 정올
- bash
- build
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함