gsutil 명령 중에서 acl ch, acl set, cp, mv, rm, rsync, setmeta 명령은 병렬로 수행하여 처리 속도를 높일 수 있습니다. -m옵션을 이용하면, 멀티 프로세싱과 멀티 스레딩을 이용하여 처리 속도를 높입니다. 네트워크 속도가 적절하지 않으면 처리 속도가 늦을 수도 있습니다. 상황에 맞게 적절하게 사용하는 것이 좋습니다. .boto파일에 옵션을 추가하여 성능을 조절할 수 있습니다.
-m 사용 옵션
gsutil -m cp gs://bucket-name/dir1/* gs://bucket-name/dir2/*
gsutil -m rsync gs://bucket-name/dir1/ gs://bucket-name/dir2/
.boto 파일 설정
.boto 병렬 처리에 사용하는 옵션은 다음과 같습니다.
# OS Process
parallel_process_count = 1
# Python threads
parallel_thread_count = 5
# Composite Upload. 가능하다면 200M 이상 파일은 50M 단위로 분할 업로드
parallel_composite_upload_threshold = 200M
parallel_composite_upload_component_size = 50M
실행시 옵션 추가
gsutil 실행시 옵션을 추가할 때는 -o 옵션을 이용합니다.
# 개별 옵션 설정
gsutil -o GSUtil:parallel_composite_upload_threshold=150M
참고
반응형
'GCP' 카테고리의 다른 글
| [GCP-Dataproc] Dataproc을 생성할 때 Insufficient 'CPUS' quota 오류 해결 방법 (0) | 2021.04.20 |
|---|---|
| [GCP] 빅쿼리 CLI 기본 명령어 이용방법 (1) | 2020.08.02 |
| [GCP] 구글 클라우드 스토리지 AccessDeniedException: 403 Insufficient Permission (1) | 2020.07.24 |
| [gcp] gsutil에서 AuthorizationHeaderMalformed 오류 해결 방법 (0) | 2020.07.15 |