EMR에서 하이브의 테이블에 MSCK
명령을 이용해서 테이블을 재구성할 때 다음의 오류가 발생하는 경우가 있습니다.
Caused by: org.apache.hadoop.hive.ql.metadata.HiveException: MSCK is missing partition columns under s3://bucket_name/directory_location
원인
이 오류는 지정한 버켓의 폴더가 없어서 발생하는 오류입니다. S3의 특성상 디렉토리만 생성되면 파일시스템에 따라서 $folder$ 가 생성되면서 이 특수 파일이 옮겨지는 과정에서 누락되면 이 오류가 발생합니다.
해결방법
이 오류는 디렉토리를 만들어서 해결할 수도 있고, 아래의 설정을 이용해서 오류가 있는 폴더는 무시하고 처리할 수 있도록 설정할 수 있습니다.
set hive.msck.path.validaation=ignore;
반응형
'빅데이터 > hive' 카테고리의 다른 글
[hive] 하이브의 조인방식(hive join) (0) | 2020.01.06 |
---|---|
[hive] Blobstore 기능으로 처리 속도 증가 (0) | 2019.12.19 |
[hive] Error in getting fields from serde.Invalid Field null 오류 수정 방법 (0) | 2019.12.04 |
[hive] 하이브 schemaTool을 이용하여 스키마 생성 (0) | 2019.10.30 |
[hive] 테이블 DROP 시 발생하는 Caused by: MetaException(message:Timeout when executing method: drop_table_with_environment_context; 69853ms exceeds 60000ms) 오류 (0) | 2019.07.29 |