[hive] 하이브의 조인방식(hive join)

하이브의 세가지 조인 방식에 대해서 알아보겠습니다.

-- 맵조인 사용여부 설정, 3개 이상의 테이블을 조인할 때 맵조인 사용여부 설정하는 옵션

hive> set hive.auto.convert.join=true;

hive> set hive.auto.convert.join.noconditionaltask=true;

hive> set hive.auto.convert.join.noconditionaltask.size=10000000;

-- 맵조인에 사용되는 테이블의 사이즈 설정 30MB 이하면 맵조인

hive> set hive.mapjoin.smalltable.filesize=30000000;

-- 맵조인의 기준 테이블 설정 힌트

Select /*+ MAPJOIN(b) */ a.key, a.value

from a join b on a.key = b.key

불러오는 중입니다...

[hive] UDF에서 발생하는 argument type mismatch 오류 수정 (0)	2020.01.14
[hive] 벡터화(vectorized) 처리 (0)	2020.01.07
[hive] Blobstore 기능으로 처리 속도 증가 (0)	2019.12.19
[hive] MSCK is missing partition columns under location. 오류 해결 방법 (0)	2019.12.04
[hive] Error in getting fields from serde.Invalid Field null 오류 수정 방법 (0)	2019.12.04

티스토리툴바