2018년 5월 발표된 하이브3의 특징에 대해서 알아보겠습니다.
워크로드 관리 추가
하이브 쿼리를 이용해 작업 부하 관리가 가능해 졌습니다. Role, Plan 을 이용하여 쿼리의 수행에 제약을 걸 수 있습니다.
시스템 데이터베이스, 테이블 추가
테이블의 칼럼, 데이터베이스 정보를 확인할 수 있는 테이블이 추가 되었습니다. 오라클의 시스템 DB와 같습니다. 또한, 커넥터를 제공하여 사용자가 JDBC등을 이용하여 직접 조회할 수도 있습니다.
구체화 뷰 추가
Materialized View 가 추가 되었습니다. 집계 데이터 조회시 구체화 뷰를 이용해 좀더 빠른 처리가 가능합니다. 일반적인 뷰는 실제 데이터를 가지지 않고, 논리적 구조만을 가지고 있습니다. 구체화뷰는 실제 데이터를 가지고 있으며, 테이블에 데이터가 입력, 수정, 삭제 될 때 같이 데이터를 수정합니다.
성능향상
쿼리 결과 캐싱을 이용해 재작업 처리 성능이 향상되었습니다.
호튼웍스 - What's new in Hive 3
반응형
'빅데이터 > hive' 카테고리의 다른 글
[hive] 테이블의 파티션을 범위로 삭제(Drop)하는 방법 (0) | 2019.04.01 |
---|---|
[hive] 하이브의 LLAP(Live Long And Process) 구조 (0) | 2019.02.26 |
[hive] CLI 동작중 에러 발생시 무시하기 (0) | 2019.02.22 |
[hive] 작은 사이즈의 파일 머지 설정과 그로 인한 오버헤드 (0) | 2019.02.20 |
[hive] 테이블 파티션의 로케이션 정보 확인, 생성, 수정 방법 (0) | 2019.01.17 |