본문 바로가기
빅데이터/hive

[hive] 하이브 테이블의 null 값 표현

by hs_seo 2016. 10. 24.

하이브의 NULL 값에 대한 기본 표현은 \N 이다. 

따라서 하이브로 쓴 파일을 읽어보면 \N으로 표현되어 있어 파일을 열었을 때 헷갈릴 수가 있다. 


이는 하이브 테이블 설정의 serialization.null.format 를 이용하여 원하는 형태로 수정할 수 있다. 


CREATE EXTERNAL TABLE people_v1 (
  id               INT,
  username         STRING,
  email_address    STRING,
  phone_number     STRING,
  first_name       STRING,
  last_name        STRING,
  middle_name      STRING,
  sex              STRING,
  birthdate        DATE,
  join_date        STRING,
  previous_logins  INT,
  last_ip          STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
LOCATION '/people_v1'
TBLPROPERTIES ('skip.header.line.count'='1','serialization.null.format' = '');




반응형