본문 바로가기
빅데이터/hive

[hive] 조회 조건에 정규식 이용하기

by hs_seo 2014. 12. 26.

하이브 데이터 조회 조건을 정규식을 이용하여 분리하는 방법은 다음과 같다.

 

 <조회 쿼리>

select 칼럼명
  from 테이블명
 where 칼럼명 rlike '^[a-zA-Z0-9]*$'; 

 

조회 쿼리에 rlike 를 이용하면 된다.

regexp 로 대체하여도 동일한 결과를 출력한다.

 

정규식은 java 에서 사용하는 정규식과 동일하다.

위의 조회에 사용된 표현식은 처음[^] 부터 끝[$] 까지 영문 대소문자와 숫자 의 반복[*]으로 표현된 문자열만 찾는 쿼리이다.

 

<hive UDF>

https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF


반응형