하이브 데이터 조회 조건을 정규식을 이용하여 분리하는 방법은 다음과 같다.
<조회 쿼리>
select 칼럼명 |
조회 쿼리에 rlike 를 이용하면 된다.
regexp 로 대체하여도 동일한 결과를 출력한다.
정규식은 java 에서 사용하는 정규식과 동일하다.
위의 조회에 사용된 표현식은 처음[^] 부터 끝[$] 까지 영문 대소문자와 숫자 의 반복[*]으로 표현된 문자열만 찾는 쿼리이다.
<hive UDF>
https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF
반응형
'빅데이터 > hive' 카테고리의 다른 글
[hive][개념] 하이브 서버2(hiverserver2), 비라인(beeline) (0) | 2016.08.26 |
---|---|
[하이브] 파티션 복구 하기(repair partitions) (0) | 2016.07.11 |
[에러] hive의 INSERT .. SELECT 작업중 No input paths specified in job 에러 (0) | 2016.06.29 |
[Tip/프로퍼티] hive에서 load 할 파일이 없을 때 발생하는 NullPointerException 회피하기 (0) | 2016.01.06 |
[Hive] 하이브의 정렬, 집계, 유저 함수, 조인, 서브쿼리, 뷰의 정의 (0) | 2015.09.14 |