본문 바로가기
빅데이터/hive

[hive] UDAF 구현 예제

by hs_seo 2017. 3. 27.

UDAF는 AbstractGenericUDAFResolver를 상속하여 구현한다.

  • Resolver 클래스
    • 전달파라미터를 체크
    • 실제 처리 프로세스 구현체(GenericUDAFEvaluator 구현)를 반환
  • Evaluator 클래스 
    • init(), merge(), terminatePartial() 등의 실제 처리 구현

<Evaluator 클래스 주요 구현>
  • getNewAggregationBuffer() - 집계에 사용할 AggregationBuffer 반환
  • reset - aggregation 이 재사용될 때의 처리
  • init - 입력 받는 아규먼트와 반환값의 타입을 지정
  • iterate - 매퍼가 동작하는 동안 반복하는 작업
  • terminatePartial - 부분적으로 집계작업을 종류할 때 작업
  • merge - 집계작업의 결과를 머지할 때 
  • terminate - 작업이 종료될 때






반응형