[hive] collect_set

hadoop 2016. 4. 30. 00:49




SELECT문에서 GROUP BY 컬럼이 아닌 다른 컬럼을 사용해야 한다면, 

GROUP BY 절에 해당 컬럼을 사용하지 않고, 

collect_set라는 분석 함수를 사용한다. 


collect_set 함수는 중복 엘리먼트를 제거하는 객체 집합을 리턴한다.



예)


SELECT

    sex, COLLECT_LIST(sex), count(*)

FROM

    member

WHERE

    id > 1

GROUP BY

    sex;




Posted by 김용환 '김용환'

댓글을 달아 주세요