SELECT문에서 GROUP BY 컬럼이 아닌 다른 컬럼을 사용해야 한다면,
GROUP BY 절에 해당 컬럼을 사용하지 않고,
collect_set라는 분석 함수를 사용한다.
collect_set 함수는 중복 엘리먼트를 제거하는 객체 집합을 리턴한다.
예)
SELECT
sex, COLLECT_LIST(sex), count(*)
FROM
member
WHERE
id > 1
GROUP BY
sex;
'hadoop' 카테고리의 다른 글
[hive] hive의 윈도우 표현식(파티션 범위) (0) | 2016.05.11 |
---|---|
[hive] 정렬 키워드 - order by, sort by, cluster by, distribute by (0) | 2016.05.11 |
[hadoop] getmerge 명령어 (0) | 2016.04.21 |
[hive] count와 distinct 이슈 (0) | 2016.04.20 |
[hive] group by 이후에 order by 개수 지정하기 (0) | 2016.04.19 |