hive의 hql에서 하나의 테이블처럼 데이터를 하나로 합치는 방법은 다음과 같다. union all을 사용한다.
SELECT unioned.id, unioned.var1, unioned.var2
FROM (
SELECT a.id, a.var1, a.var2
FROM table_A a
UNION ALL
SELECT b.id, b.var1, b.var2
from table_B b
) unioned;
주의할 점
1. FROM 절에 쓰는 테이블 명에 다른 alias 이름을 다르게 해줘야 한다.
2. 하위 질의의 필드명이 모두 동일해야 한다.
3. 특히 GROUP BY 절을 쓴다면, select에서 사용하는 as 절 뒷 부분이 아니라, 원래 select 원본 데이터를 기준으로 한다.
'hadoop' 카테고리의 다른 글
[hive] 함수 설명 보기 (0) | 2016.03.28 |
---|---|
[hive] 하이브는 등가 조인(equal join)만 지원한다. (0) | 2016.03.25 |
[hive] 날짜 구하기 (0) | 2016.02.26 |
[펌] hadoop streaming 기초 지식 쌓기 (0) | 2016.02.17 |
[hadoop] top n 소팅 (0) | 2016.02.16 |