hive의 hql에서 하나의 테이블처럼 데이터를 하나로 합치는 방법은 다음과 같다. union all을 사용한다.
SELECT unioned.id, unioned.var1, unioned.var2
FROM (
SELECT a.id, a.var1, a.var2
FROM table_A a
UNION ALL
SELECT b.id, b.var1, b.var2
from table_B b
) unioned;
주의할 점
1. FROM 절에 쓰는 테이블 명에 다른 alias 이름을 다르게 해줘야 한다.
2. 하위 질의의 필드명이 모두 동일해야 한다.
3. 특히 GROUP BY 절을 쓴다면, select에서 사용하는 as 절 뒷 부분이 아니라, 원래 select 원본 데이터를 기준으로 한다.
'hadoop' 카테고리의 다른 글
| [hive] 함수 설명 보기 (0) | 2016.03.28 |
|---|---|
| [hive] 하이브는 등가 조인(equal join)만 지원한다. (0) | 2016.03.25 |
| [hive] 데이터를 하나로 합치기 (0) | 2016.02.29 |
| [hive] 날짜 구하기 (0) | 2016.02.26 |
| [펌] hadoop streaming 기초 지식 쌓기 (0) | 2016.02.17 |
| [hadoop] top n 소팅 (0) | 2016.02.16 |



댓글을 달아 주세요