hive에서 count를 사용하기 위해 group by 컬럼을 적용한 후 order by 컬럼을 사용할 때 사용할 팁이다.
특정 필드를 기반으로 group by 후, count 별 역순으로 확인할 때,
order by 뒤에 들어갈 필드는 count(*)에 대한 앨리어스를 사용하면 잘된다.
select timezone, count(*) as count from request where date=20160401
group by timezone order by count desc limit 30
'hadoop' 카테고리의 다른 글
[hadoop] getmerge 명령어 (0) | 2016.04.21 |
---|---|
[hive] count와 distinct 이슈 (0) | 2016.04.20 |
[hive] ALTER TABLE 예시 (0) | 2016.04.19 |
[hive] alter table 시 주의 사항 (0) | 2016.04.19 |
[hive] hive.cli.print.header (0) | 2016.04.19 |