hive 결과를 hadoop 파일 시스템에 저장하기


Select 문 앞에 INSERT OVERWRITE DIRECTORY 커맨드를 사용한다. 


hive -e "INSERT OVERWRITE DIRECTORY '/user/deploy/samuel/test' SELECT DISTINCT id FROM google_log WHERE date=20160128;" --hiveconf mapred.reduce.tasks=1


파일 생성을 확인한다.

$ hadoop fs -ls /user/deploy/samuel/test

Found 1 items

user/deploy/samuel/test/000000_0.gz



내용을 다음과 같이 일부만 확인할 수 있다.

$ hadoop fs -text /user/deploy/samuel/test/000000_0.gz | head -n 10


Posted by '김용환'
,