apache zepplin은 ipython notebook(https://ipython.org/ipython-doc/3/notebook/)와 비슷한 툴이지만, 언어에 국한되지 않은 interactive 툴이다.
hive와 python을 연동하기 위해 0.6.2를 설치한 내용을 공유한다.
$ wget http://apache.tt.co.kr/zeppelin/zeppelin-0.6.2/zeppelin-0.6.2-bin-all.tgz
$ cp zeppelin-env.sh.template zeppelin-env.sh
$ cp zeppelin-site.xml.template zeppelin-site.xml
$ vi zeppelin-env.sh
// 포트를 따로 지정한다.
export ZEPPELIN_PORT=8888
$ vi zeppelin-site.xml
<property>
<name>zeppelin.server.port</name>
<value>8888</value>
<description>Server port.</description>
</property>
여기서 그냥 실행하면 anoymous만 뜨기 때문에 인증을 사용할 수 있도록 수정한다.
자세한 내용은 https://zeppelin.apache.org/docs/0.6.2/security/shiroauthentication.html#2-secure-the-websocket-channel 에 있다.
%hive
select * from stat.profile where logdate = 20161016 order by count desc limit 5
'데이터 분석' 카테고리의 다른 글
fine grained transformation 대 coarse grained transformation (0) | 2017.03.07 |
---|