hadoop 1.2.1 과 hive 1.0.1에 대한 설치 내용을 간략히 기술한다.
* hadoop 로컬 실행 모드 설치
1) ssh
hadoop을 로컬 실행 모드로 실행하기 위해서 ssh가 연결할 수 있는 환경이어야 한다.
./bin/start-all.sh실행시 ssh로 연결하니 ssh를 잘 연결해야 한다.
$ ssh-keygen
$ cat ~/.ssh/id_rsa.pub | ssh localhost 'cat >> ~/.ssh/authorized_keys'
$ ssh -l 계정 localhost
또는
$ ssh 계정@localhost
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/known_hosts
2) 환경설정
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_40.jdk/Contents/Home
3) 하둡 다운로드
curl http://apache.tt.co.kr/hadoop/common/hadoop-1.2.1/hadoop-1.2.1-bin.tar.gz
설치
mv 압축디렉토리 /usr/local/hadoop-1.2.1
4) 하둡 설정 수정
$ vi /usr/local/hadoop-1.2.1/conf/mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
$ vi /usr/local/hadoop-1.2.1/conf/hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
$ vi /usr/local/hadoop-1.2.1/conf/core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
5) 환경 변수 추가
.bashrc에 다음을 추가
(만약 JAVA_HOME을 설정안했다는 로그가 출력하면, .profile에도 추가한다.)
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_40.jdk/Contents/Home
export PATH=/usr/local/hadoop-1.2.1/bin:$PATH
6) 네임 노드를 포맷한다.
$ ./bin/hadoop namenode -format
만약 권한 이슈관련 에러가 발생한다면, 에러가 발생한 네임노드 디렉토리에 chmod 755 명령어를 이용한다.
(네임노드 포맷을 하지 않으면, http://localhost:50070/dfshealth.jsp 페이지를 열 수 없으며,
logs 디렉토리의 로그 파일 에서 ipc.Client: Retrying connect to server: localhost/127.0.0.1:9000 이란 로그를 볼 수 있을 것이다.)
예) chmod 755 /tmp/hadoop/dfs/name
7) 실행
$ ./bin/start-all.sh
에러 없고, 데몬 잘 뜬 경우라면 잘된 경우이다.
8) 확인
브라우져에서 http://localhost:50030/jobtracker.jsp를 열어서 jobtracker 페이지가 동작하는 지 확인한다.
브라우져에서 http://localhost:50070/dfshealth.jsp를 열어서 namenode 페이가 동작하는 지 확인한다.
* hive 설치
1) hive 1.0.1 버전을 설치
http://apache.tt.co.kr/hive/hive-1.0.1/apache-hive-1.0.1-bin.tar.gz를 다운로드한다.
압축을 풀고, /usr/local/hive-1.0.1에 복사한다.
2) 권한 설정
hadoop fs -mkdir /tmp
hadoop fs -mkdir /user/hive/warehouse
hadoop fs -chmod go+w /tmp
hadoop fs -chmod go+w /user/hive/warehouse
hadoop fs -chmod go+w /tmp/hive
3) PATH 설정
bashrc에 PATH에 /usr/local/hive-1.0.1/bin를 추가한다.
$ vi ~/.bashrc
export JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_40.jdk/Contents/Home
export PATH=/usr/local/hadoop-1.2.1/bin:/usr/local/hive-1.0.1/bin:$PATH
정상적으로 동작하는지 확인한다.
hive> show tables;
OK
Time taken: 0.012 seconds
hive> select 1 + 1;
OK
2
Time taken: 0.342 seconds, Fetched: 1 row(s)
'hadoop' 카테고리의 다른 글
[hive] hive cli history (0) | 2016.04.17 |
---|---|
[hive] HiveServer2 (0) | 2016.04.16 |
[hive] 함수 설명 보기 (0) | 2016.03.28 |
[hive] 하이브는 등가 조인(equal join)만 지원한다. (0) | 2016.03.25 |
[hive] 데이터를 하나로 합치기 (0) | 2016.02.29 |