hadoop streaming 실행시 특별한 에러가 메시지 없이 job이 종료되었다.

hadoop job url도 특별히 문제 없는데... map 시작 전에 아래와 같은 에러가 발생했다.


ERROR streaming.StreamJob: Job not successful. Error: NA INFO streaming.StreamJob: killJob... Streaming Command Failed!




원인은 hadoop streaming에 쓰는 mapper에 사용하는 python 코드에 indent가 잘 못 되어 있었다.  흘...


..

        -mapper \"dump.py ${YEAR}${MONTH}${DAY}\" \

        -file dump.py \

...


문제의 원인은 역시 사람의 버그였다. 



python -m py_compile dump.py 을 이용하여 문법 체크를 미리 하는 것이 좋다. 


Posted by '김용환'
,