아래와 같은 클라이언트에서 hadoop에러가 발생했다.
org.apache.http.conn.HttpHostConnectException: Connection to http://google-hadoop-dn4.dakao.io:40060 refused
hadoop ui에 다음과 같이 154 에러가 발생했다.
Application application_1544089295328_663490 failed 1 times due to AM Container for appattempt_1544089295328_663490_000001 exited with exitCode: 154
이 이유는 Job 실행 중간에 노드가 내려가면서 발생한 것이었다.
컨테이너 (프로세스 트리)가 아직 실행 중일 때 RecoveredContainerLaunch(https://hadoop.apache.org/docs/r2.9.2/hadoop-yarn/hadoop-yarn-server/hadoop-yarn-server-nodemanager/apidocs/org/apache/hadoop/yarn/server/nodemanager/containermanager/launcher/RecoveredContainerLaunch.html)이 주기적으로 폴링하여 프로세스가 종료되었는지 확인하고 생성된 종료 코드 파일에서 종료 코드를 얻는다.
컨테이너에서 종료 코드가 없어서 다시 가져 오기를 하려고 하고.
다시 실패하면 컨테이너는 LOST (Exit 154)로 알린다.
154번에 대한 에러 코드는 다음과 같다.
public enum ExitCode {
FORCE_KILLED(137),
TERMINATED(143),
LOST(154);
private final int code;
private ExitCode(int exitCode) {
this.code = exitCode;
}
public int getExitCode() {
return code;
}
@Override
public String toString() {
return String.valueOf(code);
}
}
RecoveryContainerLaunch 소스
'hadoop' 카테고리의 다른 글
sqoop 성능 튜닝 (0) | 2019.01.11 |
---|---|
얀(yarn) 기반 spark 애플리케이션 종료 방법 (0) | 2019.01.11 |
[hadoop] No lease on .. File does not exist. (0) | 2018.11.30 |
[phoenix] 피닉스의 timestamp 타입 값을 현재시간으로 확인하기 (0) | 2018.11.20 |
[Hbase-Phoenix] phoenix.schema.isNamespaceMappingEnabled, Cannot create schema because config phoenix.schema.isNamespaceMappingEnabled for enabling name space mapping isn't enabled 에러 발생 (0) | 2018.11.01 |