하둡이나 스파크에 data locality 라는 단어가 종종 나오는데.. 의미는..
데이터 지역성은 계산하기 위해 데이터를 이동하는 것이 아니라 데이터를 그대로 두고 계산을 이동시키는 개념이다.
빅 데이터를 계산하기 위해 데이터를 이동(move)를 최대한 줄여
시스템 쓰루풋(throughput)과 혼잡도를 늦추게 하는 것이다.
따라서 통신 대역폭이 당연히 줄어들고 성능은 늘어난다.
'hadoop' 카테고리의 다른 글
[hive] json 필드 이름에 특수 문자가 포함시 쿼리 보내기 (1) | 2018.04.30 |
---|---|
keytab 파일 확인/cron 사용하기 (0) | 2017.12.04 |
[phoenix] phoenix - jdbc 연동하기 (0) | 2017.10.11 |
[phoenix] PQS (0) | 2017.10.11 |
[hadoop] hadoop dfs count 커맨드 예제 (0) | 2017.09.12 |