scribbling
update되는 DFS - hudi와 delta
'김용환'
2019. 10. 16. 07:53
증분처리(update 포함) 가능한 DFS로 우버의 hoodie가 아파치 인큐베이터 프로젝트가 되었다.
https://github.com/apache/incubator-hudi
https://hudi.apache.org/concepts.html
실제 기존 소스를 보기 위해 https://github.com/uber/hudi 에 접근하면 https://github.com/apache/incubator-hudi 로 리디렉션된다.
데이터브릭스는 이와 비슷한 오픈소스가 있다.. 현재 0.4이다.
https://databricks.com/product/databricks-delta
https://docs.delta.io/0.4.0/quick-start.html
https://github.com/delta-io/delta
https://delta.io/news/delta-lake-0-4-0-released/
둘 다 DFS에 update, 증분처리, timeline 기능을 갖고 있다.