scribbling
[펌] druid.io (https://github.com/druid-io/druid)
'김용환'
2015. 12. 30. 21:07
ebay에서 pulsar(http://gopulsar.io/)를 밀고 있다.
(http://www.ebaytechblog.com/2015/02/23/announcing-pulsar-real-time-analytics-at-scale/, http://gopulsar.io/docs/Whitepaper_Pulsar_Real-timeAnalyticsatScale.pdf)
pulsar는 실시간 스트리밍 데이터를 SQL로 처리해주는 라는 실시간 분석 오픈 소스이다. 그런데, 요즘은 commit이 뜸하다.
그러나 pulsar가 쓰는 storage는 druid(https://github.com/druid-io/druid)이다.
pulsar가 cassandra가 group by를 제공하지 않아서 druid를 사용했다고한다.
게다가 보니까. java로 만든 분산 실시간 처리 저장소이며 cardinality는 hyperloglog를 이용하고 있다.
지켜 볼만한 솔루션이라서 끄적끄적거려봤다.