ebay에서 pulsar(http://gopulsar.io/)를 밀고 있다.

(http://www.ebaytechblog.com/2015/02/23/announcing-pulsar-real-time-analytics-at-scale/, http://gopulsar.io/docs/Whitepaper_Pulsar_Real-timeAnalyticsatScale.pdf)


pulsar는 실시간 스트리밍 데이터를 SQL로 처리해주는 라는 실시간 분석 오픈 소스이다. 그런데, 요즘은 commit이 뜸하다.

그러나 pulsar가 쓰는 storage는 druid(https://github.com/druid-io/druid)이다. 


pulsar가 cassandra가 group by를 제공하지 않아서 druid를 사용했다고한다.

게다가  보니까. java로 만든 분산 실시간 처리 저장소이며 cardinality는 hyperloglog를 이용하고 있다.


지켜 볼만한 솔루션이라서 끄적끄적거려봤다. 


Posted by 김용환 '김용환'

댓글을 달아 주세요