ebay에서 pulsar(http://gopulsar.io/)를 밀고 있다.

(http://www.ebaytechblog.com/2015/02/23/announcing-pulsar-real-time-analytics-at-scale/, http://gopulsar.io/docs/Whitepaper_Pulsar_Real-timeAnalyticsatScale.pdf)


pulsar는 실시간 스트리밍 데이터를 SQL로 처리해주는 라는 실시간 분석 오픈 소스이다. 그런데, 요즘은 commit이 뜸하다.

그러나 pulsar가 쓰는 storage는 druid(https://github.com/druid-io/druid)이다. 


pulsar가 cassandra가 group by를 제공하지 않아서 druid를 사용했다고한다.

게다가  보니까. java로 만든 분산 실시간 처리 저장소이며 cardinality는 hyperloglog를 이용하고 있다.


지켜 볼만한 솔루션이라서 끄적끄적거려봤다. 


Posted by '김용환'
,