CDC는 변경 데이터 캡처(Change Data Capture)의 약자로서 다른 소프트웨어가 이러한 변경 사항에 응답 할 수 있도록 데이터의 변경 사항을 모니터링하고 캡처하는 시스템의 오래된 용어이다.
데이터웨어 하우스에는 CDC 지원 기능이 내장되어 있다. 업스트림 OLTP 데이터베이스에서 데이터가 변경되면 데이터웨어 하우스를 최신으로 유지해야 한다.
대표적으로 Debezium(발음은 디비지움이라 함, https://debezium.io/docs/contribute/)이 요즘 뜨고 있는데.. 기본적으로 다양한 데이터베이스 시스템 모니터링을 지원 하는 현대적이고 분산 된 오픈 소스 변경 데이터 캡처 플랫폼이다.
(https://vladmihalcea.com/a-beginners-guide-to-cdc-change-data-capture/ 참고)
https://vladmihalcea.com/a-beginners-guide-to-cdc-change-data-capture/
https://developers.redhat.com/videos/youtube/QYbXDp4Vu-8/
https://www.youtube.com/watch?v=IOZ2Um6e430&feature=youtu.be
https://techmagie.wordpress.com/2018/04/01/accelerating-data-loading-into-data-lake-using-cdc/
https://www.ridicorp.com/blog/2017/10/30/binlog-collector/
https://www.linkedin.com/pulse/change-data-capture-postgresql-via-debezium-part-1-paolo-scarpino/
https://www.slideshare.net/ceposta/the-hardest-part-of-microservices-your-data
https://wecode.wepay.com/posts/streaming-databases-in-realtime-with-mysql-debezium-kafka
https://debezium.io/blog/2018/12/05/automating-cache-invalidation-with-change-data-capture/
<고민꺼리>
CDC를 실제로 구현하기 위한 작업이 만만치 않은 것 같다.
GTID, bin 포맷, 운영이슈(MHA 등), 아키텍처
'scribbling' 카테고리의 다른 글
Proxy 테스트 코드 (0) | 2019.03.07 |
---|---|
구글 논문 - 코드 저장소는 단일화(monolithic)가 좋더라.. (0) | 2019.03.06 |
여러 컨슈머가 동일 토픽에서 메시지를 읽을 때 사용하는 주요 패턴 - 로드 밸런싱, 팬 아웃 (0) | 2019.03.02 |
일반적인 파티션이 DB와 Nosql에서 사용되는 용어 확인하기 (0) | 2019.02.27 |
펌 김창준씨의 함께 자라기(애자일로 가는 길) - Aristotle Project (0) | 2019.02.27 |