[More Kafka]1. 브로커 클러스터 다중 클러스터?

[More Kafka]1. 브로커 클러스터 다중 클러스터?


이 글은 카프카 핵심가이드 책을 공부하며 정리하는 글입니다.
책 내용의 일부를 발췌하여 작성하기도 합니다. 책을 구매해서 보시는 편이 낫습니다.

1장. 브로커와 클러스터 재 정리

(컨슈머 프로듀서 카프카가 뭔지? 이야기는 빼고…)

브로커(broker)

  • 하나의 카프카 서버
  • 프로듀서로부터 메시지를 수신.
  • 오프셋을 지정한 후 해당 메시지를 디스크에 저장
  • 컨슈머의 파티션 읽기 요청에 응답과 디스크에 저장된 메시지를 전송

클러스터(cluster)

  • 여러개의 브로커의 집합
  • 여러 브로커 중 하나는 클러스터의 컨트롤러 역할을 수행
  • 컨트롤러는 각 브로커에게 담당 파티션을 할당
  • 브로커의 정상동작을 모니터링함.

그래서 아키텍쳐는?

다중 클러스터

  • 재해 복구를 대비한 다중 데이터 센터를 유지하거나
  • 목적에 따라서 동일한 데이터에 대해서 분리해서 처리할 수 있음.
  • 기본적으로 카프카의 복제 매커니즘은 단일 클러스터에서만 동작
  • 여러 다중 클러스터를 위한 툴이 존재하는데 미러메이커가 대표적이다.
  • 다중 클러스터를 구축하면 하나의 카프카 클러스터에서 소비된 메세지를 다른 클러스터에서도 사용할 수 있다.

  • 얼마전 카프카 밋업에서 소개된 다중 클러스터에서 미러메이커를 대체 할 brooklin(링크드인에서 개발) 에 대해서 이동진님의 소개가 있었다. 아래 깃헙을 참고해보는 것도.. brooklin 소개 이동진님 깃헙