The packagepartitioner from igorium

PackagePartitioner масштабируется горизонтально. Запускает продьюсеров по числу топиков.
- Sharding по хешу коробки определяет топик и соответственно ноду БД
Кафка содержит 1 топик на 1 физический узел БД
- пишет идепотентно исключая дубликаты и ожидает подтверждения персистентности
PackageConsumer по одному на топик и соотвественно на узел БД
- Хранит свой offset в БД
- Так как является единственным писателем в БД избавляет от гонки
Запись в БД происходит транзакционно
- Получаем несколько записей из очереди
- В одной транзакции пишем в таблицу и оффсет в БД
- После комита транзакции комитим оффсет в очередь
Коробку находи одним запросом в БД
- Sharding по хешу коробки определяет ноду БД
Выборку по вторичному индексу (containerId) в данной реализации необходимо производить на всех узлах
- можно реализовать поддержку 2х primary индексов, две таблицы: boxId/containerId и containerId/boxId но это сильно усложнит путь записи и поддержку консистентности

Перебалансировка:

Описана в классе Sharding.Map ()
- Создаем секций больше чем физических узлов (ScaleFactor = 10)
- Поддерживаем маппинг секций на узлы
- При добавлении физических узлов – обновляем маппинг
- Поддерживаем две версии маппинга пока идет перемещение данных
При добавлении физических узлов нужно отскелить соотвественно:
- Продьюсеров в PackagePartitioner
- Топики в кафка
- Инстансы PackageConsumer
Хранить маппинг предпочтитетльно в централизованном хранилище (zookeeper, consul и тд)

igorium / packagepartitioner Goto Github PK

packagepartitioner's Introduction

packagepartitioner's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent