Как мы работаем:
- Определяем критерии, по которым будем формировать состав хеша. Например, для транзакций — это будет ID товара, дата и время, номер чека и ID торговой точки.
- Получаем хеш-ключи для каждой записи.
- Проводим сверку на слое DWH:
- Определяем последние загруженные данные на слое STG по хешу и периоду.
- Сравниваем данные со слоя STG и DWH за одинаковый период.
- Если есть новая запись для хеша — заменяем ее на слое DWH.
- Если появился полностью новый хеш — добавляем новую запись на слой DWH.
Плюсы такого подхода: мы не сравниваем весь массив данных, что помогает значительно сократить время обработки данных.