Публикации по теме 'kafka'
Обнаружение аномалий в реальном времени для инженеров данных
Привет, энтузиасты технологий, надеюсь, у вас все хорошо, и прошу прощения за мое отсутствие. Мне очень не хватало возможности делиться своими статьями и общаться со всеми вами. Я почувствовал ответственность вернуться и продолжить предоставлять ценный контент.
Сегодня я хочу поговорить о чем-то особенном и ценном — об обнаружении аномалий в реальном времени. В этой статье я буду обсуждать концепции потоковой передачи в реальном времени и познакомлю вас с подробным проектом, шаг за шагом..
6 основных идей, которые следует знать перед использованием коннектора приемника Kafka Connect BigQuery
В одном из наших проектов мы транслируем большой объем данных, как из баз данных, так и из приложений Kafka Stream, в наше хранилище данных Google BigQuery . Поскольку все наши данные находятся в темах Kafka , мы используем коннектор приемника Kafka Connect BigQuery , чтобы перемещать все вокруг.
Для POC отлично работает быстрая установка, и вам не понадобится много документации. Раздел Configuration Basics в README достаточно хорош. В конце концов вы поймете, для чего нужен..
Реализовать объединение тем Kafka с помощью Golang 🔥
Привет! Сегодня мы создадим производителя и потребителя Kafka в Go. Generics, новая функция Golang, будет нам полезна. Обобщения чрезвычайно полезны при работе с многочисленными видами в одном контексте.
Инструменты
Давайте оценим наши потребности; ✨
Докер Golang 1.18 или новее
Мы можем настроить нашу иерархию папок, как показано ниже:
- producer
- producer.go
- main.go
- types.go
- consumer
- main.go
- types.go
- connection.go
main.go
.gitignore
config.yaml..
Kafka Docker: запуск нескольких брокеров Kafka и сервисов ZooKeeper в Docker
Чтобы упростить обработку нагрузок, настройте многоузловой кластер Kafka на Docker.
Apache Kafka - это распределенная потоковая платформа, которая может публиковать и подписываться на потоки записей, хранить потоки записей для отказоустойчивой обработки и обрабатывать потоки записей.
В общем, есть два основных использования Kafka:
Создание конвейеров потоковой передачи данных в реальном времени, которые надежно передают данные между системами или приложениями. Создание потоковых..