Apache Kafka

Autora: Louise Ward
Data De La Creació: 5 Febrer 2021
Data D’Actualització: 28 Juny 2024
Anonim
Введение в Apache Kafka, первая тема открытого базового курса
Vídeo: Введение в Apache Kafka, первая тема открытого базового курса

Content

Definició: què significa Apache Kafka?

Apache Kafka és un sistema de publicació-subscripció de codi obert dissenyat per proporcionar una gestió ràpida, escalable i que tolera les errades dels feeds de dades en temps real. A diferència del programari tradicional de missatgeria empresarial, Kafka és capaç de manejar totes les dades que circulen per una empresa i fer-ho en temps real.


Kafka està escrit a Scala i originalment va ser desenvolupat per LinkedIn. Des de llavors, diverses empreses l'han utilitzat per crear plataformes en temps real.

Una introducció a Microsoft Azure i al Microsoft Cloud | Durant aquesta guia, podreu conèixer què és la informàtica en núvol i com Microsoft Azure us pot ajudar a migrar i executar el vostre negoci des del núvol.

Techopedia explica Apache Kafka

Kafka té moltes semblances amb els registres de transaccions i manté els feeds de temes relacionats. Els productors escriuen dades als temes i els consumidors llegeixen d'aquests temes, que es divideixen i es repliquen a diversos nodes en un format de sistema distribuït. Kafka és únic en què tracta cada partició de temes com un registre i a cada partició se li assigna un offset únic. Conserva tots els temps durant un temps determinat, i els consumidors són els responsables de fer el seguiment de la ubicació a cada registre. Això difereix dels sistemes anteriors, on els corredors eren els responsables d’aquest seguiment, que limitava molt la capacitat d’escalar els sistemes a mesura que augmentava el nombre de consumidors. Aquesta estructura permet a Kafka donar suport a molts consumidors i retenir grans quantitats de dades amb despeses generals molt baixes.


Kafka es pot utilitzar:

  • Com a corredor tradicional
  • Per al seguiment d’activitats d’un lloc web
  • Per a l’agregació de registres
  • Per al processament de flux de dades gran

Kafka es pot utilitzar al costat d'Apache Storm, Apache HBase i Apache Spark per a l'anàlisi i la reproducció de dades en temps real.