principes et pratiques Kafka - pile de technologie de plate-forme cloud

plate-forme Cloud public 0-1 n � comme il �tait pr�occup� par son

EXAMEN: Avant de publier la pile de la technologie de plate-forme cloud (ps: Cliquer pour voir), parler principalement de Kafka eux!

1, la compr�hension Kafka

A propos de Kafka 1.1

Kafka est une plate-forme de diffusion multim�dia en continu distribu�

site officiel kafka: http: //kafka.apache.org/

(1) plateforme de streaming de m�dias a trois fonctions cl�s:

�Publier et abonnez-vous flux enregistrement, similaire � la file d'attente de messages ou les syst�mes de messagerie d'entreprise.
�Dans stockage � tol�rance de panne de mani�re persistante flux enregistr�.
�Lorsque le flux de traitement d'enregistrement se produit.

(2) Kafka couramment utilis� pour deux types d'applications:

�La construction de l'acquisition de donn�es fiable conduite en continu et en temps r�el ou des donn�es entre les applications du syst�me.
�La construction de la conversion ou en r�ponse � diffusion en temps r�el flux de donn�es d'application.

Pour savoir comment faire ces choses Kafka, la fouille let dans la capacit� de Kafka.

(3) Tout d'abord, plusieurs concepts:

�Kafka comme un groupe en cours d'ex�cution sur un ou plusieurs serveurs sur plusieurs centres de donn�es.
�groupe Kafka � la cat�gorie de magasin appel� sujets th�me du flux enregistr�.
�Chaque enregistrement contient une cl�, une valeur et un horodatage.

(4) Kafka a quatre API de base:

API Producteur (API producteur) permet aux applications de publier le flux enregistr� � un ou plusieurs des sujets kafka (th�mes).
API � la consommation (API de consommation) permet aux applications de souscrire un ou plusieurs sujets (sujets), et traite le flux de donn�es g�n�r� par leur dossier.
Streams API (API de flux) permet aux applications d'agir en tant que processeur d'�coulement, � partir de l'un ou plusieurs flux d'entr�e Topics (sujets) consomm�s, et g�n�re un flux de sortie � un ou plusieurs sujets (sujets) de sortie, transformer efficacement la le flux d'entr�e pour le flux de sortie.
�API de connecteur (API connecteur) permet la construction et l'exploitation de sujets kafka (en la mati�re) est connect� � une application existante ou r�utiliser le producteur de donn�es ou un syst�me de consommation. Par exemple, un connecteur de base de donn�es relationnelle pour capturer toutes les modifications possibles � la table.

�Dans Kafka, la communication entre le client et le serveur est un simple, de haute performance, le protocole TCP ind�pendant de la langue termin�e. Cet accord a �t� versionn� et maintenir la compatibilit� avec les anciennes versions. Kafka fournit un client Java, mais le client est disponible en plusieurs langues.

1.2 th�mes et partitions Sujets partition

�Nous avons d'abord une compr�hension en profondeur de l'�me abstraction Kafka � enregistrer des flux - les sujets � th�me

�message Sujet d'un peut �tre consid�r� comme un groupe, chaque sujet est divis� en une pluralit� de partitions (zone), � chaque niveau de partition est le stockage ajout du fichier journal

�Th�me est publi� des enregistrements du nom de la source de la cat�gorie ou l'abonnement. Le th�me de Kafka est toujours un multi-utilisateur, qui est, un sujet peut avoir z�ro, un ou plusieurs consommateurs souscrivent � �crire ses donn�es.

�Pour chaque sujet, groupe Kafka maintient le journal des partitions qui ressemble �:

�Chaque partition est un ordre, l'ordre immuable des dossiers, attach� � soumettre constamment journal structur�. L'enregistrement de chaque partition se voit attribuer un num�ro appel� l'identificateur de s�quence de d�calage, qui identifie de fa�on unique chaque enregistrement de la partition.

�groupe Kafka a persist� tous les enregistrements ont �t� lib�r�s - ind�pendamment du fait que l'utilisation - en utilisant la p�riode de r�tention configurable. Par exemple, si la politique de r�tention est fix�e pour deux jours, puis lib�r� deux jours apr�s l'enregistrement, il est disponible pour une utilisation, apr�s quoi ils sont mis au rebut pour lib�rer de l'espace. La performance de Kafka en termes de taille des donn�es est pratiquement constante, afin que le stockage � long terme des donn�es ne sont pas un probl�me.

�En fait, la seule r�serve bas�e sur les m�tadonn�es de chaque consommateur que le consommateur ou la position d�cal�e dans le journal. Ce d�calage est contr�l� par le consommateur: la lecture d'enregistrement des consommateurs en g�n�ral augmentent de fa�on lin�aire son d�calage, mais en fait, la position du contr�le par le consommateur, afin qu'il puisse suivre un ordre, comme leur historique d'achat. Par exemple, les consommateurs peuvent �tre remis � z�ro aux d�calages anciens de retraiter les donn�es ant�rieures, ou sauter les dossiers les plus r�cents et de � maintenant � pour commencer � d�penser.

�Ces caract�ristiques combin�es signifient que les consommateurs des consommateurs Kafka tr�s pas cher - ils peuvent aller et de venir et a peu d'impact sur le cluster ou d'autres consommateurs. Par exemple, vous pouvez utiliser notre commande contenu en ligne d'outils � queue � un sujet sans avoir � changer tous les utilisateurs de contenu existants consomment.

�partition journal a une vari�t� d'utilisations. Tout d'abord, ils permettent la taille du journal d�passe l'extension appropri�e � un seul serveur. Chaque partition individuelle doit �tre adapt� � l'h�bergement sur ses serveurs, mais le sujet peut avoir plusieurs partitions, il peut g�rer un certain nombre de donn�es. En second lieu, ils servent le parall�lisme de l'unit� - plus.

1.3 Distribution de distribution

�Sujet de la pluralit� de partitions, est r�partie sur une pluralit� de grappes de serveurs dans Kafka, chaque serveur (instance Kafka) est responsable de la lecture et de l'�criture des partitions des messages en fonctionnement, en plus peut �galement �tre configur� de num�ro de kafka � sauvegarder (r�pliques) des partitions up, chaque partition sera sauvegard� sur plusieurs machines pour am�liorer la facilit� d'utilisation.

�D'apr�s le programme r�pliqu�, cela signifie que la n�cessit� d'une planification des sauvegardes multiples, chaque partition a un serveur comme un � leader �, chef de file responsable de toutes les op�rations de lecture et d'�criture, si le chef �choue, alors il y aura un autre disciple de prendre en charge (pour devenir le nouveau leader), adepte juste monotone et chef de suivi, un message de synchronisation peut �tre vu transporter toute la pression de la demande .. en tant que leader du serveur, donc de l'examen global du groupe, le nombre de partitions vous dire combien un � leader �, Kafka � leader � �quilibr� dispers�s dans chaque cas, afin d'assurer une performance stable dans l'ensemble.

1.4 Producteurs producteurs et consommateurs consommateurs

1.4.1 Producteurs Producteurs

�Les producteurs publient des donn�es sur les sujets sujets sp�cifi�s. Pendant ce temps, producteur peut d�cider quels messages appartiennent � cette partition, par exemple, sur la base de mani�re � round-robin � ou par un autre algorithme.

Les consommateurs 1.4.2

Essentiellement Kafka ne supporte que chaque consommateur sujet appartiennent � un groupe de consommateurs ;. A l'inverse, chaque groupe peut avoir plusieurs consommateurs envoie un message au sujet, un consommateur ne sera souscrite pour chaque groupe de consommateurs dans ce sujet. .
Si tous les utilisateurs ont les m�mes instances de groupe d'utilisateurs, il est enregistr� sur l'utilisateur d'�quilibrage de charge d'instance efficace.
Si tous les cas les consommateurs ont des groupes de consommateurs, chaque enregistrement sera diffus� � tous les processus consommateurs.

�Analyse: Kafka Deux serveurs de cluster, quatre partitions d'h�bergement (P0-P3), comprenant deux groupes d'utilisateurs. Un groupe de consommateurs ont deux instances consommateurs, groupe de consommateurs B a quatre cas.

�Fa�on d'atteindre la consommation des consommateurs dans Kafka est en divisant la partition de journal sur les instances de consommation, chaque instance est r�parti de fa�on � tout moment � juste part � consommateur exclusif. groupe dynamique processus de maintenance protocole d'adh�sion est trait�e par Kafka. Si la nouvelle instance de rejoindre le groupe, ils sont des autres membres du groupe de prendre en charge une partie de la partition, si l'instance de la mort, qui sera distribu� � partitionner les instances restantes.

�Kafka seule sous-r�gion a enregistr� le total des commandes, plut�t que les dossiers th�matiques entre les diff�rentes partitions. Pour la plupart des applications, avec la possibilit� de trier par zone cl� de partition de donn�es combin�es est suffisante. Toutefois, si vous avez besoin d'enregistrer ordre total, vous pouvez utiliser le th�me ne contient qu'une seule partition � r�aliser, mais cela signifierait que chaque utilisateur n'a qu'un seul processus de groupe d'utilisateurs.

1.5 Les consommateurs Kafka assurer

Les messages envoy�s � des partitions afin qu'il re�oit seront ajout�es au journal. C'est, si l'enregistrement de l'enregistrement M1 envoy� par le m�me cr�ateur M2, M1 et la premi�re transmission, il aura un d�calage inf�rieur � M1 et M2 apparaissent plus t�t dans le journal.
�Des exemples de consommateurs voir les enregistrements dans l'ordre o� ils sont stock�s selon le journal. Pour les consommateurs, le m�me ordre que la consommation et les messages journaux dans l'ordre des messages.
�Si le th�me de � replicationfactor � est N, puis permettre � l'instance kafka N-1 �choue, nous allons tol�rer un maximum de d�faillance du serveur N-1, sans perdre de commits � l'exploitation foresti�re.

1.6 Syst�me Kafka que le message

Comment cela se compare avec le concept traditionnel d'�coulement du syst�me e-mail d'entreprise de Kafka?

(1) Syst�me de message traditionnel

�Il existe deux mod�les sur les nouvelles traditionnelles: faire la queue et faire la queue publish-subscribe publier - abonner. Dans la file d'attente, la piscine des consommateurs peut �tre lu � partir du serveur et chaque enregistrement � un, publier - abonnez-vous, l'enregistrement est diffus� � tous les consommateurs. Chacun a ses avantages et inconv�nients de ces deux mod�les. Avantage est que faire la queue, il vous permet de diviser les donn�es de traitement sur plusieurs instances de consommateurs, qui peuvent �largir votre traitement. Malheureusement, une fois un processus lit les donn�es qu'il a disparu, la file d'attente ne sont pas multi-utilisateur. Publier - abonnez-vous permet aux donn�es de diffusion de multiples processus, mais parce que chaque message envoy� � chaque abonn� et ne peut pas �tre long processus.

�Le concept de Kafka de groupes de consommateurs r�sument ces deux concepts. Comme la file d'attente, les groupes d'utilisateurs permettent de proc�d� est divis� en un ensemble de processus (un membre du groupe d'utilisateurs). Et publier - abonnez-vous, comme, Kafka vous permet de diffuser un message � plusieurs groupes de consommateurs.

(2) l'avantage Kafka

�Avantages mod�le Kafka est que chaque th�me a ces propri�t�s - il peut �tre �tendu et g�rer aussi plusieurs utilisateurs - pas besoin de choisir l'un d'entre eux.

�Par rapport aux syst�mes de messagerie traditionnels, Kafka a plus de garantie de commande.

�file d'attente traditionnelle afin de tenir des registres sur le serveur, si une pluralit� de consommateurs de consommer la file d'attente, le dossier de distribution du serveur dans l'ordre m�moris�. Cependant, bien que le serveur distribue des documents dans l'ordre, mais le dossier est asynchrone transmis aux consommateurs, afin qu'ils puissent �chouer � diff�rents consommateurs. Cela signifie en effet que l'ordre des enregistrements perdus en pr�sence de la consommation parall�le. Le syst�me de messagerie est g�n�ralement de r�soudre ce probl�me en ayant un concept de � monopole de consommation � qui permet seulement un processus consomme de la file d'attente, mais bien s�r, cela ne signifie pas que le parall�lisme de traitement.

�Kafka mieux. En ayant le concept de parall�lisme dans le sujet - Partition -, Kafka peut fournir l'�quilibrage de charge afin d'assurer que les consommateurs et la cellule d'�coulement. Ceci est obtenu en affectant � l'utilisateur concernant les partitions de groupes d'utilisateurs de sorte que chaque partition est utilis�e uniquement par un utilisateur dans le groupe. Ce faisant, nous nous assurons que les utilisateurs sont les seuls lecteurs de la partition selon l'ordre d'utiliser les donn�es. Comme il y a beaucoup de partitions, ce qui peut encore l'�quilibrage de charge par exemple de nombreux consommateurs. Notez, cependant, les instances des consommateurs du groupe de consommateurs ne peut pas d�passer les partitions.

1,7 Kafka comme un syst�me de stockage

�Tout permis d�livr� des messages s�par�s et la file d'attente de messages de nouvelles du consommateur agit en fait comme un syst�me de stockage des messages en cours. Kafka se distingue en ce qu'elle est un syst�me de stockage tr�s bon.
�Kafka �crit les donn�es sont �crites sur le disque et la r�plication pour la tol�rance aux pannes. Kafka permet aux producteurs d'attendre la confirmation, afin d'�crire n'est pas consid�r�e comme compl�te jusqu'� ce que la r�plication est termin�e, et m�me si le serveur ne la garantie �crite de reste �galement �crit.
�Structure de disque Kafka bonne utilisation de l'�chelle - que ce soit il y a 50 Ko ou 50 To de donn�es persistantes sur le serveur, Kafka effectuera la m�me op�ration.
�Parce que s�rieusement le stockage et permettre aux clients de contr�ler la position de lecture, vous pouvez Kafka comme haute performance d�di� � faible latence de stockage journal engagement, la reproduction et la diffusion du syst�me de fichiers sp�ciaux distribu�s.
Pour plus d'informations de conception de stockage et de r�plication journal pr�sent� par Kafka, lisez cette page.

1.8 Kafka pour le traitement flux

�Lecture seule, �criture et flux de donn�es de stockage ne sont pas suffisantes pour obtenir un d�bit de traitement en temps r�el.
�Dans Kafka, l'entr�e de flux � partir des moyens de processeur se rapportant � obtenir un flux de donn�es continu, effectuer quelque chose sur cette entr�e et g�n�rer un certain traitement pour d�livrer en sortie le th�me de flux de donn�es continu.
�Par exemple, une application de vente au d�tail peut recevoir un flux d'entr�e des ventes et des livraisons, r�organisez et de sortie et d'ajustement de prix calcul� sur la base de ces donn�es.
�Les producteurs et les consommateurs peuvent utiliser une API simple, directement trait�e. Cependant, pour la conversion plus complexe, Kafka fournit une API de flux enti�rement int�gr�. Ceci permet la construction de processus d'ex�cution d'application non triviale, ces applications peut circuler dans la polym�risation ou couler ensemble.
�Cet outil aide � r�soudre les probl�mes rencontr�s par ces applications: traitement de donn�es de commande, re-traitement de l'entr�e dans les modifications du code, effectuer le calcul stateful.
�La construction des primitives API de courant de base fourni Kafka: il utilise les producteurs d'entr�e de l'API et les consommateurs, pour une utilisation avec un stockage d'�tat Kafka, et en utilisant le m�me m�canisme de tol�rance aux pannes entre le courant d'instance de processeur de groupe.

2, les sc�narios d'utilisation Kafka

Messagerie 2.1 Message

�Kafka alternative au courtier de messages plus traditionnels. courtier de messages en utilisant une vari�t� de raisons (le processus de s�paration, le g�n�rateur de donn�es, un message non trait� de tampon, etc.). Par rapport � la plupart des syst�mes de messagerie, Kafka a un meilleur d�bit, le partitionnement natif, la r�plication et la tol�rance aux pannes, ce qui en fait une solution id�ale pour les applications de traitement de l'information � grande �chelle.

�Selon l'exp�rience, l'utilisation du passage de messages est g�n�ralement relativement faible, mais peut n�cessiter retard d'extr�mit� inf�rieure et d�pend g�n�ralement de fortes garanties de durabilit� fournies Kafka.

�Dans ce domaine, Kafka comparable avec les syst�mes de messagerie classiques (par exemple ActiveMQ) ou RabbitMQ.

2.2 Activit� de suivi du site

�cas d'utilisation originale de Kafka est la possibilit� de suivre l'activit� des utilisateurs pour un groupe de reconstruction de canalisation imm�diate - flux. Cela signifie que l'activit� du site (pages vues, la recherche ou d'autres mesures peuvent �tre prises par l'utilisateur) seront publi�s sur le th�me central de chaque type d'activit� contient un th�me. Habituellement, ces sources peuvent �tre utilis�es avec une s�rie de cas, y compris le traitement en temps r�el, le suivi en temps r�el et hors ligne ou charg� dans l'entrep�t de donn�es du syst�me Hadoop pour le traitement et la communication hors ligne.

�Activit� de suivi est g�n�ralement tr�s �lev�, car la vue de g�n�rer un grand nombre de messages d'activit� pour chaque page utilisateur.

2.3 Mesures m�triques

�Kafka g�n�ralement utilis� pour les donn�es de surveillance op�rationnelle. Ceci se rapporte � une polym�risation des informations statistiques � partir de l'application distribu�e afin de g�n�rer les donn�es de fonctionnement d'alimentation centralis�e.

2.4 agr�gation journal

�Beaucoup de gens utilisent Kafka comme des alternatives de solution d'agr�gation de journal. La polym�risation est g�n�ralement recueilli fichier journal de journal physique du serveur et les place dans une position centrale (peut �tre un serveur de fichiers ou HDFS) traitement. Kafka d�tails abstraits du fichier, et le flux de messages de journal ou de donn�es d'�v�nements comme plus clairement abstraire. Ce proc�d� permet une latence plus faible et plus facilement supportent de multiples sources de donn�es et des donn�es de consommation distribu�. Scribe Flume ou similaires par rapport dans le journal du syst�me comme le centre, Kafka fournit m�me une excellente performance puisque la duplication doit assurer une plus grande durabilit�, et un retard bas de gamme.

Diffusion 2,5

�De nombreux utilisateurs Kafka traitement pipeline lorsque le traitement des donn�es par une pluralit� d'�tages, dans lequel les donn�es d'entr�e brutes relatives � la consommation de Kafka, puis polym�ris�s, ou convertis en le nouveau th�me riche par d'autres moyens pour le traitement ou la consommation ult�rieure plus loin.

�Par exemple, le pipeline de traitement recommand� pour les articles de presse abonner aux flux RSS de l'analyse du contenu de l'article et le publier sur le th�me � article �, le traitement ult�rieur de ce contenu peut �tre normalis�e ou la d�duplication et le contenu de l'article nettoy� publier un nouveau th�me, l'�tape de traitement final peut essayer de recommander ce contenu � l'utilisateur. Ces graphiques pipeline de traitement pour cr�er des donn�es en temps r�el sur les flux bas�s sur diff�rents th�mes. 0.10.0.0 D�s le d�but, ceci est une biblioth�que de traitement de flux l�ger mais puissant, nomm� dans Apache Kafka Kafka Streams peut �tre utilis� pour effectuer ces donn�es de traitement tel que d�crit ci-dessus. En plus de Kafka Streams, d'autres outils de traitement de flux open source Apache et y compris la temp�te Apache Samza.

2.6 Approvisionnement �v�nement

�Event Sourcing est un style programmation d'application, dans lequel l'�tat passe � un ordre chronologique enregistrement s�quence. le soutien Kafka pour le stockage tr�s grand nombre de donn�es de journaux qui en fait une excellente application back-end construit dans ce style.

2.7 journal de livraison

�Kafka peut soumettre le journal en tant que syst�mes distribu�s externes. Ce journal permet de copier des donn�es entre les noeuds et resynchronisation de r�cup�ration de d�faillance d'un noeud servir de m�canisme pour ses donn�es. Kafka dans la compression du journal permet de soutenir cette utilisation. Dans cette utilisation, Kafka projet similaire Apache bookkeeper.

3, l'installation Kafka

3.1 t�l�chargez et installez

Http://kafka.apache.org/downloads.html � le site officiel pour t�l�charger la version souhait�e, je suis ici t�l�charger la derni�re version stable 2.1.0

Note: En raison de Kafka script bas� sur console pour les plates-formes Unix et Windows est diff�rent, donc au lieu d'utiliser bin binwindows sur la plate-forme / script Windows va changer l'extension .bat.

# Wget # Tar C / data / -xvf kafka_2.11-2.1.0.tgz # Cd /data/kafka_2.11-2.1.0/

3.2 Configuration d�but Zookeeper

�Kafka correctement, vous devez configurer Zookeeper, ou si Kafka groupe ou la survie du client et les consommateurs peuvent ne pas fonctionner correctement, vous devez configurer le service pour commencer Zookeeper.

(1) Zookeeper besoin environnement Java

# Yum -y install java-1.8.0

(2) o� package de t�l�chargement Kafka comprend d�j� un service Zookeeper, donc il suffit de modifier le fichier de configuration, il peut commencer.

Si vous devez t�l�charger la version Zookeeper sp�cifi�e, vous pouvez aller seul site officiel Zookeeper pour t�l�charger la version sp�cifi�e.

# Cd /data/kafka_2.11-2.1.0/ # Grep "^ " config / zookeeper.properties dataDir = / tmp / Zookeeper # r�pertoire de stockage de donn�es clientPort = 2.181 orifice de #zookeeper maxClientCnxns = 0

Remarque: Vous pouvez ajouter leur propre configuration modifi�e Zookeeper

3.3 Configuration Kafka

(1) modifier le fichier de configuration

# Grep "^ " config / server.properties broker.id = 0 auditeurs = texte brut: // localhost: 9092 num.network.threads = 3 num.io.threads = 8 socket.send.buffer.bytes = 102400 socket.receive.buffer.bytes = 102400 socket.request.max.bytes = 104857600 log.dirs = / tmp / logs Kafka num.partitions = 1 num.recovery.threads.per.data.dir = 1 offsets.topic.replication.factor = 1 transaction.state.log.replication.factor = 1 transaction.state.log.min.isr = 1 log.retention.hours = 168 log.segment.bytes = 1073741824 log.retention.check.interval.ms = 300000 zookeeper.connect = localhost: 2181 zookeeper.connection.timeout.ms = 6000 group.initial.rebalance.delay.ms = 0

Remarque: Vous pouvez modifier le fichier de configuration en fonction de vos besoins

�broker.id: ID unique
�auditeurs = PlainText: // localhost: 9092: Kafka services d'adresse �coutent et le port
�log.dirs: r�pertoire de stockage journal
�zookeeper.connect: Zookeeper service d�sign�

(2) Configuration de l'environnement Variables

# /Etc/profile.d/kafka.sh ViM export KAFKA_HOME = "/ data / kafka_2.11-2.1.0" export PATH = "$ {} KAFKA_HOME / bin: $ PATH" # Source /etc/profile.d/kafka.sh

(3) script de d�marrage du service de configuration

# /Etc/init.d/kafka ViM #! / Bin / sh # # Chkconfig: 3459901 # Description: Kafka # # Fichier: Kafka # # Description: Lance et arr�te le serveur Kafka # /etc/rc.d/init.d/functions source KAFKA_HOME = / data / kafka_2.11-2.1.0 KAFKA_USER = racine export LOG_DIR = / tmp / kafka-logs &&. / Etc / sysconfig / kafka # Voyez comment nous avons �t� appel�s. case "$ 1" en d�but) echo -n "D�marrage Kafka:" / Sbin / runuser -s / bin / sh $ KAFKA_USER -c � nohup $ KAFKA_HOME / bin / kafka-server-start.sh $ KAFKA_HOME / config / server.properties > �$ LOG_DIR / server.out 2 > �$ LOG_DIR / server.err & " echo "fait." exit 0 ;; stop) echo -n "Arr�t Kafka:" / Sbin / runuser -s / bin / sh $ KAFKA_USER -c "ps -ef | grep kafka.Kafka | grep -v grep | awk '{print $ 2}' | xargs kill -9" echo "fait." exit 0 ;; arr�t imm�diat) echo -n "Arr�t (dur) Kafka:" / Sbin / runuser -s / bin / sh $ KAFKA_USER -c "ps -ef | grep kafka.Kafka | grep -v grep | awk '{print $ 2}' | xargs kill -9" echo "fait." exit 0 ;; �tat) c_pid = `ps -ef | grep kafka.Kafka | grep -v grep | awk '{print $ 2}'` si , puis echo "Stopped" sortie 3 d'autre echo "Ex�cution $ c_pid" exit 0 fi ;; red�marrage) arr�t d�but ;; *) echo "Utilisation: kafka {start | stop | arr�t imm�diat | �tat | restart}" 1 sortie ;; ESAC

3.4 D�marrer le service Kafka

(1) l'arri�re-plan pour d�marrer le service Zookeeper

# Nohup zookeeper-server-start.sh /data/kafka_2.11-2.1.0/config/zookeeper.properties &

(2) D�marrer le service Kafka

# Service kafka d�but � partir kafka (via systemctl): # Service kafka �tat Ex�cution 86018 # Ss -nutl Netid Etat Recv-Q Send-Q Adresse locale: Port Peer Adresse: Port tcp LISTEN 050 ::: ::: 9092 * tcp LISTEN 050 ::: ::: 2181 *

4, Kafka utilisation de l'entr�e simple,

4.1 Cr�er un th�me de sujets

Cr�er un � long � le th�me appel�, il ne contient qu'une seule partition, un seul exemplaire:

# Kafka-topics.sh --create --zookeeper localhost: 2181 --replication facteur 1 --partitions 1 --topic le long Sujet cr�� le long �.

Si nous courons la liste des commandes sujet, on peut voir maintenant que ce sujet:

# Kafka-topics.sh --list --zookeeper localhost: 2181 le long de

4.2 envoyer des messages

Kafka est livr� avec un client de ligne de commande, il prendra son entr�e � partir d'un fichier ou l'entr�e standard, et l'envoyer comme message � groupe Kafka. Par d�faut, chaque ligne sera envoy�e comme un message s�par�.

Ex�cuter les producteurs, et puis tapez un num�ro dans un message � envoyer � la console du serveur.

# Kafka-console-producer.sh --broker liste localhost: 9092 --topic le long > Ceci est un message > Ceci est un autre message

4.3 D�marrer les consommateurs

Kafka, il est un utilisateur de ligne de commande, il videra des messages sur la sortie standard.

# Kafka-console-consumer.sh --bootstrap serveur localhost: 9092 --topic le long --from-d�but Ceci est un message Ceci est un autre message

Tous les outils de ligne de commande ont d'autres options, ex�cutez la commande sans arguments pr�sente les enregistrements de leur utilisation des informations plus en d�tail.

5, mis en place un multi-agence Kafka groupe

�Jusqu'� pr�sent, nous avons �t� en cours d'ex�cution avec un courtier, mais ce n'est pas amusant. Pour Kafka, un seul agent de la taille du groupe 1, donc en plus de commencer certains cas, il n'y a pas d'agent beaucoup de changement. Mais afin de se sentir, nous allons �tendre notre groupe � trois noeuds (toujours sur notre machine locale).

5.1 Profil Pr�paration

# Cd /data/kafka_2.11-2.1.0/ # Config Cp / server.properties config / server-1.properties # Config Cp / server.properties config / server-2.properties # Config Vim / server-1.properties broker.id = 1 auditeurs = texte brut: //: 9093 log.dirs = / tmp / logs Kafka-1 # Config Vim / server-2.properties broker.id = 2 auditeurs = texte brut: //: 9094 log.dirs = / tmp / logs Kafka-2

Note: Cette propri�t� est le nom de broker.id unique et permanent de chaque nud du cluster. Nous devons couvrir le r�pertoire du port et le journal, parce que nous courons sur la m�me machine, et nous voulons que tous les agents tentent d'enregistrer ou de remplacer des donn�es de l'autre sur le m�me port.

5.2 amas ouvert deux autres services Kafka

# Nohup kafka-server-start.sh /data/kafka_2.11-2.1.0/config/server-1.properties & # Nohup kafka-server-start.sh /data/kafka_2.11-2.1.0/config/server-2.properties & # Ss -nutl Netid Etat Recv-Q Send-Q Adresse locale: Port Peer Adresse: Port tcp LISTEN 050 :: ffff: 127.0.0.1: 9092 ::: * tcp LISTEN 050 :: ffff: 127.0.0.1: 9093 ::: * tcp LISTEN 050 :: ffff: 127.0.0.1: 9094 ::: *

5.3 fonctionnent dans un cluster

(1) Cr�ez maintenant un facteur de r�plication pour le nouveau th�me my-sujet reproduit 3

# Kafka-topics.sh --create --zookeeper localhost: 2181 --replication facteur 3 --partitions 1 --topic my-sujet r�pliqu�es sujet cr�� my-sujet dupliqu�s �.

(2) dans un cluster, ex�cutez la commande � d�crire les sujets � pour voir ce qui est fait qui courtier

# Kafka-topics.sh --describe --zookeeper localhost: 2181 --topic my-sujet r�pliqu�es Sujet: my-sujet r�pliqu� PartitionCount: 1 ReplicationFactor: 3 Configs: Sujet: Partition my-sujet r�pliqu�: 0 Leader: 2 R�pliques: 2,0,1 Isr: 2,0,1

Remarque: La premi�re ligne donne un r�sum� de toutes les partitions, chaque ligne suppl�mentaire fournit des informations sur une partition. �tant donn� que nous avons une seule partition pour ce sujet, alors qu'une seule ligne.

�� Leader � est un nud est responsable de toutes les lectures et �critures d'une partition donn�e. Chaque nud deviendra la partie leader de la partition s�lectionn�e au hasard.
�� R�pliques � est une liste de nuds cette partition copie du journal, m�me si elles sont actuellement actives, peu importe qu'ils soient dirigeants ou.
�� Isr � est � synchronis� � collection de r�pliques. Ceci est un sous-ensemble d'une copie de la liste, la liste est active et le leader actuel a �t� captur�.

S'il vous pla�t noter, Leader: 2, dans mon exemple, le nud 2 est le seul chef de la partition du sujet.

(3) peut ex�cuter la m�me commande sur le th�me original que nous avons cr�� pour voir son emplacement

# Kafka-topics.sh --describe --zookeeper localhost: 2181 --topic le long Sujet: le long de PartitionCount: 1 ReplicationFactor: 1 Configs: Sujet: le long de la partition: 0 Leader: 0 R�pliques: 0 Isr: 0

(4) a �mis un certain nombre de messages � notre nouveau th�me:

# Kafka-console-producer.sh --broker liste localhost: 9092 --topic my-sujet r�pliqu�es > mon message de test 1 > mon message de test 2 > ^ C

(5) Maintenant, nous allons utiliser ces messages:

# Kafka-console-consumer.sh --bootstrap serveur localhost: 9092 --from-commen�ant --topic my-sujet r�pliqu�es mon message de test 1 mon message de test 2

5.4 Test de tol�rance aux pannes de cluster

(1) Maintenant, nous allons tester la tol�rance aux pannes. Broker 2 agit comme un chef de file afin Tuons-le:

# Ps aux | grep server-2.properties | awk '{print $ 2}' 106737 # Kill -9106737 # Ss -nutl tcp LISTEN 050 :: ffff: 127.0.0.1: 9092 ::: * tcp LISTEN 050 :: ffff: 127.0.0.1: 9093 ::: *

(2) dans lequel Leader a commut� sur un noeud esclave, le noeud 2 n'est plus en jeu de r�pliques de synchronisation:

(3), m�me si le chef �crit initial n'a pas r�ussi � accepter que ces messages sont encore disponibles pour la consommation:

# Kafka-console-consumer.sh --bootstrap serveur localhost: 9092 --from-commen�ant --topic my-sujet r�pliqu�es mon message de test 1 mon message de test 2

6, Kafka Connect Import / Export de donn�es

�donn�es d'�criture de la console et �crire � la console est un bon point de d�part, mais peuvent parfois vouloir utiliser des donn�es provenant d'autres sources ou de Kafka � exporter des donn�es vers d'autres syst�mes. Pour de nombreux syst�mes, vous pouvez utiliser Kafka Connect aux donn�es d'importation ou d'exportation, au lieu d'�crire le code d'int�gration personnalis�.

�Kafka Kafka Connect est livr� avec des outils pour importer et exporter des donn�es � Kafka. Il est un moyen expansible, la course du connecteur, mettre en oeuvre une interaction externe de logique de commande avec le syst�me. Dans ce d�marrage rapide, nous allons apprendre comment utiliser un connecteur simple � ex�cuter Kafka Connect, ces connecteurs pour importer des donn�es dans le th�me Kafka et les donn�es de fichier � fichier export� du th�me Kafka.

(1) Tout d'abord, cr�er des donn�es de semences pour les tests:

# Echo -e "foobar" > �test.txt

Ou sous Windows:

> �echo foo > �test.txt > �echo bar > > �test.txt

(2) Ensuite, pour commencer � fonctionner en mode autonome deux connecteurs, ce qui signifie qu'ils ex�cutent dans un processus priv� local. Fournir trois fichiers de configuration en tant que param�tre.

Le premier est toujours Kafka Connect processus de configuration, comprenant une configuration commune, telle qu'une s�quence de format de donn�es et des agents de Kafka � raccorder.

Le reste est le fichier de configuration du connecteur d�sign� � cr�er. Ceux-ci comprennent un nom unique d'un connecteur, toute autre configuration souhait�e pour �tre instanci�s connecteurs de classe et un connecteur.

# Connect-standalone.sh config / connect-standalone.properties config / connect-file-source.properties config / connect-file-sink.properties INFO Kafka Connect travailleur autonome Initialisation ... (org.apache.kafka.connect.cli.ConnectStandalone: 67) Valeurs INFO WorkerInfo: ... ...

�Note: Kafka inclus dans ces fichiers de configuration de l'�chantillon avant de commencer � utiliser votre configuration par d�faut du cluster local et cr�er deux connecteurs: le premier est le connecteur source, il lit des lignes � partir d'un fichier d'entr�e et g�n�re chaque th�me Kafka, la deuxi�me est connect� � l'�vier lit le titre de chaque message et le message de Kafka g�n�r� par une ligne dans le fichier de sortie.

(3) V�rifiez si l'importation est r�ussie (d'un autre terminal)

Lors du d�marrage, vous verrez beaucoup de messages du journal, y compris une indication de messages du journal sont des exemples du connecteur.

Kafka Connect une fois le processus d�marre, le connecteur source test.txt doit commencer la lecture des lignes relatives au sujet et g�n�re sa connexion test et le connecteur du r�cepteur doit se connecter test message � commencer � lire et d'�crire leur sujet fichier test.sink.txt. Nous pouvons v�rifier cela en v�rifiant le contenu du fichier de sortie si les donn�es ont pass� � travers l'ensemble du pipeline:

# Test.sink.txt Cat foo bar

Notez que le stockage des donn�es de connexion test dans le sujet Kafka, afin que nous puissions ex�cuter l'utilisateur de la console pour afficher la rubrique de donn�es (ou utiliser un code utilisateur personnalis� pour g�rer):

# Kafka-console-consumer.sh --bootstrap serveur localhost: 9092 --topic --from-d�but connexion test { "Sch�ma": { "type": "string", "facultatif": false}, "charge utile": "foo"} { "Sch�ma": { "type": "string", "facultatif": false}, "charge utile": "bar"}

(4) les donn�es suppl�mentaires se poursuit, la v�rification

# Echo Une autre ligne > > �test.txt # Test.sink.txt Cat foo bar une autre ligne # Kafka-console-consumer.sh --bootstrap serveur localhost: 9092 --topic --from-d�but connexion test { "Sch�ma": { "type": "string", "facultatif": false}, "charge utile": "foo"} { "Sch�ma": { "type": "string", "facultatif": false}, "charge utile": "bar"} { "Sch�ma": { "type": "string", "facultatif": false}, "charge utile": "Une autre ligne"}

Route de la soie

Apprenez � conna�tre la Chine

principes et pratiques Kafka - pile de technologie de plate-forme cloud