ElasticSearch de 400+ op�ration de cluster de nuds et la maintenance, nous r�sumons ces exp�riences

Auteur | Anton H�gerstrand

Traducteur | Yangzhen Tao

ing�nieurs Meltwater de partager la fa�on dont leur fonctionnement et la maintenance des clusters de nuds ElasticSearch par le blog technique 400+ officiel. D�crit les caract�ristiques des donn�es de s�ries chronologiques accumul�es d'affaires, la quantit� de donn�es et des strat�gies de l'indice de roulement quotidien, ainsi que leur choix de la version ElasticSearch (oui, maintenant ils utilisent le 1.X, mais faire des changements au niveau de la source) pourquoi ne pas choisir un service de cloud computing g�r�s, la structure de l'indice et la planification fragmentation, et enfin se concentrer sur leurs efforts et de l'exp�rience en termes de performance, nous donnons une liste de r�f�rence de la performance.

Meltwater jour pour traiter les donn�es de poste de millions de grandeur, et donc un besoin d'une technologie capable de g�rer le stockage et la r�cup�ration des donn�es de commande.

la version 0.11.X depuis le d�but, nous avons �t� un utilisateur fid�le est ElasticSearch. Apr�s quelques tours et d�tours, nous pensons que, finalement, a fait le choix de la technologie droite.

ElasticSearch pour soutenir nos principales applications de surveillance des m�dias, le client � travers l'application peut r�cup�rer et analyser les supports de donn�es, tels que des articles de presse, (publics) messages Facebook, messages Instagram, blog et micro-blog. Nous avons recueilli l'aide d'un m�lange API contenu, le traitement et l'exploration et un peu, afin qu'ils puissent �tre r�cup�r�s ElasticSearch.

Cet article partagera l'exp�rience que nous avons appris, comment accorder ElasticSearch, ainsi que quelques-uns des pi�ges � contourner.

La quantit� de donn�es

Chaque jour, le nombre de nouvelles et de micro-blogging tr�s grand produit, au sommet des besoins de l'indice d'environ 3 millions d'�ditoriaux, et pr�s de 100 millions de donn�es de messages sociaux. L'�ditorial dans lequel la conservation � long terme des donn�es pour la recherche (datant de 2009), les donn�es de messages sociaux a sauv� pr�s de 15 mois. Les donn�es actuelles de d�coupe primaire utilis� environ 200 espace disque de la tuberculose, copier les donn�es d'environ 600 TB.

Notre entreprise a trois mille demandes par minute. Toutes les demandes appel� � Recherche-service � du service, qui compl�tera tous Interagir avec groupe ElasticSearch � son tour. La plupart des r�gles de r�cup�ration sont complexes, y compris le panneau et le flux de nouvelles. Par exemple, un client peut �tre int�ress� par Tesla et Elon Musk, mais veulent exclure toutes les informations sur SpaceX ou PayPal. Les utilisateurs peuvent utiliser une syntaxe similaire de requ�te Lucene et la syntaxe souple est la suivante:

Tesla "Elon Musk" NOT (SpaceX ou PayPal)

Nos plus longues telles requ�tes ont plus de 60 pages. L'accent est mis sur: aucune requ�te est une requ�te comme � Barack Obama � dans Google si simple En plus de 3 mille demandes par minute,, il est tout simplement b�te terrible, mais les nuds ES doit essayer de trouver un ensemble assorti de documents.

��dition

Nous courons une version personnalis�e 1.7.6 est bas�e ElasticSearch. La seule diff�rence entre cette version et la version 1.7.6 du tronc, nous r�troportage (backport) un bitsets rugissants / bitmaps en tant que cache. Cette fonction est transplant� � partir de 5 � Lucene Lucene 4, qui correspond � la version ES 1.X transplant�. ElasticSearch 1.X d�faut bitset utilis� comme cache pour les r�sultats rares pour les frais g�n�raux est tr�s grande, mais ElasticSearch 2.X a �t� optimis�.

Pourquoi ne pas utiliser ElasticSearch version plus r�cente de celui-ci? La principale raison est difficile de mettre � niveau. Dans une mise � niveau de roulement entre version majeure est disponible uniquement dans l'ES 5 � 6 (devrait �galement soutenir la mise � niveau de roulement ES 2 � 5, mais ne l'ont pas essay�). Par cons�quent, nous pouvons mettre � jour en red�marrant le cluster. Est presque inacceptable Downtime pour nous, mais peut-�tre en mesure de r�pondre � un red�marrage provoqu� 30-60 minutes les temps d'arr�t, et le vrai souci est le cas d'�chec n'a pas vraiment processus rollback.

Jusqu'� pr�sent, nous avons choisi de ne pas mettre � niveau le cluster. Bien s�r, nous esp�rons que peut �tre mis � jour, mais il y a plus de t�ches urgentes. Comment mettre en uvre effectivement cette mise � jour n'a pas encore �t� finalis�, il est susceptible de choisir de cr�er un nouveau cluster, au lieu de mettre � niveau ceux qui existent d�j�.

Configuration noeud

Nous avons commenc� � ex�cuter le cluster principal AWS depuis Juin 2017, comme un exemple de l'utilisation du noeud de donn�es i3.2xlarge. Avant de lancer COLO (Colocalis� Data Center) dans un cluster, mais migration ult�rieure vers le cloud AWS, afin de gagner du temps dans le nouveau temps d'arr�t de la machine, nous faire une plus grande flexibilit� dans l'expansion et la r�duction du volume.

Nous avons couru trois nuds candidats ma�tre disponibles dans diff�rents domaines et � discovery.zen.minimum_master_nodes ensemble 2. Ce probl�me est d'�viter split-brain probl�me de split brain strat�gie tr�s commune.

Nos ensemble de donn�es en termes de stockage, 80% de la capacit� requise et trois exemplaires ou plus, ce qui nous permet d'ex�cuter le nud de donn�es 430. Dans un premier temps l'intention d'utiliser les donn�es � diff�rents niveaux, des donn�es plus anciennes stock�es sur des disques plus lents, mais �tant donn� que nous ne li�s � un ordre de grandeur inf�rieur de plus de 15 mois de donn�es (donn�es de modifier uniquement parce que nous les anciennes donn�es mis au rebut sociaux ), mais cela n'a pas fonctionn�. Le mat�riel est en t�te beaucoup plus d'un mois � courir dans le COLO, mais les services de cloud computing soutenir l'expansion cluster 2 fois, et presque sans d�penser beaucoup de temps.

Vous pouvez demander, pourquoi choisir leur propre gestion et la maintenance groupe ES. En fait, nous avons examin� le plan d'h�bergement, mais � la fin a choisi d'installer leur propre, au motif que: AWS ElasticSearch service expos� � contr�labilit� pauvres de l'utilisateur, le co�t-Cloud �lastique que la course directement sur le cluster EC22-3 fois plus �lev�.

Afin de se prot�ger quand on de la surface disponible est vers le bas, le nud dispers� dans l'UE-ouest-1 est disponible dans les trois domaines. Nous utiliser le plugin AWS pour terminer le r�glage. Il offre une fonctionnalit� appel�e attributs de nud aws_availability_zone, nous cluster.routing.allocation.awareness.attributes � aws_availability_zone. Cela garantit qu'une copie des ES stock�es dans une autre zone disponible, autant que possible, autant que possible pendant que la requ�te est achemin�e vers la m�me zone des noeuds disponibles.

Ces instances sont en cours d'ex�cution Amazon Linux, mont�s temporairement ext4, environ 64 Go de m�moire. Nous m�moire tas allou� 26FR pour le noeud ES, pour le reste du cache disque. Pourquoi est-26FR? Parce que la machine virtuelle Java est construit sur une magie noire.

Nous utilisons �galement des groupes Terraform d'expansion automatique pour fournir des exemples et utiliser des marionnettes pour terminer toute la configuration de l'installation.

Structure Index

Parce que nos donn�es et les requ�tes sont bas�es sur des s�ries chronologiques, nous utilisons donc une indexation en fonction du temps, comme ELK (ElasticSearch, logstash, Kibana) pile. Tout en permettant �galement diff�rents types de donn�es stock�es dans diff�rentes bases de donn�es d'index des documents et des �ditoriaux tels que la classe de documents sociaux les donn�es finales est dans une base de donn�es d'index par jour diff�rent. Cela ne peut �tre mis au rebut en cas de besoin indice social, et d'augmenter le nombre d'optimisation des requ�tes. index Japon courir chaque tranche de l'un des deux.

L'ensemble a g�n�r� beaucoup de d�coupage en tranches (pr�s 40k). Avec autant de fragments et les nuds, les op�rations de cluster peuvent devenir plus sp�cial. Par exemple, la possibilit� de supprimer l'index semble �tre le ma�tre du cluster de goulot d'�tranglement, il doit �tre pouss� � l'information sur l'�tat du cluster pour tous les nuds. Nos donn�es d'�tat du cluster d'environ 100 Mo, mais par compression TCP peut �tre r�duite � 3 Mo (peut friser localhost: 9200 / _cluster / �tat / _ALL voir vos propres donn�es d'�tat de cluster). nud ma�tre est toujours n�cessaire pour pousser 1,3 Go de donn�es (430 x 3 Mo taille du noeud d'�tat) � chaque changement. En plus de cela 1,3 Go de donn�es, il y a environ 860 Mo � transmettre entre la surface disponible (tels que l'Internet public par base). Ce serait plus de temps, en particulier lors de la suppression des index des centaines. Nous esp�rons que la nouvelle version de ElasticSearch pour optimiser ce, premier 2.0 prend en charge l'envoi des �tats ne cluster � partir du d�but de ces donn�es de diff�rence caract�ristique ES.

�performance

Comme mentionn� pr�c�demment, notre ES groupent afin de r�pondre aux besoins des clients pour r�cup�rer, traiter certaines requ�tes tr�s complexes.

En r�ponse � une charge de requ�te, au cours des quelques derni�res ann�es, nous avons fait beaucoup de travail en termes de performance. Nous devons essayer un partage �quitable du test de performance groupe ES peut �tre vu de la citation suivante.

Malheureusement, lorsque le groupe est en baisse, moins d'un tiers de l'enqu�te peut �tre men�e � bien. Nous croyons que le test lui-m�me conduit � un temps d'arr�t du cluster. - Extrait de l'utilisation de requ�tes r�elles sur les nouvelles ES grappe plate-forme du premier test de performance

Pour contr�ler le processus d'ex�cution des requ�tes, nous avons d�velopp� un plug-in pour r�aliser une s�rie de type de requ�te personnalis�e. Pour fournir des fonctionnalit�s et l'optimisation des performances ElasticSearch version officielle est pas pris en charge par l'utilisation de ces types de requ�tes. Par exemple, nous avons r�alis� les expressions de requ�te g�n�riques � l'appui de la mise en uvre de la requ�te SpanNear, l'autre est optimis� pour le soutien � * � au lieu de match tout requ�te, il y a un certain nombre d'autres fonctionnalit�s.

ElasticSearch Lucene et la performance d�pend fortement de la requ�te sp�cifique et des donn�es, il n'y a pas de solution miracle. M�me si, pour donner encore un peu avanc� de la r�f�rence de base:

Limitez votre champ de recherche, impliquant uniquement les donn�es pertinentes . Par exemple, pour une base de donn�es d'index par jour, r�cup�rer uniquement en fonction de la plage de dates pertinentes. La plage de recherche d'index interm�diaire, pour �viter les requ�tes / filtres de plage d'utilisation.
Ignorer les caract�res g�n�riques de pr�fixe Lorsque vous utilisez des caract�res g�n�riques - � moins que vous pouvez �tablir terme index invers�. Double fini wildcards difficile � optimiser.
Les signes de pr�occupation li�s � la consommation des ressources �nuds de donn�es d'utilisation du processeur continuent de monter en fl�che il? QI attendre � monter? GC jeter un oeil sur les statistiques. Ceux-ci peuvent �tre obtenus � partir de l'outil profileurs ou par un agent JMX. Si ParNewGC consomme plus de 15% du temps, pour v�rifier le prochain journal de m�moire. S'il y a une pause SerialGC, vous pouvez vraiment avoir un probl�me.
Si vous avez le probl�me de la collecte des ordures, ne pas essayer de r�gler les param�tres GC . Cela arrive souvent parce que les param�tres par d�faut ont �t� tr�s raisonnables. Il est plut�t l'accent sur la r�duction de l'allocation de m�moire. Plus pr�cis�ment, comment faire? Voir ci-dessous.
Si vous rencontrez des probl�mes de m�moire, mais il n'y a pas de temps � r�soudre, peut envisager Azul Zing . Ceci est un produit tr�s cher, mais vous seul pouvez les utiliser pour am�liorer la machine virtuelle Java le d�bit deux fois. Mais � la fin, nous ne l'utilisons pas, parce que nous ne pouvons pas prouver la valeur pour l'argent.
Envisagez d'utiliser le cache Y compris ElasticSearch cache ext�rieur et cache niveau Lucene. Dans ElasticSearch 1.X cache peut �tre contr�l� � l'aide d'un filtre. Apr�s la sortie semble plus difficile, mais les apparences peuvent �tre obtenus pour son propre type de mise en cache de requ�te. Nous pourrions faire un travail similaire � l'avenir pour passer � 2.X temps.
Voir s'il y a des donn�es � chaud (Par exemple un noeud de supporter toute la charge). Vous pouvez essayer d'�quilibrer la charge, en utilisant le filtrage de filtrage d'allocation de tesson politique affectation de tranche, ou essayer de migration de ligne de routage re-groupe de cluster reroutage de la fragmentation. Nous avons utilis� automatiquement r�achemin�s optimisation lin�aire, mais l'utilisation de la strat�gie d'automatisation simple est �galement d'une grande aide.
Mettre en place un environnement de test (Je pr�f�re un ordinateur portable) partie repr�sentative peut �tre charg�e � partir de l'environnement de ligne de donn�es (Recommand� qu 'au moins une tranche). Utilisez la lecture de la demande en ligne sous pression (plus difficile). Utiliser les param�tres locaux pour tester la consommation de ressource demand�e.

Pour toutes ces raisons, Activation d'un profileur sur le processus ElasticSearch. Il est dans cette liste des plus importante . Nous utilisons �galement l'enregistreur de vol via Java Mission Control et VisualVM. Les gens essaient de sp�culer sur les probl�mes de performance (y compris consultant r�mun�r� / support technique) perdent leur (et votre) temps. JVM sous enqu�te quelle partie consomme du temps et de la m�moire, et ensuite explorer le code source ElasticSearch / Lucene, la section de v�rification de code qui effectue une allocation ou de la m�moire.
Une fois que la demande est de savoir quelle partie a conduit � la r�ponse lente, vous pouvez optimiser par des tentatives de modifier la demande (Par exemple, la polym�risation des conseils changements � long terme est effectu�e, ou le transfert type de requ�te). Modifier le type de s�quence d'interrogation ou d'une requ�te, peut avoir un impact plus important. Si cela ne fonctionne pas, vous pouvez essayer d'optimiser le code ES / Lucene. Cela peut sembler exag�r�, mais ils peuvent r�duire les 3-4 fois la consommation CPU et 4-8 fois l'utilisation de la m�moire pour nous. Quelques modifications mineures (comme les indices requ�te), mais d'autres peuvent nous obliger � r��crire compl�tement l'ex�cution de la requ�te. Le code final est fortement d�pendante de notre mode de requ�te, il peut ou ne peut pas �tre utilis� par d'autres. - � moins que vous pouvez �tablir terme index invers�. Double fini wildcards difficile � optimiser.

Description du graphique: le temps de r�ponse. Oui / Non rewrite Lucene ex�cution de la requ�te. Il a �galement montre qu'il n'y a plus beaucoup de fois sur des noeuds de m�moire sur une base quotidienne.

Soit dit en passant vers le bas, parce que je sais que nous serons confront�s � un probl�me: � partir d'un test de performance, nous savons que par la mise � niveau � ES 2.x peut l�g�rement am�liorer les performances, mais ce qui ne change pas. Ceci �tant dit, mais si vous avez migr� du groupe ES 1.x � l'ES 2.X, nous aimerions entendre vos exp�riences sur la fa�on de terminer la migration.

Si vous avez lu jusqu'ici, vous �tes un vrai amour pour ElasticSearch ah (ou au moins vous avez vraiment besoin).

Route de la soie

Apprenez � conna�tre la Chine

ElasticSearch de 400+ op�ration de cluster de nuds et la maintenance, nous r�sumons ces exp�riences