HBase pratique dans Baidu sc�ne de surveillance intelligente

En introduisant Baidu s�rie � grande �chelle de stockage de donn�es de s�ries chronologiques, probablement lecteurs Baidu syst�me de contr�le intelligent de No� ne TSDB plus �trange, il est principalement utilis� pour stocker le syst�me de surveillance Noah Les donn�es relatives aux indicateurs de synchronisation Y compris, mais sans s'y limiter, la disponibilit� d'indicateurs de mat�riel et des logiciels, des param�tres d'utilisation des ressources et des indicateurs de performance. Tels que � Baidu � grande �chelle de stockage de donn�es de s�ries chronologiques (deux) | s�lection de la m�moire et la conception du mod�le de donn�es, � l'article dit, No�-TSDB HBase est bas� sur le stockage sous-jacent bas� sur la recherche et le d�veloppement ind�pendant, et son excellente performance est indissociable de la contribution de HBase . Aujourd'hui, le discours principal sur la sc�ne Baidu surveillance intelligente Hbase exp�rience pratique pertinente, expliquer bri�vement HBase.

HBase Pr�sentation de l'architecture

HBase est bas� sur Java, open source, stockage non relationnelle, orient�e colonne de grande base de donn�es de stockage de donn�es distribu� et �volutif. groupe HBase se compose de HMater et RegionServer compos� de deux r�les, comme les installations de stockage sous-jacents � HDFS, Zookeeper aider � g�rer le cluster. L'architecture comme indiqu� ci-dessous:

Figure 1 Sch�ma d'architecture HBase

Un r�le bref dans les composants connexes Hbase:

HMaster

HMaster est l'ensemble du cluster cerveau , Responsable de l'exploitation des tableaux de donn�es, l'�quilibrage de charge et la r�cup�ration cluster faute de gestion du cluster.

RegionServer

Tableau HBase en unit�s divis�e en un nombre d�bris Chaque segment est appel� une r�gion. La r�gion a �t� affect�e � la gestion RegionServer. Apr�s le processus de lecture, o� les donn�es cible RegionServer, l'interaction directe avec le client RegionServer lu et donn�es d'�criture.

Zookeeper

Hbase en tant que syst�mes distribu�s � grande �chelle, le r�le Zookeeper est crucial. Tout d'abord Zookeeper comme solutions HMaster HA assurer qu'il y ait au moins un HMaster en �tat de marche. Zookeeper suivi par le m�canisme de rythme cardiaque d'exploration vivant RegionServer, quand RegionServer faute informe rapidement le d�pannage HMaster travail. Enfin Zookeeper sauver les m�ta-informations META global de maintenance de table de routage, et lorsque le client pour la premi�re fois � interagir avec HBase groupe, vous devez obtenir les donn�es o� le RegionServer cible par le tableau META.

Ce qui pr�c�de br�ve introduction � l'architecture de l'information de base et diverses composantes de HBase, ici et partager quelques probl�mes typiques rencontr�s dans le programme et optimiser l'apparence de l'utilisation HBase � la plus grande base de donn�es de synchronisation de la sc�ne Baidu.

Les enjeux

Nous avons tous l'effet f�t de savoir, pour le syst�me TSDB, o� les points chauds R�gion RegionServer affecte toute la plus courte capacit� � seau � morceau de bois. HBase Id�alement, toutes les demandes doivent �tre uniform�ment r�partie sur l'ensemble R�gion tout RgionServer lorsque R�gion particulier a re�u un nombre important de demandes de lecture et d'�criture plus que d'autres r�gion, la r�gion o� il est susceptible de devenir un point chaud.

l'information figure 2 RegionServer (dans cette source non-r�seau de la figure Baidu donn�es r�elles)

No�-TSDB avait rencontr� la conception de la table des m�tadonn�es de surveillance initiale r�sultat d�raisonnable dans un point chaud. A que les �tudiants re�oivent de la recherche du temps Noah-TSDB file d'attente Congestion Module d'�criture alarme d'affaires, a enregistr� une croissance significative de la m�me p�riode de HBase d'acc�s anormal du syst�me de surveillance Noah. RegionServer HBase respective fr�quemment dans le GC, le r�seau d'E / S et E / S disque intensive, l'op�ration de demande de file d'attente pour �tre ex�cut�s en vrac charge s�v�re �tait significativement plus �lev�e que les autres RegionServer. Afficher les journaux ont trouv� un grand nombre d'acc�s � la demande RegionServer anormale � la m�me r�gion: � TSDB-meta, *** 1. �. La position initiale est due R�gion La charge est trop �lev�e R�sultant dans le RegionServer il devient chaud, conduisant � une diminution de d�bit du syst�me, la demande en amont �criture empilage de modules.

Indice de surveillance TSDB-meta est utilis� pour stocker le nom du tableau p�riodique et d'autres informations m�ta, le tableau repr�sente la ligne rouge qui ont une quantit� de remplissage de donn�es d�passe un niveau normal, la structure de table est comme suit:

Tableau 1 Tableau TSDB-meta original

la structure de stockage analyse ci-dessus, nous pouvons savoir:

La m�me ligne avec une m�ta-informations d'index de surveillance objet contr�l� (namespace) sera stock� dans le tableau HBase.

Nombre diff�rent de diff�rents indicateurs objet surveill�, la taille se traduira par des lignes non uniformes.

donn�es HBase est fragment� en unit�s de donn�es stock�es dans chaque ligne de la m�me r�gion, lorsque le nombre de suivi des indicateurs d'une rang�e de stockage est bien sup�rieur au niveau normal, la banque est susceptible de devenir un point chaud.

En r�sum�, lorsque l'individu a objet surveill� Un nombre excessif d'indicateurs de suivi Lorsque, TSDB-meta probl�mes chauds peuvent se produire. En m�me temps, nous v�rifierons par la d�couverte, les indicateurs de suivi deviennent des objets de surveillance point chaud ont le nombre est d'environ 20 fois le niveau normal, encore confirm� la cause du dysfonctionnement.

Acc�dez � la cause, nous avons d�cid� deux fa�ons de r�soudre ce probl�me. D'une part, Les indicateurs statistiques r�guliers pour surveiller le nombre d'objets appartenant � la , Pour d�tecter en raison de la configuration anormale et surveillance de l'utilisation irrationnelle de la surveillance excessive des objets individuels ont conduit � des indicateurs de suivi. Un deuxi�me aspect, la configuration de TSDB-meta table de transformation, les donn�es d'origine est modifi� par la distribution de la colonne D�veloppez rang�e de tuiles les donn�es de tirage complet, en utilisant le m�canisme HBase ligne de tranche pour atteindre l'�tat d'�quilibrage de charge automatique. Le premier aspect est principalement intervention manuelle de l'utilisation abusive du niveau op�rationnel. Aujourd'hui, les principaux axes du second aspect.

TSDB-meta tableau transformation Sch�ma

Ce qui pr�c�de d�crit l'id�e g�n�rale de la transformation structurelle de la table, une seule rang�e de donn�es est trop volumineux pour �viter les points chauds. Nous surveillerons les informations du nom de la cible et le suivi des indicateurs cl�s ensemble comme une ligne, ne laissant qu'une seule restante pour stocker des informations d'index, afin d'�viter les probl�mes � chaud en raison d'une seule ligne de donn�es est trop grande.

Tableau 2 apr�s le tableau d'optimisation TSDB-meta

Pr�-partition

Apr�s optimisation TSDB-m�ta table, nous avons constat� que l'environnement de production pour stocker les donn�es tableau TSDB-donn�es il y a aussi des questions d'actualit�. Indicateur TSDB-donn�es sont utilis�es � des valeurs de surveillance m�moris�es dans le tableau, le milieu de production est bas�e sur la division de la table d'intervalle de temps, tous les deux jours les donn�es sont stock�es dans une table. donn�es Ts_uid cl�s de ligne � partir des donn�es de caract�ristiques apr�s une base de temps variable et la composition timestamp_base de hachage, en fonction des caract�ristiques des lignes tri�es lexicographique de cl�s, des donn�es de surveillance diff�rentes pour un index de hachage diff�rent stockage R�gion HBase utilisant le m�me objet surveill� pour les donn�es d'index, � l'effet de l'optimisation des requ�tes. �tant donn� que le trafic quotidien tableau TSDB-donn�es de la base haute, quand un certain nombre d'indicateurs pour surveiller les objets qui ont sup�rieur � la moyenne, alors les indicateurs de suivi de l'objet haute probabilit� surveillance seront affect�s � la m�me r�gion, ce qui dans la r�gion excessive , dans un chaud, le cluster divis� charge surdimensionn� d'�quilibrage r�gion pour maintenir le statut. op�ration de division fr�quente utilise beaucoup de ressources et d'affecter le d�bit de RegionServer. Pour r�soudre le point chaud parce que la r�gion est trop grande, nous utilisons la table de donn�es pr�-partitionn� M�thode.

Lorsque les donn�es de TSDB dans le tableau pr�-partition, nous avons constat� que l'effet est atteint que par le nombre sp�cifi� de pr�-partition R�gion n'est pas id�al, car il y aura un probl�me d'attribution des cr�neaux horaires in�gale et le montant r�ellement �crit. l'espace de table de donn�es HBase est uniform�ment r�parti en octets au lieu de rang�e de touches sont r�parties en fonction de la quantit� de donn�es effectivement stock�e. Comme on le voit ci-dessous, les donn�es pr�sent�es dans les carr�s rouges repr�sentent la m�moire r�elle, les carr�s blancs repr�sentent des pas de donn�es r�elles.

Figure 3 R�gion partitionne le disque brut

Comme indiqu� plus haut, bien que la table de donn�es a �t� divis�e en ligne de l'espace de trois octets en fonction de la cl� de la r�gion, mais �videmment, la r�gion 3 du volume de donn�es effectivement stock�es est beaucoup plus grande que la r�gion 1 et r�gion 2. R�gion 3 dans ce cas, il y a la possibilit� de devenir un point chaud. Pour am�liorer cette situation, les moissonneuses-batteuses Noah-TSDB �gaux intervalles de temps table partie span dispose d'un environnement de production tableau TSDB-donn�es est d�termin�e par r�f�rence � la table de l'historique d'utilisation de la nouvelle pr�-partitionnement de table. La cl� de la ligne est calcul�e et l'environnement de la production attendue effectivement g�n�r� valeur seuil taille de la partition de la r�gion, la valeur de coupure en fonction du tableau de niveau d'eau r�elle dans la r�gion proche, si bien que chaque r�gion de la fente de la taille des �chantillons, mais chaque r�gion r�elle le nombre de stockage �quivaut � r�duire davantage le risque de points chauds.

R�gion 4 apr�s pr�-partitionnement optimisation figure

Comment mettre en place une r�gion de nombre raisonnable

La strat�gie de pr�-partitionnement d�crit dans l'article pr�c�dent, en plus de la n�cessit� de se r�f�rer � l'utilisation r�elle de l'environnement de production ont �galement besoin d'estimer la taille de la r�gion conform�ment aux param�tres du syst�me appropri�s et les ressources des machines telles que le seuil de fractionnement, d�termination de la taille de la r�gion, nous pouvons estimer l'ensemble R�gion nombre. Alors, comment d�terminer si le groupe actuel est capable de porter le nombre R�gion ajusta? Si la r�gion num�ro Irrational Quels sont les risques? Avant de discuter de l'impact du nombre de grappes R�gion, nous avons d'abord comprendre quelques notions de base:

donn�es HBase dans le processus d'�criture, les donn�es sont d'abord �crites Memstore (m�moire cache en �criture) est tri�e, puis ajout� � la HFILE dans Flush asynchrone. Une pluralit� de groupe de colonnes pluralit� correspondante r�gion Memstore, est l'unit� minimum Memstore R�gion Flush.

Lorsqu'une somme de toutes les tailles de memstore de RegionServer atteint un seuil de d�clenchement hbase.regionserver.global.memstore.upperLimit * hbase_heapsize Memstore Flush. La chasse d'ordre descendant Memstore, jusqu'� utilisation de la m�moire MemStore est inf�rieure � un seuil hbase_heapsize * hbase.regionserver.global.memstore.lowerLimit.

HBase r�guli�rement Flush Memstore pour prot�ger Memstore ne dispose pas d'une longue persistance. Pour �viter tous les MemStore ont port� Flush cause des probl�mes en m�me temps, le fonctionnement r�gulier de rin�age d�lai al�atoire.

En r�sum�, d'une part en raison de la m�me RegionServer partag�e Memstore, trop peut causer le nombre R�gion Memstore fr�quence Flush devient plus rapide, HFILE produit augmente, Hbase compaction de conduite en cours, caus� La temp�te combin�e . Rincer d'autre part la r�guli�rement HBase memstore, chaque fois que la n�cessit� de coexister Flush chaque groupe de colonnes correspondant � chaque r�gion est �crit dans le fichier au memstore de HDFS, plus le num�ro de la r�gion, le nombre de documents � traiter avec chaque plus, m�me s'il y a m�canisme de retard al�atoire, de cr�er et de donn�es Migrer dans un court laps de temps permettra �galement d'augmenter la charge plus de cluster de fichiers peut provoquer le d�lai d'attente instantan�, d�lai d'attente, et le chargement en vrac d�lai d'attente du client, de r�duire les performances du syst�me TSDB. R�gion va donc r�duire le nombre excessif de d�bit du syst�me.

R�gion le nombre est trop petit R�duire les performances du syst�me . Lorsque le cas o� la m�me quantit� de donn�es, puisque le nombre est trop faible r�sultant en une seule demande trop grande, la R�gion �criture R�gion trait�s par grande r�gion, lorsque la vitesse lentement �clat de vitesse d'�criture de captures et, sur �criture sabot, affecter RPC, affectant ainsi l'�criture globale et la requ�te HBase, ce qui r�duit le d�bit du syst�me.

R�gion nombre d�raisonnable, r�duit la performance globale du syst�me et la fiabilit� TSDB, Calcul Num�ro R�gion RegionServer unique de gestion g�n�ralement recommand�e suit:

Copiez le code

# {R�gion} = (RS m�moire) * (fraction totale de memstore) / ((memstore taille) * (# {familles de colonne}))

Par exemple, si RegionServer les param�tres suivants:

Java Heap Taille de HBase RegionServer en octets est r�gl� 20G

hbase.regionserver.global.memstore.upperLimit 0,4

hbase.hregion.memstore.flush.size est 128M

le num�ro de groupe de la pluralit� de colonnes du tableau 2 Total

Puis # {R�gion} = 20 * 1024 * 0,4 / (128 * 2) = 32. Cette formule est l'hypoth�se selon laquelle toute la r�gion pr�misse sont �crites � la m�me vitesse, si les donn�es r�elles est �crit dans une partie de la r�gion, en fonction des r�sultats de rapport, en liaison avec les op�rations d'ajustement. Par exemple, les donn�es de sc�ne Noah-TSDB selon emploi du temps, une donn�e g�n�rale aujourd'hui existe dans la table de donn�es, les donn�es d'�criture sont concentr�es dans la plus r�cente table un, l'�criture r�elle est beaucoup plus petit que le nombre de r�gion active r�gion du nombre total, le nombre r�el dans chaque r�gion de gestion RegionServer est environ trois fois les r�sultats de calcul par la formule ci-dessus directement.

Apr�s le nombre estim� de la r�gion R�gion dans son ensemble et le nombre de la gestion de RegionServer unique, on peut raisonnablement Planification des capacit�s , Lorsque le r�glage du groupe des besoins estim�s des ressources de la machine.

r�sum�

Tout le contenu pr�sent� ci-dessus est aujourd'hui, et simple pour tout le monde � utiliser HBase partag� une exp�rience pratique. En fait, l'utilisation r�elle, nous avons aussi trouv� le HBase trop lourd, l'exploitation et des co�ts �lev�s d'entretien et d'autres questions, ont continu� � mener la recherche et de l'infrastructure mise � niveau, vous avez de bonnes suggestions aile bienvenue. En outre, si le texte est pas en place ou l� o� il y a la compr�hension de l'�cart, bienvenue � me corriger.

A propos de l'auteur

Zhang Yangyang, ing�nieur principal de recherche Baidu. Baidu est responsable de l'exploitation et la maintenance des produits intelligents (Noah) base de donn�es distribu�e et le calendrier de conception g�n�rale de la plate-forme de gestion des quotas et le travail de d�veloppement, poss�de une vaste exp�rience dans la gestion et la direction des quotas de stockage distribu�.

Cet article est reproduit des AIOps publics n � op�ration intelligente et la maintenance (ID: AI_Ops)

Lien original: https: //mp.weixin.qq.com/s/M_teW4hNNaLWbWghA02j9A

Route de la soie

Apprenez � conna�tre la Chine

HBase pratique dans Baidu sc�ne de surveillance intelligente