Un billion de s�ries chronologiques architecture de stockage de donn�es, Baidu est des structures en

conception d'architecture billion

En vertu du syst�me de surveillance de la charge de travail normale TSDB de Baidu, un processus autonome de plus de 20 millions de points de donn�es par seconde, le traitement de la grappe des dizaines de milliers de requ�tes par seconde, des billions de points de donn�es chaque navette jour dans le TSDB, en plus de b�n�ficier de cette performance puissante se Hbase aux avantages de performance et cibl�e � la conception du niveau architectural �galement contribu�.

A d� faire face billion est encore en croissance la taille des donn�es, nous avons con�u une lecture / �criture s�par�e et sans �tat cadre � flexible �;

Afin d'assurer une faible latence sous charge �lev�e encore �crire et requ�te, nous stratifier les donn�es ont �t� stock�es dans Redis, HBase et Hadoop;

Afin de fournir un service ininterrompu � un service fiable, nous avons con�u une capacit� d'auto-gu�rison classe minutes de l'architecture redondante hors site;

Afin de r�duire les co�ts de stockage, nous avons mis en place et am�lior� Facebook timing algorithme de compression de donn�es.

TSDB architecture globale montre la figure 1.

Figure 1: TSDB architecture globale

�volutive

Nous esp�rons que simplement l'ajout de nuds pour am�liorer la capacit� de traitement du syst�me lin�aire, le cas �ch�ant entre les nuds, etc., affectent les uns les autres, donc pour l'ensemble du cluster, ajouter des nuds sans consommation suppl�mentaire de ressources, vous pouvez faire des capacit�s de traitement avec le nombre de noeuds augmente lin�airement.

Donn�es de synchronisation �criture lecture une fois de nombreuses petites fonctionnalit�s, nous lirons et des op�rations d'�criture isol� con�u module de requ�tes Query-moteur et un module d'�criture Saver sans �tat, de sorte que chaque instance de la requ�te moteur ou similaire compl�tement Saver, en amont et application de hachage coh�rente ou interrogation d'�quilibrage de charge.

Exemples sch�ma de d�ploiement est bas� � l'int�rieur du conteneur Baidu Matrix, une allocation raisonnable des ressources, �tant donn� que deux requ�tes d'�criture et d'isoler, sans d�ranger l'autre, chacune des propri�t�s sont mises en jeu complet. syst�me de virtualisation � base de matrice permet �galement TSDB un certain nombre de cas pour compl�ter l'expansion des minutes.

haute performance

Dans la strat�gie � tables de partie horizontale � dans. La figure 2, en pr�sence de donn�es HBase est divis� dans le temps en une autre tranche, la pression ancienne d'acc�s tranche est relativement faible, ce qui r�duit la charge sur les donn�es de la section de traitement du syst�me.

Figure 2: Niveau du temps sous la table

Cependant, la derni�re d'une tranche maintiendra encore la chaleur �lev�e, relativement charge concentr�e est toujours pas un petit groupe de HBase de pression. Ainsi, nous utilisons une m�moire cache de donn�es � chaud (relativement plus de requ�tes de donn�es), � l'espace pour un temps de r�ponse plus faible pour les requ�tes, alors que la requ�te de d�rivation de pression HBase.

capacit�s fournies par l'�quipe Mise en cache service exploitation et de maintenance Baidu DBA plate-forme PRMC. Toutefois, en raison de la quantit� de donn�es est trop grande, les donn�es du cache d'une heure n�cessite plus de ressources m�moire, nous avons fait entre les compromis performance et de co�t, s�lectionnez uniquement les donn�es relatives aux indicateurs de base �crites dans le cache.

Dans un grand sc�nario de donn�es historiques de quantit�s, la requ�te n'est pas haute fr�quence, les exigences de l'actualit� des donn�es est �galement plus faible que leurs donn�es cible est g�n�ralement donn�es � froid, nous avons donc mis une partie des donn�es copi�es � partir du trafic Saver p�riodiquement vers� dans un cluster Hadoop s�par�, ces requ�tes seront d�tourn�es de la pression HBase.

Sur le d�tournement d'enqu�te de Hadoop et Redis, HBase stocker encore la pleine quantit� de donn�es, mais seulement d'entreprendre des requ�tes et des demandes conventionnelles tendances de la p�n�tration du cache.

faible co�t

Afin de r�duire les co�ts de stockage des donn�es, nous pr�sentons le papier dans Facebook: un type de donn�es de s�ries chronologiques d�crit dans � Gorilla A rapide, �volutive, s�rie en m�moire Temps Database � algorithme de compression (voir la figure 3.), Qui peut �tre jusqu'� 10 fois la compression rapport, nous appliquerons apr�s sa transformation dans le cache.

Figure 3: un algorithme de compression dans le sch�ma Facebook Gorilla

Gorilla dans les algorithmes de compression plus facile � comprendre, l'id�e de base est la compression delta, non seulement les valeurs de point pour la compression de donn�es, et un horodatage appliqu� la m�thode de compression Delta-de-Delta. points de donn�es compress�es, ce qui peut prendre le nombre d'espace de stockage � bit �, l'algorithme est stable pour la p�riode, l'effet de petites variations de la valeur des donn�es d'amplitude comprim� est particuli�rement bonne.

Cependant, ces algorithmes de compression delta, les r�sultats de la compression apr�s un point des donn�es avant la compression des points de donn�es d�pendent des r�sultats, ce qui n�cessite le maintien d'un �tat comprim� pour chaque s�rie de temps dans le cluster, le papier ne se rendent pas distribu�s description d�taill�e, sera compress� dans le flux de donn�es octet, stock�es dans la mani�re de valeur-cl� dans Redis.

En outre, les supports de l'algorithme de papier seulement les valeurs � virgule flottante, et l'algorithme de transformation prend �galement en charge des valeurs enti�res de type et de statistiques (par exemple, le chacun avec un max, min, sum, compter quatre statistiques StatisticsValue mentionn� ci-dessus, ).

La compression des donn�es du programme global en cours d'utilisation r�elle nous a sauv� 80% de l'espace de stockage, la consommation CPU suppl�mentaire ne d�passe pas 10%.

Disponibilit� haute

redondance � haute disponibilit� est une magie, nous utilisons un moyen simple et efficace programme de soutien mutuel � distance, � savoir un ensemble de clusters et la redondance des donn�es pour obtenir une haute disponibilit�.

Lors de l'�criture, le client �crit des donn�es � deux doubles cluster, l'acc�s � l'un des cluster (Figure 4) interrogation par nom de service de table de routage dynamique ou Baidu (Baidu Naming Service, BNE), sur cette base, nous avons une ventilation de m�canisme de gu�rison, peut atteindre la classe minute auto-gu�rison chambre individuelle.

Figure 4: Pr�paration de la mutuelle � distance

r�sum�

Ces derni�res ann�es, TSDB dans la ville � puce, les choses et les v�hicules en r�seau, etc. dans le domaine ont une tr�s large gamme d'applications, il devient la norme des services de base pour surveiller la sc�ne. A partir d'une demande pratique, nous pensons que la conception de l'architecture TSDB et la fonctionnalit� de la mise au point ne se limite pas au texte.

Techniquement, le calendrier des syst�mes de stockage de donn�es � grande �chelle, nous avons choisi HBase que le stockage sous-jacent, mais ne repr�sente pas une sc�ne dans HBase est le choix le plus appropri�, dans l'application, TSDB sera calcul� et distribu� des donn�es l'exploitation mini�re, la technologie de d�tection des anomalies m�me IA combin�e avec la profondeur, fera face � un sc�nario plus complexe et difficile.

Nous envisageons la TSDB abstraire en divers composants fonctionnels, en fonction des caract�ristiques des diff�rents sc�narios peuvent flexible avec diff�rents composants fonctionnels pour r�pondre aux diff�rents besoins. Par exemple, les donn�es peuvent �tre ex�cut�es dans l'ordre du temps bas� sur un petit MySQL de stockage autonome, ou comme une couche tampon de stockage � base de RAM directement, ou par des capacit�s de recherche puissantes de polym�risation ElasticSearch d'analyse multidimensionnelle et comme faire.

� l'heure actuelle, nous avons r�alis� quelques-unes des composantes du travail, et le soutien mis en uvre pour Cassandra sur la base des travaux sur le suivi enrichira le cadre et les composants, introduire de nouvelles fonctionnalit�s, et mettre en uvre progressivement un soutien pour ElasticSearch, MySQL et d'autres syst�mes de stockage .

En raison des contraintes d'espace, l'article ne traite pas les d�tails � d�ployer sur TSDB m�me d'autres � grande �chelle des syst�mes distribu�s aux �tudiants int�ress�s sont invit�s � discuter du message.

Route de la soie

Apprenez � conna�tre la Chine

Un billion de s�ries chronologiques architecture de stockage de donn�es, Baidu est des structures en