contour

Comme il a d�j� introduit le contenu relatif TREE-B, de sorte que son architecture ici n'introduit, surtout du point de vue du disque IO, pourquoi nous devrions regarder le B-tree.

concepts associ�s

Cette structure de donn�es B-arbre est souvent utilis� pour mettre en uvre l'indice de base de donn�es, car il est recherche plus efficace.

1, le disque IO et de pr�-lecture

Lecture de disque comptent sur un mouvement m�canique, divis� le temps de recherche, la latence de rotation, le temps de transmission en trois parties, la somme de ces trois parties de temps est un disque de temps IO, environ 9 ms. Le co�t est cent mille fois l'acc�s m�moire ;

Il est � cause du disque IO est une op�ration tr�s co�teuse, le syst�me d'exploitation informatique optimis� pour ceci: pr�-lecture, chaque fois IO, non seulement pour traiter les donn�es de chargement de disque en cours dans la m�moire, mais aussi les donn�es adjacentes est �galement charg� dans la un tampon de m�moire. Parce que la pr�-lecture Justification locale: Lorsque l'acc�s aux donn�es d'une adresse, les donn�es adjacentes seront rapidement accessibles. Chaque donn�es en temps disque IO lu ce que nous appelons une (page). La taille d'un syst�me d'exploitation, g�n�ralement � 4k ou 8k. Cela signifie que la page est lue dans les donn�es, quand il y avait en fait un disque IO.

2 et comparatif B-Tree est un arbre de recherche binaire

La complexit� temporelle de requ�te arbre de recherche binaire est O (logN), pour trouver le plus rapide et moins nombre de comparaisons, puisque la performance a �t� si bon, mais pourquoi est r�alis� � l'aide des index B-Tree au lieu d'un arbre de recherche binaire, le facteur cl� est le disque IO fois.

Indice de base de donn�es est sur le disque, lorsqu'une grande quantit� de donn�es dans le tableau, la taille de la m�moire d'augmentation de l'indice suivi atteindre plusieurs G ou plus. Lorsque nous utilisons la requ�te d'index, il est impossible d'indexer tous charg�s en m�moire, ne peut charger une d'une page par disque, o� la page disque sur l'arbre d'index de noeud correspondant.

Le premier discours suivant sur l'arbre binaire

arbre binaire d'abord,

Regardez d'abord le nombre de disque lorsque lookups arbre binaire IO: consid�rer la d�finition d'une hauteur d'arbre binaire est 4 pour trouver une valeur de 10:

Le premier disque IO:

La deuxi�me disque IO

Le troisi�me disque IO:

Quatri�me disque IO:

processus de recherche d'arbre binaire du point de vue, le nombre de la hauteur des arbres et des IO est 4, Ainsi, le nombre de disque IO pire des cas est d�termin� par la hauteur de l'arbre.

Du point de vue de l'analyse ci-dessus, r�duire le nombre de disque IO doit �tre la hauteur de l'arbre comprim�, de sorte que l'arbre longiligne essayer de devenir arbre trapu, donc B-Tree est n� dans ce contexte.

Deux, B-Tree

B-tree

m ordre B-Tree r�pondent aux crit�res suivants:

1, chaque noeud a la plus grande sous-arborescence m

2, il y a au moins deux sous-arbre racine

3, un noeud de branchement comporte au moins m / 2 unit�s de sous arbre (sauf le noeud racine et les noeuds de feuille sont des nuds de branchement)

4, tous les noeuds de feuille sont dans la m�me couche, chaque noeud peut avoir jusqu'� m-1 i�me cl�, et agenc� dans l'ordre croissant

Suit un troisi�me ordre B-tree, l'�l�ment de processus de recherche 21 a �t� observ�:

Le premier disque IO:

Le second disque IO:

Il y a une correspondance de la m�moire 3 et 12, respectivement, avec le rapport de

Le troisi�me disque IO:

Il y a une correspondance de la m�moire, respectivement, 14 et 21 que

De la d�couverte de la d�couverte, que le nombre binaire B-tree et le nombre de fois que le disque IO avec peu diff�rent, il semble n'y a aucun avantage.

Mais un examen plus attentif constatera que, L'alignement se fait en m�moire, il est pas li� au disque IO, la consommation n�gligeable. D'autres esp�ces Node B peuvent �tre stock�s dans un grand nombre de cl�s (num�ro d'ordre d�termin� par l'arbre).

Le m�me nombre de cl� g�n�r�e dans le noeud B-tree beaucoup moins que dans les noeuds de l'arbre binaire, le num�ro de noeud de fois la diff�rence de phase est �quivalent au disque IO. Apr�s cela, atteint un certain montant, la diff�rence de performance a commenc� � se d�sagr�ger.

Trois, B arbre nouveau

De nouveaux �l�ments sur la base de seulement 4, il devrait �tre compris entre 3 et 9:

Quatri�mement, suppression B-tree

Suppression des �l�ments 9:

Cinq, arbre B +

Fin arbre B, arbre B + viennent � parler, et le B + structure arborescente est similaire, mais plus sur les performances des requ�tes, ayant les caract�ristiques suivantes:

Il y k �me noeud de l'arbre contient k �l�ments interm�diaires (arbre B est des �l�ments k-1), chacun des �l�ments de donn�es ne sont pas enregistr�e, l'index utilis� uniquement, toutes les donn�es stock�es dans le noeud de feuille;
noeud feuille contient tous les �l�ments d'information, en fonction de la taille des mots-cl�s sorte de gauche � droite;
Bien que l'�l�ment de noeud interm�diaire existe dans le nud enfant, le nud enfant est le plus grand �l�ment.

La figure LIB�RATION exemple suivant:

Comme on peut le voir sur la figure, les nuds d'arbre B + et feuilles noeuds d�clarations de donn�es en double ici interm�diaires, Enregistrer noeuds interm�diaires uniquement des donn�es d'arbre sous-sous-aiguille, et non pas de donn�es r�elles, moins d'espace de stockage noeud interm�diaire.

Pendant ce temps, avec des pointeurs entre les nuds feuilles, en d'autres termes, les noeuds feuilles forment une liste li�e , Toutes les donn�es sont stock�es dans.

Pourquoi cette conception, par rapport � B-tree � quoi bon?

Tout d'abord, �tant donn� que le noeud interm�diaire de la borne B + sous-aiguille de l'arbre est seulement la m�morisation de donn�es de maximum et sous-arborescence de sous-arbre, l'espace lui-m�me est faible, il est possible de loger l'�l�ment plus de noeud, � savoir le m�me cas de donn�es, l'arbre B + sera plus B-arbres � chunky � et donc l'efficacit� plus rapide requ�te.

En second lieu, trouver une gamme de donn�es, uniquement dans le noeud feuille peut parcourir la liste B + arbre, ne pas comme la s�quence traversal B-tree un par un comme la comparaison de la taille. En r�sum�, B + avantage des arbres est:

Un niveau inf�rieur, moins nombre d'IO;

Besoin d'interroger chaque fois qu'un nud feuille;

noeuds requ�te de feuille de stabilit� de la performance forment une liste ordonn�e, la gamme des requ�tes facile

r�sum�

Ins�rer ou des �l�ments de suppression provoqueront la r�action de fission du noeud se produit, parfois tr�s g�nant, mais � cause de ce juste laisser le B-arbre peut toujours garder l'�quilibre multiple, c'est un propres avantages B-arbre: l'auto-�quilibrage; B-arbre est principalement utilis� dans le fichier syst�mes et une partie de l'indice de base de donn�es, comme MongoDB, donc la plupart index courant de base de donn�es relationnelle est B + impl�ment�s � l'aide d'arbres.

B-tree: + �quilibre r�seau ordonn� plusieurs arbres;

arbre B +: un r�seau ordonn� d'�quilibre � cha�nes multiples + arbre;

Devops et plus tard partageront les aspects DBA plus de contenu, des amis int�ress�s peuvent regarder -

Route de la soie

Apprenez � conna�tre la Chine

perspective binaire sur disque IO, arbre B-tree, arbre B +