Exclusif | Comprendre Hadoop en un article (2) HDFS (1)

Avec le d�veloppement continu de l'�conomie mondiale, l'�re du Big Data est arriv�e tranquillement, et Hadoop est le fondement de l'environnement du Big Data. Si vous voulez entrer dans l'industrie du Big Data, vous devez d'abord comprendre les connaissances de Hadoop. Au d�but de 2017, Apache a publi� Hadoop 3.0, ce qui signifie �galement qu'un groupe de personnes optimise constamment Hadoop. Non seulement cela, mais de nombreuses entreprises utilisent les versions commerciales de Hadoop, ce qui confirme �galement sa valeur commerciale.

Les lecteurs peuvent avoir une compr�hension compl�te de la technologie Hadoop en lisant la s�rie d'articles "Comprendre Hadoop dans un article". Il couvre tous les points de connaissance du site officiel Hadoop et est facile � comprendre. Les lecteurs qui ne sont pas bons en anglais peuvent lire cet article pour comprendre Hadoop.

Le contenu exclusif de ce num�ro de la s�rie d'articles "Comprendre Hadoop en un seul article" Selon l'introduction de Hadoop, le cadre de tous les points de connaissance de HDFS, MAPREDUCE et YARN sera pr�sent� en d�tail. D�coup� en quatre num�ros, le contenu sera pouss� ces derniers jours. Restez � l'�coute pour le contenu de suivi.

Le contenu de ce num�ro est d'expliquer HDFS en d�tail. En raison de la limitation du nombre de mots, cet article est divis� en deux parties, la premi�re et la seconde, respectivement.

1. Avantages et inconv�nients de HDFS

1.1 Avantages

1.1.1 Haute tol�rance aux pannes

Peut �tre constitu� de centaines ou de milliers de machines serveurs, chacune stockant une partie des donn�es du syst�me de fichiers�;
Les donn�es sont automatiquement enregistr�es en plusieurs copies�;
Une fois la copie perdue, il peut d�tecter rapidement l'�chec et r�cup�rer automatiquement.

1.1.2 Adapt� au traitement par lots

l'informatique mobile et non les donn�es�;
L'emplacement des donn�es est expos� au cadre informatique�;
Haut d�bit d'acc�s aux donn�es�;
Les applications en cours d'ex�cution ont un acc�s en continu � leurs ensembles de donn�es.

1.1.3 Adapt� au traitement du Big Data

Les tailles de fichier typiques vont de gigaoctets � t�raoctets�;
Prend en charge des dizaines de millions de fichiers dans une seule instance�;
Plus de 10�000�nuds.

1.1.4 Peut �tre construit sur des machines bon march�

Am�liorez la fiabilit� gr�ce � plusieurs copies�;
Fournit des m�canismes de tol�rance aux pannes et de r�cup�ration.

1.1.5 Forte portabilit� sur des plates-formes mat�rielles et logicielles h�t�rog�nes

Portez facilement d'une plate-forme � une autre.

1.1.6 Mod�le de coh�rence simple

L'application n�cessite un mod�le d'acc�s qui �crit une fois et lit de nombreux fichiers�;
Pas besoin de modifier les fichiers qui ont �t� cr��s, �crits et ferm�s, � part les ajouter et les tronquer�;
Simplifie les probl�mes de coh�rence des donn�es et permet un acc�s aux donn�es � haut d�bit�;
Hautement configurable, avec des configurations par d�faut id�ales pour de nombreuses installations. La plupart du temps, vous n'avez besoin d'ajuster la configuration que pour les tr�s grands clusters.

1.2 Inconv�nients

1.2.1 Ne convient pas � l'acc�s aux donn�es � faible latence

HDFS est davantage con�u pour le traitement par lots que pour une utilisation interactive avec l'utilisateur. L'accent est mis sur un haut d�bit d'acc�s aux donn�es, et non sur une faible latence d'acc�s aux donn�es.

1.2.2 Ne convient pas � l'acc�s aux petits fichiers

Occupe beaucoup de m�moire de NameNode�;
Le temps de recherche d�passe le temps de lecture.

1.2.3 Impossible d'�crire simultan�ment, le fichier est imm�diatement modifi�

Un fichier ne peut avoir qu'un seul �crivain ;
Seuls l'ajout et la troncation sont pris en charge.

2. Composition de base

2.1 Noeud de nom

2.1.1 Accepter les services de lecture et d'�criture du client

Effectuez des op�rations d'espace de noms de syst�me de fichiers telles que l'ouverture, la fermeture et le changement de nom de fichiers et de r�pertoires.

2.1.2 Gestion des espaces de noms du syst�me de fichiers

Enregistrez toutes les modifications apport�es � l'espace de noms du syst�me de fichiers ou � ses attributs.

2.1.3 composition des m�tadonn�es

Les m�tadonn�es sont les informations de m�tadonn�es stock�es sur le Namenode, et le nom de fichier qu'il stocke sur le disque est : fsimage. Et il existe un fichier appel� edits pour enregistrer le journal des op�rations des m�tadonn�es. En g�n�ral, les fichiers fsimage et edits enregistrent les informations d'autorisation et l'arborescence du r�pertoire du syst�me de fichiers dans les m�tadonn�es, qui bloquent le fichier contient, d�terminent le mappage des blocs aux DataNodes et sur quels DataNodes les blocs sont stock�s (rapport� lorsque le DataNode est d�marr�) .

NameNode charge ces informations en m�moire et les assemble, ce qui devient une information de m�tadonn�es compl�te.

2.1.4 Espaces de noms du syst�me de fichiers

HDFS prend en charge l'organisation hi�rarchique traditionnelle des fichiers. Les utilisateurs ou les applications peuvent cr�er des r�pertoires et stocker des fichiers dans ces r�pertoires. La hi�rarchie de l'espace de noms du syst�me de fichiers est similaire � la plupart des autres syst�mes de fichiers existants�: les fichiers peuvent �tre cr��s et supprim�s, d�plac�s d'un r�pertoire � un autre ou renomm�s. HDFS prend en charge les quotas d'utilisateurs et les droits d'acc�s. Cependant, les liens mat�riels ou logiciels ne sont pas pris en charge.

Le NameNode maintient l'espace de noms du syst�me de fichiers. Toutes les modifications apport�es � l'espace de noms du syst�me de fichiers ou � ses propri�t�s sont consign�es par le NameNode. Les applications peuvent sp�cifier le nombre de copies de fichiers qui doivent �tre conserv�es par HDFS. Le nombre de copies d'un fichier est appel� facteur de r�plication pour ce fichier. Ces informations sont stock�es par le NameNode.

2.1.5 Persistance des m�tadonn�es du syst�me de fichiers

Les informations de m�tadonn�es du NameNode seront charg�es dans la m�moire apr�s le d�marrage. �tant donn� que les donn�es charg�es dans la m�moire sont tr�s peu s�curis�es, elles dispara�tront apr�s la mise hors tension. Par cons�quent, les informations stock�es dans la m�moire doivent �tre conserv�es.

L'espace de noms de HDFS est enregistr� sur le Namenode. Toutes les op�rations qui modifient les m�tadonn�es du syst�me de fichiers sont enregistr�es par le Namenode � l'aide d'un journal des transactions appel� Edits. Par exemple, en cr�ant un fichier dans HDFS, Namenode ins�rera un enregistrement dans Edits pour le repr�senter�; de m�me, la modification du facteur de copie du fichier ins�rera �galement un enregistrement dans Edits. Le Namenode stocke les modifications dans le syst�me de fichiers du syst�me d'exploitation local. L'espace de noms de l'ensemble du syst�me de fichiers, y compris le mappage des blocs de donn�es sur les fichiers, les attributs de fichier, etc., est stock� dans un fichier appel� FsImage, qui est �galement plac� sur le syst�me de fichiers local o� se trouve le Namenode.

Namenode enregistre l'ensemble de l'espace de noms du syst�me de fichiers et l'image de la carte des blocs de fichiers en m�moire. Cette structure de m�tadonn�es cl�s est con�ue pour �tre compacte, donc un Namenode avec 4G de m�moire est suffisant pour prendre en charge un grand nombre de fichiers et de r�pertoires. Lorsque le Namenode d�marre, il lit les Edits et FsImage � partir du disque dur, applique toutes les transactions dans les Edits � la FsImage en m�moire, enregistre cette nouvelle version de la FsImage de la m�moire sur le disque local, puis supprime l'ancienne Edits , car cette ancienne transaction Edits a �t� appliqu�e � FsImage. Ce processus s'appelle un point de contr�le.

Datanode stocke les donn�es HDFS sous forme de fichiers dans le syst�me de fichiers local, il ne conna�t pas les informations sur les fichiers HDFS. Il stocke chaque bloc de donn�es HDFS dans un fichier s�par� sur le syst�me de fichiers local. Datanode ne cr�e pas tous les fichiers dans le m�me r�pertoire, en fait, il utilise des heuristiques pour d�terminer le nombre optimal de fichiers par r�pertoire, et cr�e des sous-r�pertoires le cas �ch�ant. La cr�ation de tous les fichiers locaux dans le m�me r�pertoire n'est pas optimale car le syst�me de fichiers local peut ne pas �tre en mesure de prendre en charge efficacement un grand nombre de fichiers dans un seul r�pertoire. Lorsqu'un Datanode d�marre, il analyse le syst�me de fichiers local, produit une liste de tous les blocs de donn�es HDFS correspondant � ces fichiers locaux et l'envoie sous forme de rapport au Namenode, qui est le rapport d'�tat du bloc.

2.2�NoeudNomSecondaire

Ce n'est pas la sauvegarde du NameNode, mais il peut �tre utilis� comme sauvegarde du NameNode. En cas de panne de courant ou d'endommagement du serveur, le fichier fsimage fusionn� dans le SecondNameNode peut �tre utilis� comme fichier de sauvegarde � restaurer sur le NameNode, mais il est susceptible d'�tre perdu pendant le processus de fusion. Informations de modification nouvellement g�n�r�es. Donc pas une sauvegarde compl�te.

�tant donn� que le NameNode fusionne uniquement le fsimage et modifie les fichiers au d�marrage, le fichier journal des modifications peut devenir tr�s volumineux avec le temps sur un cluster occup�. Un autre effet secondaire des fichiers d'�dition plus volumineux est que le prochain red�marrage du NameNode prend plus de temps. La fonction principale de SecondNameNode est d'aider NameNode � fusionner les modifications et les fichiers fsimage, r�duisant ainsi le temps de d�marrage de NameNode.

2.2.1 Synchronisation de fusion d'ex�cution SNN

L'intervalle de temps fs.checkpoint.period configur� selon le fichier de configuration est par d�faut de 1 heure ;
dfs.namenode.checkpoint.txns, le param�tre par d�faut est 1 million, c'est-�-dire que lorsque le nombre de transactions dans Edits atteint 1 million, une fusion sera d�clench�e, m�me si la p�riode de point de contr�le n'est pas atteinte.

2.2.2 Processus de fusion SNN

G�n�rez d'abord un fichier nomm� edits.new pour enregistrer les informations de journal g�n�r�es pendant le processus de fusion�;
Lorsqu'un certain timing est d�clench� (l'intervalle de temps atteint 1 heure ou le nombre de transactions dans Edits atteint 1 million), le SecondaryNamenode lit le fichier d'�dition et le fichier fsimage du NameNode au SecondNamenode�;
Fusionnez le fichier d'�dition et fsimage dans un fichier fsimage.ckpt�;
Convertissez le fichier fusionn� g�n�r� fsimage.ckpt en NameNode�;
Remplacez le fichier fsimage.ckpt par le fichier fsimage sur le NameNode pour remplacer le fichier fsimage d'origine sur le NameNode, et remplacez le fichier edits.new par le fichier d'�dition pour remplacer le fichier d'�dition d'origine sur le NameNode.

SNN existe toujours dans l'�tat non haute disponibilit� de hadoop2.x et sup�rieur, mais SNN n'existe pas dans l'�tat haute disponibilit� de hadoop2.x et sup�rieur, et dans l'�tat haute disponibilit� de hadoop2.x et sup�rieur, il est dans standby Le NameNode de l'�tat pour effectuer l'op�ration de fusion.

2.3�Nuds de donn�es

G�rez le stockage attach� aux nuds sur lesquels ils s'ex�cutent et autorisez le stockage des donn�es utilisateur dans des fichiers�;
En interne, le fichier est divis� en un ou plusieurs blocs (Block), et ces blocs sont stock�s dans un ensemble de DataNodes ;
Responsable du traitement des demandes de lecture et d'�criture des clients du syst�me de fichiers�;
Effectuer la cr�ation et la suppression de blocs�;
Les informations de bloc seront signal�es � NN lorsque le processus DN est lanc�;
Restez en contact avec le NN en envoyant des battements de cur (une fois toutes les 3 secondes). Si le NN ne re�oit pas de battement de cur du DN pendant 10 minutes, il est consid�r� que le DN a �t� perdu et le bloc qu'il contient est copi� vers d'autres DN.

2.3.1 Unit� de stockage HDFS (bloc)

2.3.1.1 Le fichier est divis� en blocs de donn�es de taille fixe

La taille de bloc de donn�es par d�faut est de 64�Mo (hadoop1.x), 128�Mo (hadoop2.x), 256�Mo (hadoop3.x), configurable�;
Si la taille du fichier est inf�rieure � la taille d'un bloc, il est stock� en tant que bloc seul et le bloc de bloc est un concept logique. La taille du fichier correspond � l'espace qu'il occupe.

2.3.1.2 Une m�thode de stockage de fichiers

Il est divis� en diff�rents blocs selon leur taille et stock� sur diff�rents nuds�;
Par d�faut, chaque bloc a 3 copies ;
La taille de bloc et le nombre de copies sont d�finis lorsque le fichier est t�l�charg� c�t� client. Une fois le fichier t�l�charg� avec succ�s, le nombre de copies peut �tre modifi�, mais la taille de bloc ne peut pas �tre modifi�e.

2.3.1.3 Pens�e conceptuelle

Le gros fichier est divis� en blocs de 256 Mo, et chaque bloc est stock� de mani�re al�atoire sur un nud diff�rent, �vitant ainsi le probl�me de distorsion des donn�es, mais dans le processus de d�veloppement, si l'algorithme et le programme ne sont pas bien �crits, le m�me sera Il y a un probl�me d'asym�trie des donn�es.

2.3.2 Donn�es complexe syst�me

2.3.2.1 Pr�sentation de la r�plication de donn�es

HDFS est con�u pour stocker de mani�re fiable des fichiers tr�s volumineux sur des machines dans un grand cluster. Il stocke chaque fichier sous la forme d'une s�rie de blocs, qui ont tous la m�me taille sauf le dernier. Pour la tol�rance aux pannes, tous les blocs de donn�es du fichier sont r�pliqu�s. La taille de bloc et le facteur de copie sont configurables pour chaque fichier. Une application peut sp�cifier le nombre de copies d'un fichier. Le facteur de copie peut �tre sp�cifi� lors de la cr�ation du fichier ou il peut �tre modifi� ult�rieurement. Les fichiers dans HDFS sont tous � �criture unique, et il existe une exigence stricte selon laquelle il ne peut y avoir qu'un seul graveur � la fois.

Le Namenode g�re enti�rement la r�plication des blocs de donn�es et re�oit p�riodiquement des signaux de pulsation et des rapports d'�tat de bloc (Blockreport) de chaque Datanode du cluster. La r�ception d'un signal de pulsation signifie que le Datanode fonctionne correctement. Le rapport d'�tat de bloc contient une liste de tous les blocs de donn�es sur le Datanode.

Nuds de donn�es HDFS

2.3.2.2 Strat�gie de placement de copie de bloc

Le stockage de r�plication est la cl� de la fiabilit� et des performances HDFS. La strat�gie de stockage de copie optimis�e est une caract�ristique importante qui distingue HDFS de la plupart des autres syst�mes de fichiers distribu�s. Cette fonctionnalit� n�cessite beaucoup de r�glage et d'exp�rience. HDFS utilise une strat�gie appel�e rack-aware pour am�liorer la fiabilit� des donn�es, la disponibilit� et l'utilisation de la bande passante du r�seau. La strat�gie de stockage des r�pliques actuellement mise en uvre n'est que la premi�re �tape dans cette direction. L'objectif � court terme de la mise en uvre de cette strat�gie est de valider son efficacit� dans un environnement de production, d'observer son comportement et de jeter les bases de tests et de recherches pour mettre en uvre des strat�gies plus avanc�es.

Les grandes instances HDFS s'ex�cutent g�n�ralement sur des clusters d'ordinateurs r�partis sur plusieurs racks, et la communication entre deux machines sur des racks diff�rents doit passer par un commutateur. Dans la plupart des cas, la bande passante entre deux machines d'un m�me rack sera sup�rieure � la bande passante entre deux machines de racks diff�rents.

Gr�ce � un processus compatible avec le rack, le Namenode peut d�terminer l'ID de rack auquel appartient chaque Datanode. Une strat�gie simple mais non optimis�e consiste � conserver les r�pliques sur diff�rents racks. Cela peut emp�cher efficacement la perte de donn�es lorsque le rack entier tombe en panne et permet une utilisation compl�te de la bande passante de plusieurs racks lors de la lecture des donn�es. Ce param�tre de strat�gie peut r�partir uniform�ment les r�pliques dans le cluster, ce qui est propice � l'�quilibrage de charge en cas de d�faillance d'un composant. Cependant, �tant donn� qu'une op�ration d'�criture de cette strat�gie n�cessite de transf�rer des blocs de donn�es vers plusieurs racks, cela augmente le co�t d'�criture.

Dans la plupart des cas, le facteur de r�plique est de 3, et la strat�gie de stockage HDFS consiste � stocker une r�plique sur un nud du rack local, une r�plique sur un autre nud du m�me rack et la derni�re r�plique sur un rack diff�rent sur le nud. . Cette strat�gie r�duit les transferts de donn�es entre les racks, ce qui augmente l'efficacit� des op�rations d'�criture. Les racks ont beaucoup moins d'erreurs que les nuds, donc cette strat�gie n'affecte pas la fiabilit� et la disponibilit� des donn�es. Dans le m�me temps, �tant donn� que les blocs de donn�es ne sont plac�s que sur deux (et non trois) racks diff�rents, cette strat�gie r�duit la bande passante de transfert r�seau globale n�cessaire pour lire les donn�es. Dans le cadre de cette strat�gie, les r�pliques ne sont pas r�parties uniform�ment sur les diff�rents racks. Un tiers des r�pliques se trouvent sur un nud, les deux tiers des r�pliques se trouvent sur un rack et les autres r�pliques sont r�parties uniform�ment entre les racks restants. Cette strat�gie ne compromet pas la fiabilit� des donn�es ni les performances de lecture. Performances d'�criture am�lior�es.

2.3.2.3 S�lection de copie

Afin de r�duire la consommation globale de bande passante et la latence de lecture, HDFS essaiera de laisser le lecteur lire la copie la plus proche. S'il y a une r�plique sur le m�me rack que le lecteur, alors lisez cette r�plique. Si un cluster HDFS s'�tend sur plusieurs centres de donn�es, les clients liront �galement le r�plica du centre de donn�es local en premier.

2.3.2.4 Mode sans �chec

Lorsque le NameNode d�marre, il entre dans un �tat sp�cial appel� mode sans �chec : il charge d'abord le fichier image (fsimage) en m�moire et effectue diverses op�rations dans le journal d'�dition (edits) ;
Une fois que le mappage des m�tadonn�es du syst�me de fichiers est �tabli avec succ�s en m�moire, cr�ez un nouveau fichier fsimage (cette op�ration ne n�cessite pas SecondNameNode) et un journal d'�dition vide�;
� ce moment, le namenode fonctionne en mode sans �chec, c'est-�-dire que le syst�me de fichiers du namenode est en lecture seule pour le client, et il ne parviendra pas � �crire, supprimer et renommer le r�pertoire, le contenu du fichier, etc.�;
A ce stade, le namenode collecte les rapports de chaque datanode. Lorsque le bloc de donn�es atteint le nombre minimum de r�pliques, il sera consid�r� comme "s�r". Apr�s qu'un certain pourcentage des blocs de donn�es soient consid�r�s comme s�rs (peut �tre d�fini), apr�s une certaine p�riode de temps, le mode sans �chec se termine�;
Lorsqu'il est d�tect� que le nombre de r�pliques est insuffisant pour un bloc de donn�es, le bloc sera r�pliqu� jusqu'� ce que le nombre minimum de r�pliques soit atteint. La position du bloc de donn�es dans le syst�me n'est pas maintenue par le namenode, mais est stock�e dans le datanode sous la forme d'une liste de blocs.

2.4 Organisation des donn�es

2.4.1 Blocs de donn�es

HDFS est con�u pour prendre en charge des fichiers volumineux et HDFS convient aux applications qui doivent traiter de grands ensembles de donn�es. Ces applications n'�crivent les donn�es qu'une seule fois, mais les lisent une ou plusieurs fois, et la vitesse de lecture doit pouvoir r�pondre aux besoins de la lecture en continu. HDFS prend en charge la s�mantique "write once read many" pour les fichiers. Une taille de bloc de donn�es typique est de 256 Mo. Par cons�quent, les fichiers dans HDFS sont toujours divis�s en diff�rents blocs selon 256M, et chaque bloc est stock� dans diff�rents Datanodes autant que possible.

2.4.2 Segmentation

La demande du client pour cr�er un fichier n'est pas envoy�e imm�diatement au Namenode. En fait, au d�but, le client HDFS mettra en cache les donn�es du fichier dans un fichier temporaire local. Les �critures d'application sont redirig�es de mani�re transparente vers ce fichier temporaire. Lorsque la quantit� de donn�es accumul�es dans ce fichier temporaire d�passe la taille d'un bloc de donn�es, le client contactera le Namenode. Le Namenode ins�re le nom de fichier dans la hi�rarchie du syst�me de fichiers et lui alloue un bloc de donn�es. Renvoyez ensuite l'identifiant du Datanode et le bloc de donn�es cible au client. Ensuite, le client t�l�charge cette donn�e du fichier temporaire local vers le Datanode sp�cifi�. Lorsque le fichier est ferm�, les donn�es non t�l�charg�es restant dans le fichier temporaire seront �galement transf�r�es vers le Datanode sp�cifi�. Le client indique alors � Namenode que le fichier est ferm�. � ce moment, le Namenode soumet l'op�ration de cr�ation de fichier au journal pour le stockage. Si le Namenode tombe en panne avant la fermeture du fichier, le fichier sera perdu.

L'approche ci-dessus est le r�sultat d'un examen attentif de l'application cible ex�cut�e sur HDFS. Ces applications n�cessitent des �critures en continu dans les fichiers. Si le cache client n'est pas utilis�, le d�bit sera fortement affect� en raison de la vitesse et de la congestion du r�seau. Cette approche n'est pas sans pr�c�dent et les premiers syst�mes de fichiers, tels que AFS, utilisaient la mise en cache c�t� client pour am�liorer les performances. Afin d'am�liorer l'efficacit� du t�l�chargement des donn�es, les exigences de la norme POSIX ont �t� assouplies.

2.4.3 R�plication du pipeline

Lorsqu'un client �crit des donn�es dans un fichier HDFS, il �crit initialement dans un fichier temporaire local. En supposant que le facteur de copie du fichier est d�fini sur 3, lorsque le fichier temporaire local atteint la taille d'un bloc de donn�es, le client obtiendra une liste de Datanodes du Namenode pour stocker des copies. Ensuite, le client commence � transmettre des donn�es au premier Datanode, le premier Datanode re�oit les donn�es en petites parties (4 Ko), �crit chaque partie dans l'entrep�t local et transmet simultan�ment la partie au deuxi�me Datanode dans le nud de liste. Il en va de m�me pour le deuxi�me Datanode, recevant des donn�es en petites portions, les �crivant dans le r�f�rentiel local et les transmettant au troisi�me Datanode en m�me temps. Enfin, le troisi�me Datanode re�oit les donn�es et les stocke localement. Par cons�quent, un Datanode peut recevoir des donn�es du nud pr�c�dent de mani�re pipeline et les transmettre au nud suivant en m�me temps, et les donn�es sont copi�es du Datanode pr�c�dent vers le suivant de mani�re pipeline.

3. Processus de lecture et d'�criture

3.1 Processus de lecture HDFS

Tout d'abord, le client de HDFS passe le DistributedFileSystem ;
Demandez le NameNode via DistributedFileSystem, envoyez les informations utilisateur et les informations de nom de fichier au NameNode, et revenez au DistributedFileSystem o� se trouve le bloc contenu dans le fichier.
Le client HDFS lit les informations de bloc dans le DataNode en s�quence via le FSDataInputStream (il s�lectionnera le DataNode avec la charge la plus faible ou le DataNode le plus proche du client pour lire le bloc) ;
FSDataInputStream lit un par un dans l'ordre jusqu'� ce que tous les blocs soient lus�;
FSDataInputStream sera ferm� lorsque la lecture sera termin�e.

3.2 Processus d'�criture HDFS

Tout d'abord, le client de HDFS passe le Distributed FileSystem (un objet dans l'API de HDFS)�;
Envoyer la demande du client au NameNode via le Distributed FileSystem (le NameNode accepte principalement les demandes des clients) et l'envoyer au NameNode avec des informations telles que l'emplacement du fichier � enregistrer, le nom du fichier et le nom d'utilisateur de l'op�ration�;
Le NameNode renvoie un FSDataOutputStream au client et renvoie �galement dans quel DataNode le fichier doit �tre �crit (avec une charge inf�rieure) ;
L'op�ration d'�criture est effectu�e via FSDataOutputStream, et le fichier est divis� avant l'�criture, et le fichier est divis� en plusieurs blocs. La premi�re op�ration d'�criture est �crite sur le DataNode avec une faible charge, et le bloc est copi� vers d'autres DataNodes�;
Lorsque toutes les copies de blocs sont copi�es, elles seront renvoy�es � FSDataOutputStream�;
Lorsque toutes les copies de bloc sont copi�es, le flux FSDataOutputStream peut �tre ferm� ;
Mettez � jour les informations de donn�es source dans NameNode via Distributed FileSystem.

4.Architecture

4.1 NameNode et DataNode

HDFS adopte l'architecture ma�tre/travailleur. Un cluster HDFS est compos� d'un Namenode et d'un certain nombre de Datanodes. Namenode est un serveur central responsable de la gestion de l'espace de noms du syst�me de fichiers et de l'acc�s client aux fichiers. Le Datanode dans le cluster est g�n�ralement un nud, responsable de la gestion du stockage sur le nud o� il se trouve. HDFS expose l'espace de noms du syst�me de fichiers sur lequel les utilisateurs peuvent stocker des donn�es sous forme de fichiers. En interne, un fichier est en fait divis� en un ou plusieurs blocs de donn�es, qui sont stock�s sur un ensemble de Datanodes. Namenode effectue des op�rations d'espace de noms de syst�me de fichiers, telles que l'ouverture, la fermeture et le changement de nom de fichiers ou de r�pertoires. Il est �galement charg� de d�terminer le mappage des blocs de donn�es sur des nuds Datanode sp�cifiques. Les nuds de donn�es sont responsables de la gestion des demandes de lecture et d'�criture des clients du syst�me de fichiers. La cr�ation, la suppression et la r�plication des blocs de donn�es sont effectu�es sous la planification unifi�e de Namenode.

Architecture HDFS

Namenode et Datanode sont con�us pour fonctionner sur des machines courantes. Ces machines ex�cutent g�n�ralement le syst�me d'exploitation (OS) GNU/Linux. HDFS est d�velopp� en Java, de sorte que toute machine compatible Java peut d�ployer Namenode ou Datanode. Gr�ce au langage Java hautement portable, HDFS peut �tre d�ploy� sur diff�rents types de machines. Un sc�nario de d�ploiement typique est qu'une seule instance de Namenode s'ex�cute sur une machine, tandis que les autres machines du cluster ex�cutent chacune une instance de Datanode. Cette architecture peut �galement ex�cuter plusieurs Datanodes sur une seule machine, mais cela est moins courant.

La structure d'un seul Namenode dans le cluster simplifie grandement l'architecture du syst�me. Namenode est le gestionnaire de toutes les m�tadonn�es HDFS, les donn�es utilisateur ne transitent jamais par Namenode.

4.1.1 Protocole de communication

Tous les protocoles de communication HDFS reposent sur le protocole TCP/IP. Le client se connecte au Namenode via un port TCP configurable et interagit avec le Namenode via le protocole ClientProtocol. Le Datanode utilise le protocole DatanodeProtocol pour interagir avec le Namenode. Un mod�le d'appel de proc�dure distante (RPC) est abstrait pour encapsuler les protocoles ClientProtocol et Datanodeprotocol. De par sa conception, le Namenode n'initie pas de RPC, mais r�pond aux demandes RPC des clients ou des Datanodes.

4.2 Infrastructures

Le syst�me de fichiers distribu�s Hadoop (HDFS) est con�u pour �tre un syst�me de fichiers distribu� qui s'ex�cute sur du mat�riel � usage g�n�ral. Il a beaucoup en commun avec les syst�mes de fichiers distribu�s existants. Mais en m�me temps, la diff�rence entre celui-ci et les autres syst�mes de fichiers distribu�s est �galement �vidente. HDFS est un syst�me hautement tol�rant aux pannes adapt� au d�ploiement sur des machines peu co�teuses. HDFS peut fournir un acc�s aux donn�es � haut d�bit, ce qui convient parfaitement aux applications sur des ensembles de donn�es � grande �chelle. HDFS assouplit certaines contraintes POSIX pour atteindre l'objectif de diffusion en continu des donn�es du syst�me de fichiers. HDFS a �t� initialement d�velopp� comme infrastructure pour le projet de moteur de recherche Apache Nutch. HDFS fait partie du projet Apache Hadoop Core.

La requ�te du client tombe enti�rement sur le NameNode�;
Les informations de m�tadonn�es existent dans NameNode�;
Il n'y a qu'un seul NameNode � l'�tat Actif dans le cluster Hadoop�;
SecondaryNameNode n'est pas un nud de sauvegarde ou un nud esclave de NameNode (pour �tre pr�cis, il ne peut sauvegarder qu'une partie de NameNode, pas tout) ;
Il existe un m�canisme de pulsation entre le NameNode et le DataNode, afin que le NameNode puisse conna�tre le fonctionnement et la charge du DataNode.

4.2.1 Robustesse

L'objectif principal de HDFS est d'assurer la fiabilit� du stockage des donn�es m�me en cas d'erreurs. Les trois conditions d'erreur courantes sont�: l'erreur Namenode, l'erreur Datanode et la partition r�seau.

4.2.1.1 Erreur de donn�es de disque, d�tection de pulsation et re-r�plication

Chaque Datanode envoie p�riodiquement un signal de pulsation au Namenode. Des raisons de r�seau peuvent faire en sorte que certains Datanodes perdent le contact avec le Namenode. Le Namenode d�tecte cette situation par l'absence de signaux heartbeat, et marque ces Datanodes qui n'envoient plus de signaux heartbeat comme down, et ne leur enverra pas de nouvelles requ�tes IO. Toutes les donn�es stock�es sur un Datanode en panne ne seront plus valides. L'indisponibilit� du Datanode peut faire en sorte que le facteur de r�plication de certains blocs de donn�es soit inf�rieur � la valeur sp�cifi�e. Le Namenode d�tecte en permanence ces blocs de donn�es qui doivent �tre r�pliqu�s et d�marre l'op�ration de r�plication une fois trouv�. Une re-r�plication peut �tre n�cessaire dans les situations suivantes : un Datanode tombe en panne, une r�plique est corrompue, une erreur de disque dur sur le Datanode ou le facteur de r�plication d'un fichier augmente.

4.2.1.1.1 Disques �changeables � chaud DataNode

Datanode prend en charge les disques rempla�ables � chaud. Les volumes de donn�es HDFS peuvent �tre ajout�s ou remplac�s sans arr�ter le DataNode. Voici une br�ve description d'un pilote hot-plug typique�:

Si de nouveaux r�pertoires de stockage existent, ils doivent �tre format�s et mont�s de mani�re appropri�e�;
Mettez � jour le r�pertoire du volume de donn�es vers la configuration DataNode dfs.datanode.data.dir�;
Faites en sorte que le r�pertoire que nous avons configur� prenne effet en ex�cutant dfsadmin -reconfig datanode HOST:PORT start, et vous pouvez utiliser dfsadmin -reconfig datanode HOST:PORT status pour interroger l'�tat d'ex�cution de la t�che de reconfiguration�;
Une fois la t�che de reconfiguration termin�e, nous pouvons d�monter en toute s�curit�, supprimer le r�pertoire du volume de donn�es et retirer physiquement le disque.

4.2.1.2 �quilibrage de charge

L'architecture de HDFS prend en charge les strat�gies d'�quilibrage des donn�es. Si l'espace libre sur un Datanode est inf�rieur � un certain point critique, le syst�me d�placera automatiquement les donn�es de ce Datanode vers d'autres Datanodes inactifs selon la strat�gie d'�quilibrage. En cas de forte demande soudaine pour un fichier particulier, ce sch�ma peut cr�er dynamiquement des r�pliques suppl�mentaires et r��quilibrer d'autres donn�es dans le cluster.

4.2.1.2.1 �quilibreur

Les donn�es de HDFS peuvent ne pas �tre r�parties de mani�re tr�s homog�ne dans chaque DataNode. Une raison courante est que de nouveaux DataNodes sont souvent ajout�s � un cluster existant. Lors de l'ajout d'un bloc de donn�es (les donn�es d'un fichier sont stock�es dans une s�rie de blocs), le NameNode prendra en compte de nombreux facteurs avant de s�lectionner le DataNode pour recevoir le bloc de donn�es. Certaines de ces consid�rations sont :

Placez une copie du bloc de donn�es sur le nud qui �crit le bloc de donn�es�;
Essayez de r�partir diff�rentes copies de blocs de donn�es sur diff�rents racks, afin que le cluster puisse survivre � la perte compl�te d'un rack�;
Une r�plique est g�n�ralement plac�e sur un nud dans le m�me rack que le nud �crivant le fichier, ce qui r�duit les E/S r�seau sur les racks ;
Essayez de r�partir uniform�ment les donn�es HDFS entre les DataNodes du cluster.

4.2.1.2.2 �quilibreur de disque

Diskbalancer est un outil de ligne de commande qui distribue uniform�ment les donn�es sur tous les disques d'un nud de donn�es. Cet outil diff�re de l'�quilibreur en ce qu'il est responsable de l'�quilibrage des donn�es � l'�chelle du cluster. Les donn�es peuvent �tre r�parties de mani�re in�gale sur les disques d'un nud pour plusieurs raisons. Cela peut se produire en raison d'�critures et de suppressions intensives ou en raison du remplacement du disque. L'outil op�re sur un codage de donn�es donn� et d�place les blocs d'un disque � l'autre.

4.2.1.2.2.1 Architecture

L'�quilibreur de disque fonctionne en cr�ant un plan, puis en ex�cutant le plan sur les nuds de donn�es. Un plan est un ensemble d'instructions d�crivant le d�placement de donn�es entre deux disques. Un plan se compose de plusieurs �tapes. Une �tape de d�placement a un disque source, un disque de destination et le nombre d'octets � d�placer. Les plans peuvent �tre ex�cut�s sur des nuds de donn�es op�rationnels.

Au total 3 �tapes sont incluses, Discover (d�couverte) � Plan (planning), puis de Plan (planning) � Execute (ex�cution) :

4.2.1.2.2.1.1 D�couvrir

Ce que fait la phase de d�couverte est en fait de calculer l'utilisation du disque dans chaque nud, puis d'obtenir une liste des disques qui ont besoin d'�quilibrer les donn�es. Ici, le concept de densit� d'utilisation du disque Volume Data Density sera utilis� comme crit�re d'�valuation, et cette norme valeur sera Prendre le taux d'utilisation total du nud comme valeur de comparaison. Par exemple, si le taux d'utilisation total d'un nud est de 75 %, soit 0,75, et que le taux d'utilisation du disque A est de 0,5 (50 %), alors la valeur de densit� de volumeDataDensity du disque A est �gale � 0,75-0,5 = 0,25. De m�me, si elle d�passe, la valeur de densit� sera n�gative. Nous pouvons donc utiliser la valeur absolue de volumeDataDensity de chaque disque du nud pour juger de l'�quilibre de donn�es entre les disques dans ce nud, si la somme des valeurs absolues totales Plus la valeur est �lev�e, plus les donn�es sont d�s�quilibr�es, ce qui est similaire au concept de variance. Les objets de connecteur suivants seront utilis�s dans la phase de d�couverte�:

DBNameNodeConnectorDBNameNodeConnector
Connecteur Json
NullConnector

Le premier objet appellera l'objet NameNodeConnector sous le package Balancer pour lire le nud du cluster et les donn�es du disque.

4.2.1.2.2.1.2 R�gime

Apr�s avoir obtenu les donn�es de r�sultat du rapport de l'�tape pr�c�dente, le plan d'ex�cution sera g�n�r�. Le plan n'est pas la plus petite unit� d'ex�cution et son int�rieur est compos� de diff�rentes �tapes. Les disques source et cible sont sp�cifi�s dans l'�tape. L'objet disque ici C'est une couche d'objets envelopp�s�: DiskBalancerVolume, pas le FsVolume d'origine. Au fait, voici la transformation de concepts tels que les nuds de disque dans DiskBalancer�:

DiskBalancerCluster.Gr�ce � cet objet, les informations sur les nuds du cluster peuvent �tre lues et les informations sur les nuds sont pr�sent�es ici sous la forme de DiskBalancerDataNode�;
DiskBalancerDataNode. Cet objet repr�sente un DataNode encapsul�;
Objets disque DiskBalancerVolume et DiskBalancerVolumeSet.DataNode et collections d'objets disque. Le type de r�pertoire de stockage sur disque dans DiskBalancerVolumeSet doit �tre le m�me StorageType.

4.2.1.2.2.1.3 Ex�cuter

La derni�re partie est la phase d'ex�cution. Une fois tous les plans de plan g�n�r�s, il viendra � la phase d'ex�cution. Ces plans seront soumis � leurs DataNodes respectifs, puis ex�cut�s dans la classe DiskBalancer. Il existe des objets de classe sp�ciaux dans le DiskBalancer classe pour les disques. Le nom de cette classe est appel� DiskBalancerMover. Dans le processus d'�quilibrage des donn�es entre les disques, le disque � forte utilisation d�placera les blocs de donn�es vers le disque � utilisation relativement faible. Lorsqu'une certaine relation de seuil est atteinte, DiskBalancer va progressivement Pendant la phase d'ex�cution de DiskBalancer, les points suivants doivent �tre not�s�:

Limite de bande passante DiskBalancer peut �galement prendre en charge la limite de bande passante, la valeur par d�faut est 10M, qui est contr�l�e en configurant dfs.disk.balancer.max.disk.throughputInMBperSec;
La limite du nombre d'�checs. Il y aura un contr�le du nombre d'�checs dans DiskBalancer. Lors de la copie du bloc de donn�es de bloc, une exception IOException se produit et le d�compte cumul� du nombre d'�checs sera effectu�. Si la tol�rance maximale est d�pass�e, DiskBalancer se fermera �galement�;
Contr�le du seuil d'�quilibrage des donn�es. DiskBalancer peut fournir un seuil d'�quilibrage des donn�es entre les disques comme crit�re pour continuer � �quilibrer les donn�es. L'�l�ment de configuration est dfs.disk.balancer.block.tolerance.percent.

4.2.1.3 Int�grit� des donn�es

Les blocs de donn�es obtenus � partir d'un Datanode peuvent �tre corrompus, et la corruption peut �tre caus�e par des erreurs dans le p�riph�rique de stockage du Datanode, des erreurs de r�seau ou des bogues logiciels. Le logiciel client HDFS impl�mente la v�rification de la somme de contr�le du contenu des fichiers HDFS. Lorsque le client cr�e un nouveau fichier HDFS, il calcule la somme de contr�le de chaque bloc de donn�es du fichier et enregistre la somme de contr�le dans un fichier cach� s�par� dans le m�me espace de noms HDFS. Lorsque le client obtient le contenu du fichier, il v�rifie si les donn�es obtenues � partir du Datanode correspondent � la somme de contr�le dans le fichier de somme de contr�le correspondant. Si cela ne correspond pas, le client peut choisir d'obtenir une copie du bloc de donn�es � partir d'autres Datanodes.

4.2.1.3.1 M�canisme de corbeille

4.2.1.3.1.1 Suppression et r�cup�ration de fichiers

Si la fonction Corbeille est activ�e, les fichiers supprim�s par FS Shell ne sont pas imm�diatement supprim�s de HDFS. Au lieu de cela, d�placez-le dans le r�pertoire de recyclage (chaque utilisateur dans /user/ < Nom d'utilisateur > /.Trash a son propre r�pertoire de recyclage). Les fichiers peuvent �tre rapidement r�cup�r�s tant qu'ils restent dans la corbeille.

D�placez les fichiers r�cemment supprim�s vers le r�pertoire de recyclage actuel (/user/ < Nom d'utilisateur > /.Trash/Current), et � intervalles configurables, HDFS cr�e une paire de /user/ < Nom d'utilisateur > /.Poubelle/ < Date > Un point de contr�le sous le r�pertoire et supprimer les anciens points de contr�le apr�s expiration.

Une fois qu'un fichier a expir� dans la corbeille, le NameNode supprimera le fichier de l'espace de noms HDFS. La suppression d'un fichier entra�ne la lib�ration des blocs associ�s � ce fichier. Il est � noter qu'il existe un d�lai important entre le moment o� le fichier est supprim� par l'utilisateur et le moment o� l'espace correspondant est lib�r�.

4.2.1.3.1.2 R�duire les r�pliques

Lorsque le facteur de r�plique d'un fichier diminue, le NameNode choisit les r�pliques redondantes qui peuvent �tre supprim�es. Le prochain heartbeat transmet ces informations au DataNode. Le DataNode supprime alors le bloc correspondant et lib�re l'espace correspondant. De plus, il existe un d�lai entre le moment o� le facteur de r�plication est d�fini et le moment o� le nouvel espace appara�t dans le cluster.

4.2.1.4 Erreurs de disque de m�tadonn�es

FsImage et Edits sont les structures de donn�es de base de HDFS. Si ces fichiers sont corrompus, l'int�gralit� de l'instance HDFS �chouera. Ainsi, le Namenode peut �tre configur� pour prendre en charge le maintien de plusieurs copies de FsImages et Edits. Toute modification apport�e � FsImage ou aux modifications sera synchronis�e avec leurs copies. Cette op�ration de synchronisation multi-r�plica peut r�duire le nombre de transactions d'espace de noms par seconde trait�es par le Namenode. Cependant, ce co�t est acceptable car m�me si les applications HDFS sont gourmandes en donn�es, la quantit� d'informations de m�tadonn�es pour celles-ci n'est pas tr�s importante. Lorsque le Namenode red�marre, il r�cup�re le FsImage complet le plus r�cent et les modifications � utiliser.

4.2.1.4.1 Nud de point de contr�le

Le NameNode utilise deux fichiers pour stocker les informations d'espace de noms : fsimage, qui est l'information d'espace de noms du dernier point de contr�le effectu� : edits, qui est le fichier journal des modifications d'espace de noms apr�s l'ex�cution du point de contr�le. Lorsque le NameNode d�marre, le fsimage et les modifications sont fusionn�es pour fournir des m�tadonn�es de syst�me de fichiers � jour, et le NameNode �crit le nouvel �tat HDFS dans le fsimage et d�marre un nouveau journal des modifications.

Le nud Checkpoint cr�e p�riodiquement des points de contr�le de l'espace de noms. Il t�l�charge le fsimage et les modifications � partir du NameNode, les fusionne localement et les renvoie au NameNode actif. Les nuds de point de contr�le ne se trouvent g�n�ralement pas sur la m�me machine que NameNode car ils ont les m�mes besoins en m�moire. Le nud Checkpoint est d�marr� par bin/hdfs namenode checkpoint dans le fichier de configuration.

L'emplacement du nud de point de contr�le (ou de sauvegarde) et de l'interface Web qui l'accompagne est sp�cifi� par les param�tres dfs.namenode.backup.address et dfs.namenode.backup.http-address.

L'ex�cution du processus Checkpoint est contr�l�e par deux param�tres de configuration�:

dfs.namenode.checkpoint.period, l'intervalle de temps maximal entre deux points de contr�le cons�cutifs, la valeur par d�faut est de 1 heure�;
dfs.namenode.checkpoint.txns, le nombre maximum de transactions qui n'effectuent pas de points de contr�le, le param�tre par d�faut est de 1 million, c'est-�-dire que lorsque le nombre de transactions dans Edits atteint 1 million, une fusion sera d�clench�e, m�me si le point de contr�le la p�riode n'est pas atteinte�;

Le dernier point de contr�le enregistr� sur le nud Checkpoint a la m�me structure de r�pertoires que sur le NameNode, de sorte que le NameNode peut toujours lire l'image du fichier du point de contr�le ex�cut� sur celui-ci si n�cessaire. Plusieurs nuds Checkpoint peuvent �tre sp�cifi�s dans le fichier de configuration du cluster.

4.2.1.4.2 Nud de sauvegarde

Le nud Backup fournit la m�me fonction de point de contr�le que le nud Checkpoint, sauf qu'il conserve �galement une copie du dernier espace de noms en m�moire, qui est synchronis� avec le NameNode. En plus de recevoir les modifications envoy�es par le NameNode et de les enregistrer sur le disque, Backup utilise �galement les modifications dans sa propre m�moire, cr�ant ainsi une sauvegarde de l'espace de noms.

�tant donn� que le nud de sauvegarde conserve l'�tat du dernier espace de noms en m�moire, il n'a pas besoin de t�l�charger le fsimage et de modifier les fichiers du NameNode pour cr�er un point de contr�le, ce qui est une �tape n�cessaire pour un nud Checkpoint ou un NameNode de secours. Le processus de point de contr�le du nud de sauvegarde est plus efficace car il n'a besoin que d'enregistrer les informations d'espace de noms dans un fichier fsimage local et de r�initialiser les modifications.

Puisqu'une copie de l'espace de noms est conserv�e dans la m�moire du nud de sauvegarde, ses besoins en m�moire sont les m�mes que ceux du NameNode. NameNode ne prend en charge qu'un seul nud de sauvegarde � la fois. Les nuds Checkpont ne peuvent pas �tre enregistr�s si la sauvegarde est en cours d'utilisation.

La configuration du nud de sauvegarde est la m�me que celle du nud Checkpoint, et il est d�marr� avec bin/hdfs namenode backup. L'emplacement du nud de sauvegarde (ou de v�rification) et son interface Web sont sp�cifi�s par les param�tres de configuration dfs.namenode.backup.address et dfs.namenode.backup.http-address.

Avec le nud de sauvegarde, le NameNode peut choisir de ne pas le stocker, laissant la responsabilit� de maintenir l'�tat de l'espace de noms au nud de sauvegarde. � cette fin, dans la configuration du NameNode, utilisez l'option -importCheckpoint pour d�marrer le NameNode, et ne d�finissez pas l'option d'emplacement de stockage dfs.namenode.edits.dir pour les modifications.

4.2.1.4.3 Importer des points de contr�le

Si tous les autres fichiers image et modifications sont perdus, le dernier point de contr�le peut �tre import� dans le NameNode. Pour ce faire, les �tapes suivantes sont n�cessaires�:

Cr�ez un r�pertoire vide et configurez-le comme r�pertoire dans l'�l�ment dfs.namenode.name.dir�;
D�finissez dfs.namenode.checkpoint.dir comme r�pertoire de point de contr�le�;
D�marrez le NameNode avec l'option -importCheckpoint.

Le NameNode t�l�chargera le point de contr�le � partir du r�pertoire d�fini par dfs.namenode.checkpoint.dir et l'enregistrera dans le r�pertoire sp�cifi� par dfs.namenode.name.dir. Si un fichier image existe dans dfs.namenode.name.dir, le NameNode ne d�marrera pas et le NameNode v�rifiera si le fichier image dans dfs.namenode.checkpoint.dir a des probl�mes, mais dans tous les cas, le fichier ne sera pas �tre modifi�.

4.2.1.4.4 Mode de r�cup�ration

En r�gle g�n�rale, vous configurez plusieurs emplacements de stockage de m�tadonn�es et, lorsqu'un emplacement de stockage tombe en panne, vous pouvez lire les m�tadonn�es � partir d'autres emplacements. Mais que se passe-t-il si le seul emplacement de stockage tombe en panne�? Dans ce cas, il existe un mode de d�marrage sp�cial de NameNode, appel� mode de r�cup�ration, qui vous permet de r�cup�rer la plupart des donn�es. Vous pouvez lancer le mode de r�cup�ration comme ceci�: namenode --recover. En mode de r�cup�ration, NameNode interagit avec vous sur la ligne de commande, vous montrant les actions possibles que vous pouvez entreprendre pour r�cup�rer vos donn�es. Si vous ne souhaitez pas utiliser le mode interactif, vous pouvez ajouter l'option -force, cette option forcera la premi�re s�lection � restaurer, g�n�ralement, c'est le choix le plus raisonnable. �tant donn� que le mode de r�cup�ration peut entra�ner une perte de donn�es, vous devez sauvegarder le fichier journal des modifications et fsimage avant de l'utiliser.

4.2.1.4.5 Affichage du fichier de modifications hors ligne

La vue de fichier des modifications hors ligne est un outil d'analyse des fichiers journaux des modifications. Les processeurs actuels sont principalement utilis�s pour la conversion entre diff�rents formats, y compris XML, qui est lisible et plus facile � �diter que les formats binaires natifs. L'outil peut analyser le format de fichier journal des modifications (en gros Hadoop 0.19) et versions ult�rieures. L'outil fonctionne uniquement sur les fichiers, il ne n�cessite pas de cluster Hadoop en cours d'ex�cution.

Formats d'entr�e pris en charge�:

binaire: Le format binaire natif utilis� en interne par Hadoop�;
xml�: Format XML, g�n�r� par le processeur xml, utilis� si le nom de fichier a une extension .xml (insensible � la casse).

La vue du fichier des modifications hors ligne fournit plusieurs processeurs de sortie (sauf indication contraire, la sortie des processeurs peut �tre reconvertie dans le fichier journal des modifications d'origine)�:

binaire: Le format binaire natif utilis� en interne par Hadoop�;
xml�: Format XML�;
Statistiques: Imprime les statistiques, ne peut pas �tre reconvertie en fichier journal des modifications.

4.2.1.4.6 Affichage du fichier image hors ligne

Offline Image File View est un outil pour vider le contenu des fichiers hdfs fsimage dans un format lisible et fournit une API WebHDFS en lecture seule pour permettre l'analyse et l'inspection hors ligne des espaces de noms des clusters Hadoop. L'outil est capable de traiter des fichiers image tr�s volumineux relativement rapidement. Cet outil g�re les formats de mise en page inclus dans les versions 2.4 et ult�rieures de Hadoop. Si vous souhaitez traiter des formats de mise en page plus anciens, vous pouvez utiliser la vue de fichier image hors ligne de la commande oiv_legacy. Si l'outil ne peut pas traiter le fichier fsimage, il se ferme compl�tement. De plus, les vues de fichiers image hors ligne ne n�cessitent pas de cluster Hadoop en cours d'ex�cution. Cela fonctionne compl�tement hors ligne.

La vue de fichier image hors ligne fournit plusieurs processeurs de sortie�:

Web est le processeur de sortie par d�faut. Il d�marre un serveur HTTP qui expose une API WebHDFS en lecture seule. Les utilisateurs peuvent afficher les espaces de noms de mani�re interactive � l'aide de l'API REST HTTP�;
XML cr�e un document XML de la fsimage et contient toutes les informations de la fsimage. La sortie de ce processeur peut �tre automatiquement trait�e et analys�e par des outils XML ;
FileDistribution est un outil d'analyse de la taille des fichiers dans l'espace de noms Image. Pour ex�cuter l'outil, la plage d'entiers doit �tre d�finie en sp�cifiant maxSize et un pas. La plage d'entiers est divis�e en segments de la taille de pas sp�cifi�e�: , et le processeur compte le nombre de fichiers du syst�me qui appartiennent � chaque segment (s , s ). Notez que les fichiers plus grands que maxSize tombent toujours dans le dernier segment. Par d�faut, les fichiers de sortie sont format�s sous la forme d'une liste de deux �l�ments s�par�s par des tabulations�: Size et NumFiles. O� Size repr�sente le d�but du segment, numFiles est le nombre de fichiers qui forment l'Image, et la taille tombe dans le segment. En sp�cifiant l'option -format, le fichier de sortie sera format� de mani�re lisible ;

D�limit�: g�n�re un fichier texte contenant tous les �l�ments communs aux inodes et aux inodes sous les inodes, s�par�s par des d�limiteurs. Le d�limiteur par d�faut est \t, mais il peut �tre modifi� par le param�tre -delimiter ;

ReverseXML�: � l'oppos� de la fonction de processeur XML, il reconstruit fsimage � partir d'un fichier XML. Ce processeur peut facilement cr�er des fsimages pour les tests.

4.2.1.5 Instantan�

Les instantan�s HDFS sont des copies ponctuelles en lecture seule d'un syst�me de fichiers. Les instantan�s permettent � HDFS de r�cup�rer un point correct connu dans le pass� en cas de corruption des donn�es. Des instantan�s peuvent �tre pris d'une sous-arborescence d'un syst�me de fichiers ou de l'ensemble du syst�me de fichiers. Certains cas d'utilisation courants des instantan�s sont la sauvegarde des donn�es, la protection contre les erreurs de l'utilisateur et la reprise apr�s sinistre.

La mise en uvre des instantan�s HDFS est efficace�:

La cr�ation d'instantan�s est instantan�e�: le co�t est de O(1)*,* hors temps de recherche d'inode�;

La m�moire suppl�mentaire est utilis�e uniquement lorsque des modifications sont apport�es par rapport � l'instantan�: l'utilisation de la m�moire est O(M), o� M est le nombre de fichiers/r�pertoires modifi�s�;

Ne copiez pas les blocs dans le datanode�: le fichier d'instantan� enregistre la liste des blocs et la taille du fichier. pas de r�plication de donn�es�;

Les instantan�s n'affectent pas n�gativement les op�rations HDFS r�guli�res�: les modifications sont enregistr�es dans l'ordre chronologique inverse afin que les donn�es actuelles soient directement accessibles. Les donn�es d'instantan� sont calcul�es en soustrayant les modifications des donn�es actuelles.

4.2.1.5.1 R�pertoire de la table d'instantan�s

Une fois qu'un r�pertoire est d�fini pour �tre instantan�, n'importe quel r�pertoire peut �tre instantan�. Le r�pertoire snaphottable peut contenir 65536 instantan�s synchronis�s. Il n'y a pas de limite au nombre de r�pertoires de snapshottable. Les administrateurs peuvent rendre n'importe quel r�pertoire instantan�table. S'il existe des instantan�s dans le r�pertoire d'instantan�s, le r�pertoire ne peut pas �tre supprim� ou renomm� tant que tous les instantan�s n'ont pas �t� supprim�s.

Les r�pertoires snaphottables imbriqu�s ne sont actuellement pas autoris�s. En d'autres termes, si l'anc�tre ou le descendant d'un r�pertoire est un r�pertoire snapttable, il ne peut pas �tre d�fini comme snapttable.

4.2.2 Fonctions auxiliaires

4.2.2.1 Interface du navigateur

Une installation HDFS typique configure un serveur Web pour exposer l'espace de noms HDFS via un port TCP configurable. Cela permet aux utilisateurs de naviguer dans l'espace de noms HDFS et d'afficher le contenu de leurs fichiers � l'aide d'un navigateur Web.

Le NameNode et le DataNode ex�cutent chacun un serveur Web interne pour afficher des informations de base sur l'�tat actuel du cluster. Si vous utilisez la configuration par d�faut, la page d'accueil de NameNode se trouve � l'adresse (hadoop3.X). Elle r�pertorie les DataNodes dans le cluster et les statistiques de base du cluster L'interface web peut �galement �tre utilis�e pour parcourir le syst�me de fichiers (utilisez le lien "Parcourir le syst�me de fichiers" sur la page d'accueil de NameNode).

4.2.2.2 Plugins

Il existe un moyen d'utiliser un plug-in pour acc�der � ses donn�es internes.Copiez le package hadoop-eclipse-plugin-version.jar dans le r�pertoire des plugins dans eclipse et configurez-le en cons�quence, vous pouvez directement utiliser eclipse pour acc�der aux donn�es HDFS. Il fonctionne de la m�me mani�re que les fichiers d'exploitation dans l'environnement Windows.

4.2.2.3 Programmation JAVA

HDFS fournit une API Java FileSystem, qui prend en charge l'acc�s aux donn�es HDFS en �crivant du code Java.

4.2.3 �volutivit�

Aujourd'hui, Hadoop s'ex�cute sur des milliers de clusters de nuds. Le cluster HDFS n'a qu'un seul nud NameNode. Actuellement, la quantit� de m�moire disponible sur le NameNode est une limite de mise � l'�chelle majeure. Dans les tr�s grands clusters, l'augmentation de la taille moyenne des fichiers de stockage HDFS peut augmenter la taille du cluster sans augmenter la m�moire du NameNode. La configuration par d�faut peut ne pas convenir aux tr�s grands clusters.

4.2.4 Autorisations et s�curit� des fichiers

Les autorisations de fichiers ici sont similaires � celles d'autres plates-formes courantes telles que Linux. L'autorisation R:read w:write x:execute x est ignor�e pour les fichiers et indique s'il faut autoriser l'acc�s � son contenu pour les dossiers. Si zhangsan utilise la commande hadoop pour cr�er un fichier dans le syst�me Linux, le propri�taire du fichier dans HDFS est zhangsan.

Actuellement, la s�curit� ne se limite pas � de simples autorisations de fichiers. HDFS prend �galement en charge les protocoles d'authentification r�seau (tels que Kerberos) pour authentifier l'identit� de l'utilisateur et chiffrer les donn�es � transmettre.

4.2.4.1 Directives d'autorisation HDFS

Le syst�me de fichiers distribu�s Hadoop (HDFS) impl�mente un mod�le d'autorisation pour le partage de fichiers et de r�pertoires de la plupart des mod�les POSIX. Chaque fichier et r�pertoire est associ� � un propri�taire et � un groupe. Un fichier ou un r�pertoire dispose d'autorisations distinctes pour l'utilisateur qui en est le propri�taire, pour les autres utilisateurs qui sont membres du groupe et pour tous les autres utilisateurs. Pour les fichiers, l'autorisation r est requise pour lire le fichier, et l'autorisation w est requise pour �crire ou ajouter au fichier. Pour les r�pertoires, l'autorisation r est requise pour r�pertorier le contenu du r�pertoire, l'autorisation w est requise pour cr�er ou supprimer des fichiers ou des r�pertoires, et l'autorisation x est requise pour acc�der aux sous-r�pertoires du r�pertoire.

Contrairement au mod�le POSIX, il n'y a pas de bit setuid ou setgid pour les fichiers, car il n'y a pas de concept d'ex�cutables. Pour les r�pertoires, il n'y a pas de r�pertoires setuid ou setgid bits par simplification. Emp�cher toute personne autre que le superutilisateur, le propri�taire du r�pertoire ou le propri�taire du fichier de supprimer ou de d�placer des fichiers dans un r�pertoire. En g�n�ral, les permissions d'un fichier ou d'un r�pertoire sont son mode. En r�gle g�n�rale, les conventions Unix pour repr�senter et afficher les modes seront utilis�es, y compris l'utilisation de nombres octaux. Lorsqu'un fichier ou un r�pertoire est cr��, son propri�taire est l'ID utilisateur du processus client et son groupe est le groupe du r�pertoire parent (r�gle BSD).

HDFS fournit �galement une prise en charge facultative des ACL POSIX (listes de contr�le d'acc�s) pour augmenter les autorisations de fichiers avec des r�gles pr�cises pour des utilisateurs nomm�s sp�cifiques ou des groupes nomm�s. Chaque processus client acc�dant � HDFS poss�de une identit� en deux parties compos�e d'un nom d'utilisateur et d'une liste de groupes. Chaque fois que HDFS doit effectuer une v�rification des autorisations sur un fichier ou un r�pertoire foo auquel acc�de un processus client�:

Si le nom d'utilisateur correspond au propri�taire de foo, testez les autorisations du propri�taire�;

Sinon, si le groupe de foo correspond � un membre de la liste des groupes, testez les autorisations du groupe�;

Sinon, les autres autorisations de foo seront test�es.

Si la v�rification des autorisations �choue, l'op�ration client �choue.

4.3 Haute disponibilit� HDFS (QJM)

Avant Hadoop 2.0.0, le NameNode �tait un point de d�faillance unique (SPOF) dans un cluster HDFS. Chaque cluster a un NameNode, et si cette machine ou ce processus est indisponible, le cluster dans son ensemble sera indisponible jusqu'� ce que le NameNode soit red�marr� ou d�marr� sur une machine distincte.

Cela affecte la disponibilit� globale du cluster HDFS de deux mani�res principales�:

En cas d'�v�nement impr�vu tel qu'une panne d'ordinateur, le cluster sera indisponible jusqu'� ce que l'op�rateur red�marre le NameNode�;

Un �v�nement de maintenance planifi� (tel qu'une mise � niveau logicielle ou mat�rielle sur une machine NameNode) entra�nera une fen�tre d'indisponibilit� du cluster.

La fonctionnalit� HDFS High Availability r�sout les probl�mes ci-dessus en offrant la possibilit� d'ex�cuter deux (et 3.0.0 ou plus) NameNodes redondants dans le m�me cluster dans une configuration ma�tre/esclave avec sauvegarde � chaud. Cela permet un basculement rapide vers un nouveau NameNode en cas de panne de la machine ou � des fins de maintenance planifi�e, initi� de mani�re proactive par un administrateur.

4.3.1 Principe

Apr�s hadoop2.x, Clouera a propos� QJM/Qurom Journal Manager, qui est une solution HDFS HA bas�e sur l'algorithme Paxos. Il fournit une meilleure solution et solution. Dans un cluster HA typique, deux ou plusieurs ordinateurs distincts sont configur�s en tant que NameNodes . � tout moment, un seul NameNode est actif, tandis que les autres sont en veille. Le NameNode actif est responsable de toutes les op�rations client dans le cluster, tandis que Standby ne maintient qu'un �tat suffisant pour fournir un basculement rapide si n�cessaire. Le sch�ma de principe est le suivant :

Pour maintenir la synchronisation du nud de secours avec le nud actif, les deux nuds communiquent avec un ensemble de d�mons ind�pendants appel�s ��nuds de journal�� (JN). Lorsqu'un nud actif effectue une modification d'espace de noms, il consigne de mani�re persistante l'enregistrement modifi� dans la plupart de ces JN. Les nuds de secours sont capables de lire les modifications de JN.

Le principe de base est d'utiliser 2N + 1 JN pour stocker les modifications, et chaque op�ration d'�criture de donn�es en contient la plupart ( > =N+1) Lorsque le retour est r�ussi, l'�criture est consid�r�e comme r�ussie. Bien s�r, ce que cet algorithme peut tol�rer, c'est qu'au plus N machines �chouent. Si plus de N machines �chouent, l'algorithme �chouera. Ce principe est bas� sur l'algorithme de Paxos.

Dans l'architecture HA, le r�le de SecondaryNameNode n'existe plus.Afin de maintenir la coh�rence des m�tadonn�es du NN de secours avec le NN actif principal, ils interagissent via une s�rie de processus l�gers gard�s, JournalNode.

Lorsqu'une op�ration de modification est effectu�e sur Active NN, le processus JN enregistre �galement le journal des modifications dans au moins la moiti� des JN. � ce moment, Standby NN surveille que le journal de synchronisation dans JN a chang� et lit le journal des modifications dans JN, puis Synchronisez avec votre propre arborescence de miroirs de r�pertoires, comme indiqu� ci-dessous�:

Lorsqu'un d�faut se produit, apr�s que le NN actif raccroche, le NN de secours lira tous les journaux de modification dans le JN avant de devenir le NN actif, afin de s'assurer qu'il est coh�rent avec l'arborescence miroir du r�pertoire du NN suspendu avec un niveau �lev�. Il prend ensuite ses responsabilit�s en toute transparence et maintient les demandes des clients pour atteindre une haute disponibilit�.

Afin de fournir un basculement rapide, il est �galement n�cessaire que le nud de secours dispose d'informations � jour sur l'emplacement des blocs dans le cluster. Pour ce faire, les DataNodes sont configur�s avec les emplacements de tous les NameNodes et envoient des informations sur l'emplacement des blocs et des battements de cur � tous les NameNodes.

4.3.2 Les principaux avantages de QJM

Il n'est pas n�cessaire de configurer un stockage suppl�mentaire � partage �lev�, ce qui r�duit la complexit� et les co�ts de maintenance�;

supprimer le spof�;

Le degr� de robustesse du syst�me est configurable ;

Les JN n'affecteront pas la latence globale en raison du retard de l'un d'entre eux, et n'affecteront pas les performances en raison de l'augmentation du nombre de JN (car NN envoie des journaux aux JN en parall�le).

4.3.3 Un seul NN peut commander DN

Lorsque chaque NN change d'�tat, il envoie son propre �tat et un num�ro de s�quence au DN ;

Le DN conserve ce num�ro de s�quence pendant le fonctionnement. En cas de basculement, le nouveau NN renverra son propre �tat actif et un num�ro de s�quence plus grand lorsqu'il renverra le battement de cur du DN. Lorsque le DN re�oit ce retour, il consid�re le NN comme le nouvel actif ;

Si le NN actif d'origine r�cup�re � ce moment et que les informations de pulsation renvoy�es au DN incluent l'�tat actif et le num�ro de s�quence d'origine, le DN rejettera la commande du NN.

4.3.4 Un seul NN r�pond au client

Les clients acc�dant directement � standby nn �chouent. Une couche est encapsul�e dans la couche RPC et le NN est connect� de mani�re � effectuer une nouvelle tentative via FailoverProxyProvider. En essayant de se connecter � un nouveau NN apr�s avoir �chou� plusieurs fois � se connecter � un NN, l'impact sur le client est d'augmenter un certain d�lai lors de la nouvelle tentative. Le client peut d�finir le nombre et l'heure des tentatives.

Hadoop fournit le r�le ZKFailoverController, qui est d�ploy� sur chaque nud NameNode en tant que processus d�mon, abr�g� en zkfc. L'exemple de diagramme est le suivant�:

4.3.5 Composition du FailoverController

Moniteur de sant�: Surveille si le NameNode est dans l'�tat indisponible ou non sain. Actuellement, la m�thode correspondante de NN est appel�e via RPC pour se terminer ;

�lecteuractifde r�serve�: G�rez et surveillez votre propre statut dans ZK�;

ZKFailoverController�: Il s'abonne aux �v�nements HealthMonitor et ActiveStandbyElector et g�re l'�tat du NameNode.

4.3.6 Responsabilit�s du ZKFailoverController

Surveillance de la sant�: envoyez p�riodiquement des commandes de d�tection de la sant� au NN qu'il surveille pour d�terminer si un NameNode est dans un �tat sain. Si la machine est en panne et que le battement de cur �choue, zkfc le marquera comme �tant dans un �tat malsain�;

Gestion de session�: si le NN est sain, zkfc maintiendra une session ouverte dans zookeeper. Si le NameNode est �galement dans l'�tat Actif, alors zkfc aura �galement un znode de type � court terme dans Zookeeper. Lorsque le NN raccroche, le znode sera supprim� et le NN de secours obtiendra le verrou, passera au NN principal et marquera l'�tat comme Actif�;

Lorsque le NN en panne est nouvellement d�marr�, il enregistrera � nouveau zookeper et constatera qu'il existe d�j� un verrou znode, et il passera automatiquement � l'�tat de veille.Ce cycle alternatif garantit une grande fiabilit�.Actuellement, il peut prendre en charge plus de deux NN;

�lection principale�: comme mentionn� ci-dessus, un m�canisme de verrouillage pr�emptif est mis en uvre en maintenant un znode de courte dur�e dans zookeeper pour d�terminer quel NameNode est dans l'�tat Actif.

Notez que dans un cluster HA, le Standby NameNode effectue �galement des points de contr�le de l'�tat de l'espace de noms, il n'est donc pas n�cessaire d'ex�cuter un Secondary NameNode, CheckpointNode ou BackupNode dans un cluster HA.

4.4 Haute disponibilit� HDFS (NFS)

La configuration et le d�marrage de HA en mode NFS sont fondamentalement les m�mes qu'en mode QJM, la seule diff�rence est la fa�on dont le namenode actif et le namenode de veille partagent le fichier d'�dition. La m�thode QJM utilise journalnode pour partager le fichier de modifications, tandis que la m�thode NFS utilise le r�pertoire partag� distant NFS pour partager le fichier de modifications.

NFS permet aux utilisateurs d'acc�der � des syst�mes de fichiers distants comme acc�der � des syst�mes de fichiers locaux. Apr�s l'introduction de NFS dans HDFS, les utilisateurs peuvent lire et �crire des fichiers sur HDFS tout comme lire et �crire des fichiers locaux, ce qui simplifie grandement l'utilisation de HDFS. Ceci est r�alis� en introduisant un service de passerelle NFS. Mis en uvre, le service peut convertir le protocole NFS en protocole d'acc�s HDFS, comme illustr� dans la figure suivante.

4.5 F�d�ration HDFS

4.5.1 Les deux couches principales de HDFS

Espaces de noms

se compose de r�pertoires, de fichiers et de blocs�;

Il prend en charge toutes les op�rations du syst�me de fichiers li�es � l'espace de noms, telles que la cr�ation, la suppression, la modification et la liste des fichiers et des r�pertoires.

service de stockage de blocs

Comprend deux parties :

Gestion des blocs (ex�cut�e dans Namenode)

Fournir l'appartenance au cluster Datanode en g�rant l'enregistrement et les battements de cur p�riodiques�;

Traiter et maintenir la position du bloc�;

Prend en charge les op�rations li�es aux blocs, telles que la cr�ation, la suppression, la modification et l'obtention de l'emplacement du bloc�;

G�rez le placement des r�pliques, bloquez la r�plication des blocs faiblement r�pliqu�s et supprimez les blocs surr�pliqu�s.

stockage

Fourni par Datanodes en stockant des blocs sur le syst�me de fichiers local et en autorisant l'acc�s en lecture/�criture.

L'architecture HDFS pr�c�dente n'autorisait qu'un seul espace de noms pour l'ensemble du cluster. Dans cette configuration, un seul Namenode g�re l'espace de noms. La f�d�ration HDFS r�sout cette limitation en ajoutant la prise en charge de plusieurs nuds de noms/espaces de noms � HDFS.

4.5.2 Principe

L'architecture Active NN unique fait que HDFS a des probl�mes potentiels d'�volutivit� et de performances du cluster. Lorsque le cluster est volumineux dans une certaine mesure, la m�moire utilis�e par le processus NN peut atteindre des centaines de G, et NN devient un goulot d'�tranglement des performances.

La formule d'estimation couramment utilis�e est que 1G correspond � 1 million de blocs. Si calcul� selon la taille de bloc par d�faut, il est d'environ 64T (cette proportion estim�e est relativement importante et riche. En fait, m�me si chaque fichier ne comporte qu'un seul bloc , toutes les informations de m�tadonn�es n'auront pas non plus 1 Ko/bloc).

Pour mettre � l'�chelle horizontalement le service de noms, la f�d�ration utilise plusieurs nuds de noms/espaces de noms ind�pendants. Les donn�es g�r�es entre les Namenodes sont partag�es, mais en m�me temps ind�pendantes, et n'ont pas besoin de se coordonner entre elles. Les Datanodes sont utilis�s par tous les Namenodes comme stockage commun pour les blocs. Chaque Datanode enregistre tous les Namenodes du cluster. Les nuds de donn�es envoient des battements de cur p�riodiques et bloquent les rapports. Ils g�rent �galement les commandes du Namenode.

Afin de r�soudre ce probl�me, Hadoop 2.x et Hadoop 3.x fournissent la f�d�ration HDFS. Le sch�ma de principe est le suivant�:

Plusieurs NN partagent des ressources de stockage dans un cluster, et chaque NN peut fournir des services externes ind�pendamment.

Chaque NN d�finit un pool de stockage avec un ID distinct, et chaque DN fournit un stockage pour tous les pools de stockage.

Le DN rapportera les informations de bloc � son NN correspondant en fonction de l'ID du pool de stockage, et en m�me temps, le DN rapportera les ressources disponibles de stockage local � tous les NN.

Si vous avez besoin d'acc�der facilement aux ressources sur plusieurs NN c�t� client, vous pouvez utiliser la table de montage client pour mapper diff�rents r�pertoires sur diff�rents NN, mais les r�pertoires correspondants doivent exister sur le NN.

4.5.3 Avantages de conception

Les modifications sont minimes et compatibles�; le NN existant ne n�cessite aucune modification de configuration�; si le client existant ne se connecte qu'� un certain NN, le code et la configuration n'ont pas besoin d'�tre modifi�s�;

Gestion s�par�e de l'espace de noms et de la gestion du stockage en mode bloc�;

Table de montage client�: correspond automatiquement � NN via le chemin, afin que les modifications de configuration de la f�d�ration soient transparentes pour l'application.

4.5.4 VueF

View File System (ViewFs) permet de g�rer plusieurs espaces de noms de syst�me de fichiers Hadoop (ou volumes d'espace de noms). Il est particuli�rement utile pour les clusters avec plusieurs espaces de noms dans la f�d�ration HDFS. ViewF est similaire � la table d'installation du client dans certains syst�mes Unix/Linux. ViewF peut �tre utilis� pour cr�er des vues d'espace de noms personnalis�es ainsi que des vues communes par cluster.

Le syst�me de fichiers View est pr�sent� dans le contexte d'un syst�me Hadoop avec plusieurs clusters, chacun pouvant �tre f�d�r� dans plusieurs espaces de noms pour fournir un espace de noms global par cluster afin que les applications puissent s'ex�cuter de la m�me mani�re que la pr�-f�d�ration.

4.5.4.1 Un seul cluster Namenode

Avant la f�d�ration HDFS, les clusters avaient un espace de noms unique, donnant � ce cluster un espace de noms de syst�me de fichiers unique. S'il y a plusieurs clusters. Ensuite, les espaces de noms du syst�me de fichiers de chaque cluster sont compl�tement ind�pendants et disjoints. De plus, le stockage physique n'est pas partag� entre les clusters (c'est-�-dire que les nuds de donn�es ne sont pas partag�s entre les clusters).

4.5.4.2 F�d�ration et ViewF

S'il y a plusieurs clusters. Chaque cluster poss�de un ou plusieurs espaces de noms. Chaque namenode a son propre espace de noms. Le namenode appartient � un et un seul cluster. Mais contrairement � un cluster de namenode unique�: les namenodes du m�me cluster partagent le stockage physique du cluster. Les espaces de noms dans le cluster sont ind�pendants comme avant.

Les op�rations d�terminent ce qui est stock� sur chaque namenode du cluster en fonction des exigences de stockage. Par exemple, ils peuvent stocker toutes les donn�es utilisateur (/user/ < Nom d'utilisateur > ) dans un espace de noms, toutes les donn�es de flux (/data) dans un autre espace de noms, tous les projets (/projects) dans un autre espace de noms, etc.

4.5.4.3 Espace de noms global par cluster utilisant ViewF

Pour assurer la transparence, le syst�me de fichiers ViewF (c'est-�-dire la table de montage client) est utilis� pour cr�er une vue ind�pendante par cluster de l'espace de noms du cluster, similaire aux espaces de noms dans un seul cluster Namenode. Tables de montage client (comme les tables de montage Unix) et montez de nouveaux volumes d'espace de noms en utilisant l'ancienne convention de d�nomination. La figure suivante montre la table de montage pour quatre volumes d'espace de noms /user, /data, /projects et /tmp�:

ViewF impl�mente l'interface du syst�me de fichiers Hadoop, tout comme HDFS et les syst�mes de fichiers locaux. C'est un syst�me de fichiers normal, il n'autorise que les liens vers d'autres syst�mes de fichiers. Toutes les commandes shell fonctionnent avec ViewFS, comme avec HDFS et les syst�mes de fichiers locaux.

5. Guide de commande

Toutes les commandes hadoop sont d�clench�es par le script bin/hdfs. L'ex�cution du script hdfs sans sp�cifier d'arguments imprime les descriptions de toutes les commandes.

Utilisation�: commande hdfs

Hadoop dispose d'un cadre d'analyse d'options pour analyser les options g�n�rales et ex�cuter des classes.

En raison de la limite de mots, cet article est divis� en deux parties, le haut et le bas, respectivement, dans le titre et le deuxi�me article. Pour la seconde moiti� du contenu, veuillez vous r�f�rer aux deux articles d'aujourd'hui.

Pour un contenu plus passionnant sur les produits secs, veuillez rechercher et suivre la plate-forme publique officielle de l'Institut de science des donn�es de Tsinghua-Qingdao "Data School THU"

Route de la soie

Apprenez � conna�tre la Chine

Exclusif | Comprendre Hadoop en un article (2) HDFS (1)