oreille gauche de la souris: parler �chec cognitif et la conception �lastique des syst�mes distribu�s

Cliquez sur l'attention InfoQ , Haut du public No.

8:00 technologie de r�ception petit-d�jeuner programmeur

Auteur | Chen Hao

Modifier | Yang Shuang

Cet article est tir� de Chen Hao (de gauche de la souris de l'oreille) frais annuels � partir de geeks de colonne temps App � oreille gauche �coute le vent �, est autoris�e. Pour lire � L'essence de l'architecture des syst�mes distribu�s �, � conception �lastique � s�rie, dessin reconnaissance de code � deux dimensions en s'il vous pla�t abonnez-vous � lire des colonnes (supports micro paiement canaux).

Je l'ai d�j� �crit � L'essence de l'architecture des syst�mes distribu�s � s�rie d'articles, de tous les niveaux de la couche d'affaires des syst�mes distribu�s, la couche middleware, couche de base de donn�es et ainsi introduit l'architecture haute concurrency, l'architecture vivent dans des endroits diff�rents, l'architecture des conteneurs, des services de micro-architecture , l'architecture haute disponibilit�, architecture flexible, mais aussi le soi-disant "Gang." Gr�ce � ce � lien cl� �, vous pouvez trouver ce que vous voulez, et ma�triser l'utilisation de l'id�e g�n�rale de chaque architecture des composants pour les syst�mes distribu�s.

Pour vous donner une meilleure compr�hension des syst�mes distribu�s dans les prochains mi-parcours, je veux parler de quelques-unes des plus critiques des mod�les de conception de syst�mes distribu�s, y compris plusieurs aspects de la tol�rance aux pannes, la performance et la gestion.

� tol�rance de pannes conception appel� conception �lastique O� les regards du syst�me distribu� � diff�rentes capacit�s � de tol�rance �, y compris la tol�rance aux pannes (isolement de service, demande d'appel asynchrone idempotence), l'�volutivit� (oui / non �tat du service), la coh�rence (compensation des op�rations, lourdes test), la capacit� � faire face � grand d�bit (fusible, r�trogradation). On peut voir dans le syst�me pour assurer l'exactitude de la pr�misse, la disponibilit� du syst�me est au centre de protection �lastique de conception.
articles de gestion Certains dire la gestion des mod�les de conception d'architecture de syst�me distribu�, comme zone de passerelle, le mode sidecar, et quelques-uns est d�sormais populaire, comme le Service Mesh mod�les de conception pertinents.
articles de design de performance mod�le architectural li� parlera de certains cache, CQRS, tables d'index, les files d'attente prioritaires, et d'autres la fragmentation des entreprises.

Ensuite, je crois que vous ma�triserez ces mod�les de conception, � la fois pour le d�ploiement d'un syst�me distribu�, le d�veloppement d'un module de service distribu�, ou d�velopper un nouveau middleware de syst�me distribu�, sera b�n�fique.

Aujourd'hui est le premier � � chapitre de la conception �lastique � � mod�les de conception du syst�me distribu� � des s�ries de sensibilisation et de d�faut de conception �lastique. "

Syst�me de mesure de la disponibilit�

Pour la conception de syst�mes distribu�s tol�rants aux pannes, �galement connu sous le R�silience (force �lastique) en anglais. Signifie que le syst�me est malsain, ne sonne pas vrai, m�me dans le cas de la capacit� d'erreur de prise est maintenue, supporter, ainsi que la capacit� � inverser la tendance dans ce genre d'adversit�.

Pour ce faire, une conception, nous avons besoin d'un objectif de conception, ou une ligne de r�f�rence � travers la ligne de base ou de la cible pour guider notre conception, ou sous la direction il n'y a pas de conception de base claire deviendra tr�s ambigu� et ne peut pas �tre nous ne pouvons pas pr�dire ou mesure. Testabilit� et l'�volutivit� de la conception du logiciel est une chose tr�s importante.

Nous savons que la tol�rance aux pannes principalement � la disponibilit�, alors, est de savoir comment on calcule la disponibilit� d'un syst�me do? Voici une formule utilis�e dans un secteur industriel:

Parmi eux,

MTTF est le temps moyen de d�faillance, le temps moyen avant d�faillance, qui est, combien de temps pour ex�cuter le syst�me des d�fauts se produisent en moyenne normaux qu'une seule fois. La plus grande fiabilit� du syst�me, plus la MTTF. (Note: Litt�ralement, le mot �chec semble avoir, mais le fait est le temps de fonctionnement.)
MTTR est temps de r�cup�ration moyenne, le temps moyen de r�paration que l'�chec de cette p�riode de temps � �merger r�parer la faute, cette fois aussi courte que possible.

Cette formule consiste � calculer la disponibilit� du syst�me, qui est, nous le disons souvent, num�ro 9, comme indiqu� dans le tableau ci-dessous.

Selon la formule ci-dessus, afin d'am�liorer la facilit� d'utilisation, nous augmentons soit le temps de d�faillance du syst�me, une d�faillance du syst�me ou de r�duire le temps de r�cup�ration.

Cependant, nous devons comprendre que nous courons un syst�me distribu� pour un syst�me distribu�, il ne doit pas la faute � tout simplement trop difficile.

Cause du dysfonctionnement

Pour �tre honn�te, il est difficile de calculer combien nous avons con�u une disponibilit� du syst�me, parce que les facteurs qui influent sur un syst�me est trop, en plus de la conception de logiciels, ainsi que le mat�riel, ainsi que des services tiers (tels que Telecom China Unicom � large bande SLA), bien s�r, y compris la � �quipe de construction des pelles. �

Ainsi, tel que d�fini dans le SLA, ce n'est pas seulement un indicateur technique, mais un contrat de service ou d'un contrat entre le fournisseur et l'utilisateur. Cette pi�ce de qualit� industrielle, comme l'avion, l'avion est faite tr�s bien, il y a beaucoup d'�quipements tr�s sp�cialis�s, des outils, des processus, la gestion et l'exploitation.

En bref, SLA plusieurs 9 est en mesure de continuer � fournir le niveau de service disponible. Cependant, l'industrie, le service ne sera pas disponible en deux facteurs: l'un est pr�vu, on est non planifi�.

Raisons d'arr�ts non planifi�s. Le chiffre provient de haute disponibilit� des concepts et les meilleures pratiques d'Oracle.

La raison des temps d'arr�t pr�vu. Le chiffre provient de haute disponibilit� des concepts et les meilleures pratiques d'Oracle.

On peut voir en bas les principales raisons suivantes.

impr�vu

d�faut au niveau du syst�me, y compris l'h�te, le syst�me d'exploitation, middleware, bases de donn�es, les r�seaux d'alimentation, et des dispositifs p�riph�riques.
Les donn�es et les �checs interm�diaires, y compris une mauvaise utilisation du personnel, d�faillance du disque dur, le chaos de donn�es.
Il y a des catastrophes naturelles, la destruction de l'homme, ainsi que des probl�mes d'approvisionnement.

pr�vue

Les t�ches quotidiennes: sauvegarde, planification des capacit�s, l'utilisateur et la gestion de la s�curit�, back-end des applications de traitement par lots.
Exploitation et entretien li�s �: la maintenance de base de donn�es, la maintenance des applications, middleware d'entretien, la maintenance du syst�me d'exploitation, la maintenance du r�seau.
Mise � jour: bases de donn�es connexes, applications, middleware, les syst�mes d'exploitation, r�seaux, y compris les mises � niveau mat�rielles.

Nous leur donnons � leurs propres classes.

probl�mes de r�seau . probl�mes de liaison r�seau, la congestion de la bande passante r�seau ......

Probl�mes de performances . Base de donn�es SQL lente, Java compl�te GC, disque dur IO est trop grande, haute CPU mont� en fl�che, de m�moire ......

probl�me de s�curit� . Les attaques de r�seau, telles que DDoS et ainsi de suite.

Fonctionnement et probl�mes d'entretien . Le syst�me est toujours sont ajust�s constamment mis � jour et l'architecture modifi�e, pour surveiller le probl�me ......

gestion . Non Taquiner les d�pendances des services essentiels et des services, des syst�mes de contr�le et des informations op�rationnelles ne sont pas synchronis�es ......

Probl�mes mat�riels . disque dur est endommag�, les probl�mes de carte r�seau, probl�mes de commutation, vers le bas de la pi�ce, probl�me pelle ......

L'�chec est in�vitable

Si vous avez lu mon �crit � L'essence de l'architecture de syst�mes distribu�s � et � D�pannage � deux s�ries d'articles, vous saurez g�rer un syst�me distribu� est une chose tr�s difficile. Pour grande �chelle des syst�mes distribu�s, l'�chec est essentiellement normale, et m�me certains ne savent tout simplement pas o� vous aller mal.

En termes d'aujourd'hui, un syst�me de d�faut distribu� a �t� tr�s compliqu�, parce que l'�chec est distribu�, le style domino. Comme je l'ai pr�sent� dans � L'essence de l'architecture des syst�mes distribu�s � dans ce chiffre.

Si vous �tes sur une plate-forme cloud, ou en utilisant un � micro-service �, le visage d'un grand nombre de dispositifs IdO ainsi que le trafic utilisateur n'est pas contr�l�, alors la d�faillance du syst�me sera plus complexe et la m�tamorphose. En raison des facteurs ci-dessus ajouter � la complexit� du syst�me.

Nous sommes pleinement conscients des deux choses suivantes.

L'�chec est normal, mais aussi commune .
Les �checs sont impr�visibles sursauts, mais tr�s difficile .

Ainsi, Amazon AWS se concentrera sur la conception pour non-respect de ses sept Principe de conception. Cela nous dit, ne pas essayer d'�viter l'�chec, mais de traiter avec le code de d�faillance en fonction normale de faire l'architecture d'�criture dans le code.

Parce que nous voulons faire la chose est d'essayer tous les moyens pour r�duire le temps de r�paration insuffisance MTTR--.

Voil� pourquoi nous avons mis cette conception est appel�e le tron�on (R�silience).

D'une part, dans de bonnes circonstances, cette chose pour nos utilisateurs et le fonctionnement interne et la maintenance est compl�tement transparent, le syst�me r�par� automatiquement sans intervention humaine.
D'autre part, si pas r�par�, le syst�me peut faire pour se prot�ger, et ne pas laisser la situation empirer.

Ceci est appel� � �lasticit� � - ou r�trograd� promu. Il me fait penser � trois tu�s dans les comp�tences Zhao - � peut �tre r�engag� est les vrais instruments utilis�s �, ha, ha.

r�sum�

Eh bien, le contenu d'aujourd'hui ici. Je crois que, gr�ce � l'�tude d'aujourd'hui, vous devriez d�j� comprendre le but r�el de la conception �lastique, et la disponibilit� du syst�me et de d�faut des indicateurs pour mesurer diverses raisons une certaine compr�hension. Le prochain article, nous allons commencer � �num�rer quelques-uns des mod�les de conception pertinents.

Enfin, je voudrais entendre dans la conception d'un syst�me distribu�, d�finissez comment les objectifs de haute disponibilit�? En cas de difficult�s dans la mise en uvre? Quel genre de fosse � gradins? Comment traitez-vous?

Ceci est le r�pertoire � syst�mes distribu�s design patterns � s�rie d'articles, je l'esp�re, vous pouvez trouver ce qui vous int�resse dans cette liste. Abonnez-vous � Geeks de temps � oreille gauche �coute au vent � colonne pour lire l'article, abonnez-vous � une lecture permanente.

articles de conception extensible de � d�faut de conception compr�hension et �lastique �
Extensibles articles de conception de � conception d'isolement �
Extensibles articles de conception de � conception de communication asynchrone �
Extensibles articles de conception de � Design idempotence �
� Statut du service � des articles de conception �lastique
Extensibles articles de conception de � transactions � compensation
Extensibles articles de conception de � Retry � Conception
Extensibles articles de conception de � conception fusible �
Extensibles articles de conception de � limiter la conception �
articles de conception extensible de "downgrade Design"
articles de conception extensible de � R�sum� de conception �lastique �

Comment puis-je inscrire?

Premi�re m�thode:

appuyez sur la figure code bidimensionnel, identification de paiement micro-canal, abonnement imm�diatement.

Prix de l'abonnement annuel de 199 yuans, le nouvel enregistrement utilisateur R�ussissez 30 yuans une enveloppe rouge, peut �tre pay� imm�diatement.

M�thode Deux:

Cliquez sur Lire l'original T�l�charger le � Geek Time � App, inscrivez-vous et connectez-vous, les nouveaux arrivants re�oivent 30 yuans une enveloppe rouge.

Entrez le � syst�me de recommandation 36 de style � de la colonne Carousel Accueil Figure ou page pour terminer l'abonnement.

Route de la soie

Apprenez � conna�tre la Chine

oreille gauche de la souris: parler �chec cognitif et la conception �lastique des syst�mes distribu�s