Auteur | Bangqing

Source | Alibaba Middleware (ID: Aliware_2018)

Figure | IC oriental

Profil personnel:

Avez-vous rejoint les affam�s en d�cembre 2014? > Walle), principalement pour le service client et BD.

En mai 2015, il a commenc� � contacter la recherche et le d�veloppement du syst�me de commandes et, en juillet, responsable de l'�quipe de d�veloppement des commandes; au stade d'une application unique � la service.

L'�quipe de test mise en place d�but 2016, apr�s la division de la commande en positive et invers�e, est principalement responsable du positif et de la livraison.

En 2017, certaines plateformes ont �t� expliqu�es.

D�but 2018, l'int�gralit� de la commande �tait responsable de la hausse et de la livraison de l'ensemble de la commande. L'ordre de la commande et le panier au milieu de l'ann�e ont �t� fusionn�s ensemble.

En octobre 2019, il a �t� transf�r� de la transaction et l'efficacit� et la structure organisationnelles ont �t� r�alis�es en peu de temps.

Pourquoi ai-je �crit cet article et la raison:

Tout d'abord, je l'ai fait dans la zone de n�gociation pendant 4 ans. Il y a beaucoup d'histoires que je ne sais que si je sais, et je veux garder ces dossiers et les conserver.

La seconde est que lorsque de nombreux �tudiants � l'arri�re regardent le syst�me de trading, le contact est distribu�, SOA, des millions de millions de donn�es par jour, sachant que c'est comme �a, et il est difficile de comprendre la pens�e et les raisons derri�re elle . Avec votre exp�rience ces derni�res ann�es, vous pouvez rendre chacun plus facile � comprendre les raisons et le parcours de ce processus d'�volution.

Troisi�mement, il y a de nombreux r�sum�s ou m�thodologies. Il s'agit davantage de supprimer les �scories� devant tout le monde. Ici, vous pouvez ajouter un peu de �soupe de poulet toxique�. La r�alit� n'est peut-�tre pas si belle. Nous avons beaucoup de choix. �coutez, peut-�tre que c'est chanceux, c'est peut-�tre une erreur.

Cet article esp�re pr�senter tout le voyage � travers certaines histoires de d�veloppement et la r�flexion. Vous pouvez voir beaucoup de traces de croissance brutales, et aura une r�flexion et un r�sum�, mais ce ne sera pas comme un r�sum� de nourriture rapide de nombreuses v�rit�s.

Ensuite, nous partons de la p�riode Taikoo en 2012.

Tai ancien

Avant de parler des ordres, nous r�indions l'arch�ologie arch�ologique. � l'�re Taikoo, il y avait un syst�me appel� System Zeus appel� Zeus. Ce sont tous dans une biblioth�que de code et d�ploy�s dans la m�me machine. Il y a deux curs en dehors de Zeus, c'est-�-dire, c'est-�-dire, c'est-�-dire, c'est-�-dire, c'est-�-dire, La �station principale� souvent mentionn�e par de nombreuses personnes �g�es, et NAPOSPC pour les marchands. Ces syst�mes communiquent via le protocole Thrif. � l'exception de ce lien, toutes les fonctions internes d�sordonn�es sont toutes dans un syst�me appel� Walle. Ce syst�me Walle est �crit en PHP.

Ensuite, le Zeus � l'�poque ressemblait � ceci:

Selon l'inact, de l'histoire de la soumission de GIT, le premier engagement de la partie de l'ordre a �t� soumis par Yu Lixin le 1er septembre 2012, et le contenu a �t� "Ajouter un service EOS pour Zeus. Cet EOS fait r�f�rence au syst�me de commande c'est-�-dire l'abr�viation de l'Elemeorderservice. Ce terme est utilis� aujourd'hui, devenant une partie positive de la transaction, et m�me une p�riode de temps pour le groupe de commandes.

Zeus a ensuite restructur�, appel� Zeus2, mais le temps sp�cifique n'est plus disponible.

bourgeon

En octobre 2014, je suis all� � l'interview quand j'avais faim. L'intervieweur �tait le Fr�re Lei Lei. Le 1er d�cembre, ai-je eu faim? HR m'a conduit avec un look mignon. Quand je suis all� chez Brother Lei, Lei m'a amen� � JN et m'a dit: "C'est le stagiaire." Ran. Plus tard, j'ai appris qu'apr�s l'interview, Lei Brother et JN ont dit qu'ils venaient de faire face � un stagiaire, qui pouvait l'utiliser. Il s'est produit que le groupe marchand avait un plan pour transformer Java. Un repas m'a vendu.

Retour au sujet, de d�cembre 2014 � avril 2014, j'ai coop�r� avec l'ancien syst�me BD pour migrer vers Walis, et apr�s mon transfert de mentor � l'�quipe CI, moi-m�me, moi-m�me, moi-m�me, moi-m�me, moi-m�me termin�e Walis de Single -Application Migration vers les applications distribu�es.

�tablissement d'un groupe de commandes

Pour moi, c'est compl�tement de la chance et du destin.

Presque en mai 2015, mon superviseur, JN Class Camate, m'a soudainement trouv�, avait l'air tr�s excit� et m'a dit que l'entreprise avait l'intention de cr�er un groupe de commandes. Ce groupe de commandes est responsable de lui. Sauf pour lui, il, il, il , il ne m'a choisi que (probablement � cause d'une partie de l'exp�rience que j'ai mentionn�e dans le paragraphe pr�c�dent, dans la personne facultative, et je me suis quand m�me r�unie ~), disant comment je le laisse le regarder, cet homme scintille, un a �tabli un par un, un a �tabli un par l'un des.

En tant que technicien, son cur est tr�s bouillant. Tout d'abord, j'ai entendu parler de la concurrence �lev�e, � un trafic �lev�, distribu� de grands noms avant d'en avoir entendu parler. Je n'ai jamais pens� que je pourrais entrer en contact avec un tel syst�me si t�t. Il n'y a presque pas de demandes pendant la journ�e. BD Visiter les marchands retourn�. Il s'est av�r� �tre une p�riode de pointe la nuit. M�me la nuit, l'interface cl� unique occasionnellement quelques-unes et une douzaine de demandes. La suspension peut ne pas �tre appel�e un syst�me. � ce moment-l�, nous avons quitt� le travail avant 7 O'Clock le soir. Lorsque nous avons �t� lib�r�s pour la premi�re fois, je m'avais dit tr�s solennellement que nous pourrions avoir � faire des heures suppl�mentaires jusqu'� 20h30.

La raison pour laquelle il a choisi JN en tant que personne responsable du groupe de commandes, car bien qu'il soit ing�nieur avant, il a fait le syst�me de fond "Edge", mais c'�tait une personne qui connaissait tous les syst�mes et les entreprises de l'entreprise enti�re, et elle �tait tr�s adapt�e au syst�me d'ordre de d�veloppement.

Eh bien, oui, la veille de la cr�ation de ce groupe, nous n'en avons eu que deux. � ce moment-l�, je n'avais pas obtenu mon dipl�me. Sauf pour l'excitation, j'�tais plus g�n�.

Le 12 mai 2015, le groupe de commandes a �t� officiellement �tabli. Quand j'en ai parl�. Il est arriv� qu'il y ait un petit fr�re qui a rejoint le travail ce jour-l�. Ce n'�tait pas mal. Il s'est av�r� �tre un ing�nieur Java. En cons�quence, le jour de sa cr�ation, le nombre d'entre nous a doubl� et s'est transform� en 4 personnes.

Nous nous donnons la premi�re t�che: le code de lecture, les affaires rationnelles, le dessin. J'ai postul� pendant un mois pour tamponner avec CTO, et cette fois ne prend aucun besoin commercial.

La personne responsable de l'ancien programme principal de l'ordonnance, le chef du cadre Python et la personne en charge de l'op�ration de demande et de la maintenance du fonctionnement de l'application de l'ordre ont �t� invit�s � nous expliquer. En fait, le partage de tout le monde est plus d'une heure. Ce mois provenait vraiment de dizaines de milliers de lignes de code Python. Il n'y avait pas de documents de produit. C'�tait des commentaires extr�mement rares. J'ai finalement r�sum� le cycle de vie, les op�rations cl�s et la logique commerciale cl� de l'ensemble de l'ordre sur une image large. Cette image, nous l'avons utilis�e pendant plus d'un an.

En fait, avait faim au milieu de l'ann�e?

On peut dire que c'est une p�riode de d�veloppement chaotique et rapide. Nous avons dit que le temps devait changer le pneu en conduisant une voiture de sport.

D�couplage de zeus

La premi�re super t�che qui est vraiment �troitement li�e � l'ordre concerne le d�couplage de Zeus � partir de juin. Le professeur HC est la personne en charge du cadre Python et l'un des experts techniques les plus admir�s et les plus admir�s. Sur QCON, comme le L'architecte en chef, il a pr�sent� l'architecture technique globale de Hungry � l'�poque. Il a �t� mentionn� dans la p�riode Taikoo que Zeus est une application monom�re g�ante. Afin de se d�velopper rapidement � l'avenir, de r�duire le couplage et un impact implicite, la soci�t� a lanc� le projet de d�couplage Zeus. En bref, le mot est divis�.

Apr�s plus d'un mois de r�union intensive, le plan divis� a �t� achev�. Il ne semble pas si difficile � dire, mais cette guerre de salive n'a pas �t� autoris�e � �tre attaqu�e � l'�poque. Qui appartenait aux diff�rents services apr�s la scission? Il n'y a pas de propret� entre les modules et le module, comment d�finir les limites des services A et B, etc. � ce moment-l�, je n'ai pas �t� suffisant pour participer � la discussion.

La conclusion est que Zeus sera divis� en plusieurs services principaux ci-dessous:

Zeus.eos = > Service de commande
Zeus.eus = > Service utilisateur
zeus.ers = > Service marchand
Zeus.eps = > Services de marketing (nouveaux produits)
Zeus.sms = > Service SMS
Em

La premi�re phase

Chaque service apr�s avoir �t� divis� est suivi d'une nouvelle vague de reconstruction et de fractionnement. Par exemple, Biz.Booking est s�par� de Zeus.eos et a enlev� les capacit�s de commander et de caddages de l'achat; Biz.UGC a enlev� les capacit�s li�es � l'�valuation de la commande.

Plusieurs �tapes de l'exp�rience principale divis�e:

1. (juillet) Partagez l'entrep�t de code et ex�cutez-le ind�pendamment selon le module. Autrement dit, apr�s que tout le code de Zeus est emball� sur le serveur, la division est divis�e en fonction de la division, et seul le module sp�cifique est d�marr� s�par�ment sur la machine sp�cifique pour ouvrir le port sp�cifique.

2. (ao�t) �tape proxy. Autrement dit, dans le service d'origine, un agent � ajouter � l'interface � d�placer peut �tre agent � l'interface du nouveau service, et la capacit� de commutation du centre d'enregistrement de service pour contr�ler le flux de commutation.

3. (ao�t au d�but de septembre) La segmentation compl�te du script et du module.

4. (septembre) Ind�pendance de l'entrep�t du code. Le filtre � arme nucl�aire du GIT est utilis� pour s�parer le code et l'historique dans le module et compl�tement s�par� de la biblioth�que de code d'origine. � l'heure actuelle, le d�ploiement est toujours un tissu mixte. Dans l'outil de version, apr�s la publication d'une application ind�pendante, il a en fait remplac� un r�pertoire sous le grand projet de Zeus.

5. (septembre) Ind�pendance de la configuration. La configuration d'origine a �t� bross�e sur le serveur par Saltstack et a �t� partag�e par plusieurs applications sur le serveur. Nous l'avons chang� directement aux capacit�s de configuration de l'utilisation du centre d'enregistrement de service pour obtenir une seule configuration d'application. � ce stade, il est �galement pass� � la charge souple.

6. (mars de l'ann�e suivante) Ind�pendance du d�ploiement de la physique. Bien s�r, c'est le contenu du d�couplage.

Bien s�r, cette scission a �galement apport� un autre produit. Le framework SOA de Python Zeus_Core, Zeus_Core a �t� s�par� par les services commerciaux vers avril.

Toute la p�riode de d�couplage a dur� environ un demi-an. Pendant la p�riode, aucun accident n'a �t� caus� par la division et il n'y avait presque pas de fum�e. Pensez � rien � ce moment-l� � ce moment-l�, les outils sont en arri�re, il n'y a pas de test � temps complet et l'alphab�tisation technique d'un groupe d'ing�nieurs pr�coces et de camarades de classe d'op�rations et de maintenance.

Sous-m�tre

C'est encore en 2015. Il est vers septembre et octobre que la table de succursale est d�termin�e comme �tant mise en uvre, et le sch�ma de la table de succursale est presque finalis� lorsque j'interviens et est dirig� par l'�quipe DAL du d�partement CI.

Pourquoi faites-vous une table divis�e?

Tout d'abord, je ne peux pas porter de concurrence Essence � ce moment-l�, MySQL de notre biblioth�que de commandes �tait une architecture de 1 ma�tre et 5, et un MHA a �t� fabriqu�. La DB n'est pas en mesure de r�sister � la pression du simultan�ment � l'�poque, et sa r�sistance aux risques est tr�s faible. Si l'entreprise n'informe pas certaines activit�s � l'avance, une fois que nous en accrochons une � la biblioth�que, nous ne pouvons que les couper d'avant en arri�re. Dans les cas graves, nous ne pouvons limiter que beaucoup de courant. De plus, pendant ce temps, en tant que technologie, nous avons �galement pri� pour que Meituan � retenir ne soit pas suspendu dans la p�riode de pointe. Une fois que le meituan � emporter sera suspendu, le trafic se d�roulera vers les affam�s et nous commencerons � �tre nerveux. De m�me, pendant cette p�riode, nous avions toute une station, et Meituan Takeaway n'�tait pas tr�s en mesure de le porter. Tout le monde connaissait une �tape de d�veloppement similaire.

La seconde est que le co�t du DDL est trop �lev� et que l'entreprise est au sommet des combats. Le seul volume des affam�s � l'�poque �tait au d�but d'un million de yuans. Il y a des besoins commerciaux, j'esp�re ajouter de nouveaux champs � la commande. Cependant, lorsque nous trouvons l'�valuation DBA, la r�ponse donn�e est que l'estimation optimiste doit �tre arr�t�e pendant 3 heures, l'estimation pessimiste prend 5 heures et l'approbation du PDG est obligatoire. De toute �vidence, ce risque est difficile � accepter et l'�quipe commerciale ne peut pas l'accepter. Ensuite, la solution sp�culative consiste � continuer � brancher le champ d'expansion JSON r�serv�. Cette m�thode a soulag� une longue p�riode de pression dans une certaine mesure, mais elle a �galement enterr� de nombreux dangers cach�s.

Bien s�r, il existe des sc�narios commerciaux sp�ciaux et des interfaces avec une grande taille de particules qui sont ouvertes, ce qui produira des SQL de performance m�diocres, ce qui fera exploser toute la station.

La structure physique apr�s Shardin est la suivante:

La logique de l'op�ration de mise � jour est la suivante:

En fait, nous avons fait un fragment � deux dimensions. Les deux dimensions sont 120 pi�ces, mais peuvent �tre �crites de trois mani�res (ID utilisateur, ID marchand, ID de commande) pour assurer le succ�s de la dimension de l'utilisateur. En raison des ressources, les utilisateurs et les commer�ants sont �chelonn�s et m�lang�s.

(En fait, il y a quelques fosses dans la partie �paisse. Cette personnalisation sp�ciale est �galement la seule. Si vous �tes int�ress�, vous pouvez l'�tendre � l'avenir)

Les d�tails techniques des tables de base de donn�es plus sp�cifiques ne sont pas �largis ici, et il a connu plusieurs �tapes:

1. Formuler les nouvelles r�gles de g�n�ration de num�ros de commande et terminer l'acc�s � la transformation.

2. Double donn�es, lisez l'ancien, comparez les donn�es.

3. R�forme le SQL incoh�rent, tel que le tri et les statistiques de la puce crois�e, sans le SQL de Shardingkey, etc.

4. Double donn�es, lisez nouveau. (Synchronisation avec 3)

5. Compl�tez le commutateur de la base de donn�es et les donn�es sont �crites et nouvelles.

Pendant ce temps, en tant qu'�quipe commerciale, la plupart du temps pass� dans la troisi�me partie, et a travaill� plusieurs fois jusqu'� 3 ou 4 heures du matin.

� la veille du festival du printemps en 2016, afin de d�penser des pics commerciaux et une stabilit� du syst�me, nous avons m�me mis en place des donn�es en dB uniquement pour les commandes au cours des 15 derniers jours.

Je me souviens du jour o� j'ai finalement chang�. Vers mi-mars 2016, plusieurs camarades de classe et moi sommes all�s � l'entreprise � plus de 5 heures du matin, et le ciel �tait brillant. Toute la faim commence � arr�ter le service, puis bloquez la demande d'�criture, compl�tez la configuration de la direction de DB, v�rifiez sans erreur, restaurez la demande d'�criture, v�rifiez que l'entreprise est correcte, l�chez lentement le trafic avant et re -Ourer le service. Le cur de l'ensemble du processus est d'environ 10 minutes, et l'ensemble du service d'arr�t dure une demi-heure.

Le deuxi�me jour, nous avons pu importer des commandes historiques au cours des 3 derniers mois.

Apr�s ce changement, nous nous sommes essentiellement d�barrass�s du goulot d'�tranglement et du point de douleur de DB (bien s�r, l'histoire derri�re nous dit que parfois c'est encore un peu na�f ~~~)

Difficult� de message

� cette �poque, vers juillet, il a �t� affect� par certains articles architecturaux. C'est aussi parce que JN a mentionn� cela. Nous avons d�cid� de diffuser l'ordre de l'ordre, l'objectif principal �tait de se d�composer davantage.

Apr�s avoir enqu�t� sur Rabbitmq, NSQ, RocketMQ, Kafka, ActiveMQ, la conclusion finale que j'ai parvenue �tait Rabbitmq. En fait, je pense que RocketMQ est plus appropri�, en particulier les caract�ristiques des messages s�quentiel Support. Cependant, la principale exp�rience de fonctionnement et de maintenance de l'�quipe de fonctionnement et de maintenance se trouve � RabbitMQ. Les �tudiants de l'�quipe du cadre et de l'�quipe d'exploitation et de maintenance sont tr�s confiants. Depuis l'�tablissement, il n'y a eu aucun probl�me. L'un est stable. Si vous choisissez RabbitMQ, vous pouvez obtenir le soutien naturel de l'�quipe d'op�ration et de maintenance. C'est pour notre L'�quipe commerciale � ce moment-l�., �vitez de nombreux risques.

Par cons�quent, l'�quipe du cadre entreprend un test de performance rigoureux sur RabbitMQ pour donner quelques indicateurs de performance. Ce test a finalement mis en place un cluster compos� de 3Broker, qui sert l'ordre seul. Avant cela, il n'y avait qu'un seul nud MQ pour servir la t�che de message asynchrone du syst�me Zeus.

Afin de s'assurer que le processus grand public de la transaction n'a pas d'impact, une s�rie de transformations tol�rantes � d�faut est effectu�e sur le cadre du SOA c�t� client. Il s'agit principalement de la tol�rance aux d�fauts en temps opportun, comme l'envoi de temps et de d�connexion lors de la connexion le cluster MQ. En fin de compte, le cluster MQ compos� de 3 nuds a �t� construit, et la nouvelle de l'ordre a finalement �t� envoy�e � ce cluster.

Pendant cette p�riode, j'ai en fait mont� sur une petite stand. Bien que l'�quipe de cadre ait effectu� une tol�rance anormale � la d�faut. Mais apr�s tout, le moment de la diffusion des nouvelles est �troitement li� � l'�tat du processus grand public. Avant le lancement du code, j'ai toujours �t� prudent � l'�poque, ajoutant un passage au message envoy� pour la premi�re fois. C'�tait une nuit, vers 8 heures. Maintenant, quand j'y pense, il y a de courts niveaux de gris et de temps d'observation. Quand j'ai �t� lib�r�, il a �t� rapidement vu dans la surveillance que l'interface a commenc� � �tre gravement disparu (nous Utilis� la trame par d�faut par d�faut par d�faut � l'�poque. Les param�tres de d�lai d'expiration, 30s, en fait, cette configuration est tr�s grave), ce qui g�n�re un grand nombre d'interfaces s�v�res, et il est �vident qu'il existe un ralentissement de l'interface. La courbe de n�gociation est tomb�e et j'ai �t� imm�diatement fabriqu� par NOC. Il a rapidement ferm� l'interrupteur envoy� par le message, et la r�cup�ration a �galement �t� un instant. Ensuite, la chair humaine a couru vers l'avant de l'�quipe d'architecture pour aider l'enqu�te (apr�s tout , c'�tait encore � l'�poque. Trop de l�gumes).

Cette nuit-l�, nous avons ouvert, ferm�, ouvert, d�sactiv�, ouvert, d�sactiv� ... Trafic � partir de 5%, 10%, 30%, etc. Apr�s diff�rentes tentatives et v�rifications, la conclusion finale �tait li�e � la configuration d'haproxy � l'�poque. �tant donn� que Haproxy a cl�tur� la connexion avec le cluster RabbitMQ � l'avance, le client du service a toujours demand� la connexion n�crotique, ce qui a provoqu� ce probl�me, et le client n'a pas tol�r� le d�lai d'attente. Apr�s avoir ajust� le d�lai de liaison de l'haproxy, les sympt�mes ont �t� �limin�s. Bien qu'il reste des dangers cach�s du journal.

Pour le moment, c'est comme �a. La partie commerciale de chaque acc�s doit demander un sujet. La quantit� de file d'attente suspendue sous le sujet peut la d�terminer en fonction des besoins de l'entreprise.

Il y a de nombreux probl�mes dans le fonctionnement stable de cette architecture physique et en cours moins d'un an, et le prochain chapitre sera � nouveau �largi.

En termes d'utilisation, il y avait plusieurs principes � l'�poque:

1. L'ordonnance n'est pas directement expos�e � son propre �tat, mais est expos�e � la mani�re ext�rieure. Parce que le statut est une description, et l'�v�nement repr�sente une action, et les d�tails de l'�tat de commande et les accessoires peuvent �tre d�coupl�s en m�me temps.

2. La diffusion de messages n'est utilis�e que pour les �v�nements de diffusion, pas pour la synchronisation des donn�es. Si les consommateurs ont besoin de plus de donn�es, v�rifiez l'interface de donn�es de commande et l'horodatage contient l'heure de l'�v�nement et le d�lai de livraison (l'heure est ajout�e plus tard). Autrement dit, le message comprend des informations d'en-t�te, uniquement le contenu utilis� pour expliquer l'�v�nement, et comprend �galement la cl� principale de la transaction et certaines informations qui peuvent �tre utilis�es pour le filtrage g�n�ral ou les itin�raires secondaires.

3. Les consommateurs devraient assurer leur propre pouvoir lors des messages des consommateurs, et en m�me temps, ils ne devraient se faire aucun �tat lorsqu'ils consomment. Si vous devez consommer dans l'ordre, il est mis en uvre par le redis et d'autres solutions.

4. Lorsque l'acc�s aux consommateurs, le sujet et la file d'attente doivent suivre une certaine sp�cification de nom. En m�me temps, la profondeur maximale de la file d'attente est de 10k, ce qui est abandonn�. Les consommateurs doivent clarifier s'ils acceptent les nouvelles et assurer leur propre performance de consommation. Selon l'�valuation � l'�poque, lorsque l'accumulation de message a atteint un million, les performances de l'ensemble du cluster ont diminu� de 10%. (Sous les conseils de l'architecture mondiale, nous avons �galement fourni un m�dium avec Redis comme moyen pour stocker les �v�nements de commande comme une image miroir, mais l'exp�rience n'est pas assez �l�gante)

L'architecture logique de cet ensemble de nouvelles diffus�es a �t� continuellement utilis�e aujourd'hui, et d'�normes dividendes ont �t� produits dans le d�couplage.

Exploration pr�liminaire

Du milieu de -15 ans au d�but de 16 ans, nous sommes au stade d'un seul volume de plus d'un million et cro�t progressivement rapidement.

OSC

Au cours de cette p�riode, j'ai �galement lu de nombreux articles architecturaux, ESB, SOA, Microservices, CQRS, Eventsource, etc. Nous explorons �galement activement la restructuration du syst�me de commande pour soutenir une concurrence plus �lev�e. � cette �poque, le plus �cout� �tait l'OFC de JD.com. Il a �galement achet� sp�cialement le �d�cryptage technique JD� et �tudiait, mais il a rapidement conclu qu'il n'y avait presque pas de grande valeur de r�f�rence. La raison principale est que l'OFC de JD est �videmment d�termin� par les caract�ristiques du commerce de d�tail. De nombreux concepts de l'OFC, en tant que superficiel dans notre banque, sont presque difficiles � comprendre lorsque nous avons mis en place un O2O � restauration. Mais nous en sommes encore affect�s et prenons une abr�viation similaire pour le centre de service du groupe, OSC.

�tant donn� que cette commande est en service depuis plus de 3 ans, la pile de langues principale de l'entreprise est �galement de Python � Java de Python. Il n'a pas fallu longtemps pour r��crire ce syst�me de commande. En cons�quence, j'ai con�u un syst�me d'architecture qui a utilis� OSC comme pr�fixe de domaine. Le concept principal de ce syst�me: l'ordre est de maintenir l'instantan� du temps de n�gociation, de maintenir sa propre simplicit� autant que possible, de r�duire la d�pendance � l'�gard de toutes les parties et de r�duire le r�le des canaux de donn�es.

La s�lection de la pile linguistique que nous avons choisie est Java, qui est pr�vue pour commencer la transformation de Java. (Malheureusement, nous nous sommes vraiment transform�s en Java en 2019).

En ce moment, nous sommes en septembre. Par co�ncidence, l'entreprise a commenc� � cr�er un nouveau syst�me d'examen de l'architecture de service pour la premi�re fois. Mon plan est probablement les Top1 et 2 Little White Rats participant � la revue. Fresh Sledgehammer attend de frapper les gens.

En fait, apr�s un an apr�s cela, j'ai examin� cette revue d'architecture, non pas parce qu'elle est pass�e, mais parce qu'elle a �t� rejet�e.

C'�tait dr�le de le dire. � ce moment-l�, je me souvenais l�g�rement des juges qui ont particip� � la revue d'architecture.

Le point de questionnement de l'architecte � cette �poque a pu l'utiliser pendant un an ou 3 ans dans cette architecture, et la question de la personne en charge des OP de base �tait particuli�rement int�ressante. Il a pos� la premi�re question. Ce syst�me est-il un chemin cl� ? Je pensais que ce n'est pas ce non-sens, j'ai r�pondu directement, la partie centrale l'est.

Ensuite, la deuxi�me question, le probl�me, cette application peut-elle �tre r�trograd�e? Je pensais que ce non-sens n'est-ce pas? Bien s�r, ce lien ne peut pas �tre r�trograd�. C'est le lien de base et de base. Le principal activit� de l'entreprise est d'entourer la transaction. (Il se peut que la compr�hension des deux parties ne soit pas sur un seul canal).

Donc, la conclusion qu'il a donn�e �tait, Le chemin cl� est l'ordre de base, qui ne peut pas �tre r�trograd�. Une fois qu'il y a un probl�me, tout le monde n'a pas de nourriture. L'examen �tait donc termin� et la conclusion n'a pas �t� adopt�e.

�tablir une �quipe de test

L'�quipe de trading n'a pas subi de test � temps complet, c'est-�-dire que tout le contenu est garanti par la R&D et l'auto-test. Le test d'automatisation de l'entreprise � l'�poque �tait tr�s faible, et presque tous les tests ont �t� effectu�s � la main. Cependant, pour le moment, je me sentais tr�s n�cessaire pour obtenir des ressources de test. J'ai une demande solide pour mettre en place une �quipe de test pour ajouter une couche de protection � la qualit� de la commande.

� ce moment-l�, des choses int�ressantes se sont produites. Selon JN, l'�quipe du cadre n'a pas �t� test�e. Cependant, ils ne semblaient pas avoir de probl�mes. � ce moment-l�, ils ont fi�rement expliqu� pourquoi la technologie ne devrait pas garantir la qualit� du code eux-m�mes . C'�tait juste simple et impeccable. Je pense qu'il y a des id�aux dans ce point de vue. Il peut ne pas �tre facile de trouver leurs propres erreurs. L'introduction d'un autre groupe de personnes peut couper sous un autre angle, ce qui peut encore am�liorer la qualit� de la qualit�. Apr�s tout, ce syst�me est si important et � haut risque, mais nous ne devons pas �tre �tablis une �quipe de test qui ne peut fournir que "point".

Enfin, apr�s une longue communication avec JN, nous avons d�termin� le positionnement et les responsabilit�s de l'�quipe de test � ce moment-l�: pour nous assurer que la qualit� du code est la responsabilit� qu'elle doit �tre d�velopp�e. Sur cette base, le d�veloppement du test fournit principalement l'outil soutien pour r�duire le co�t du test. Dans le m�me temps, offrant un certain degr� de garantie de test � l'allocation du permis d'�nergie.

Par cons�quent, vers f�vrier et mars 2016, l'�quipe commerciale a �t� premier test. Presque en avril, le test HC a atteint 4 personnes et j'�tais responsable de toute l'�quipe de test.

La premi�re chose est de cr�er un test int�gr� automatis�.

Le choix sur la pile technologique a adopt� RobotFramework. La raison principale �tait que toute l'�quipe a toujours pris Python comme langue principale � l'�poque, et le test et le d�veloppement des �l�ves pouvaient r�ellement �crire Python et Java., La lib li�e au syst�me peut �tre raffin�, m�me si la pile de langues est transform�e, le co�t ne sera pas �lev�.

En plus de tester les sp�cifications du processus et les normes de test, commencez � cr�er une plate-forme pour g�rer les cas de test, les rapports d'ex�cution et d'ex�cution.

J'ai nomm� Webot dans ce syst�me:

Utilisez RobotFramwork comme base de l'ex�cution du cas de test
O� Jenkins est-il r�ellement d�ploy� o� est l'ex�cution et respecter la gestion du plan d'ex�cution
Sur la base de Django, une interface de gestion simple est configur�e pour g�rer les cas et les rapports de test, et permettre � chaque cas de test d'�tre assembl� en tant qu'unit�. Si vous connaissez Java, vous pouvez faire une analogie similaire ici. Les cas d'utilisation peuvent �tre consid�r�s comme un SPI.
De plus, Docker a �t� initi� � d�ployer l'environnement de l'esclave, qui �tait tr�s superficiel. Bien qu'il ait faim � l'�poque, avez-vous utilis� Docker (affam�? La conteneurisation devrait �tre d'environ 17 ans).

Pensez � ce que je jouais avec l'environnement de test � ce moment-l�, et j'ai beaucoup aim�.

La pens�e g�n�rale est:

Unit� d'essai : Business Library est en fait une couche d'emballage de l'interface de service SOA � RobotFramwork. Chaque unit� de test peut appeler une ou plusieurs interfaces pour terminer les activit�s commerciales de l'atome.

Composant de v�rification : Fournissez une v�rification de la valeur de retour ou de la configuration suppl�mentaire des donn�es Redis et de la base de donn�es.

Tests d'int�gration : Plusieurs unit�s de test sont organis�es en ligne pour compl�ter un cas de test int�gr�. Une fois chaque unit� d'essai effectu�e, la demande et le repas de la demande peuvent �tre obtenus n'importe o� dans le domaine en cours d'ex�cution du cas de test int�gr�.

Les tests de r�gression : S�lectionnez plusieurs tests int�gr�s, qui peuvent �tre utilis�s comme sch�ma, configur�s.

De cette fa�on, la r�utilisation de la taille des particules � plusieurs niveaux et diff�rentes. Selon le plan d'essai de test et de r�gression int�gr�, l'arri�re-plan compile et g�n�rera les fichiers robot correspondants.

En fin de compte, ce projet a �chou�. La raison principale est que les �tudiants qui ont test� et d�velopp� �taient insuffisants dans le d�veloppement, et qu'il y avait plus de travaux de d�veloppement avant sur l'interface. Au d�but, j'ai directement appliqu� l'interface de gestion �tendue de Django pour faire une expansion simple. autoris� � d�penser trop d'�nergie sur le dessus. Les composants frontaux construits ont des d�fauts dans l'exp�rience, ce qui conduit � une faible efficacit�. En mai, le deuxi�me d�veloppement a �t� essentiellement abandonn�.

Mais cette tentative a �galement apport� d'autres r�sultats. Nous sommes �quivalents � l'abandon des cas de gestion des syst�mes et la combinaison de Jenkins + Robotframwork est conserv�e. Nous sommes la garde de certains des tests int�gr�s �crits sur le GIT, et la R&D d�ploiera les succursales que nous avons d�velopp�es dans l'environnement d�sign�. La mise en uvre sera dessin�e chaque matin. Quelque chose ne va pas. Dans le m�me temps, l'application manuelle est �galement autoris�e. Deux �tudiants, la culture et les arts martiaux, et Xiaodong, ont contribu� beaucoup d'�nergie.

L'�tablissement de cette r�gression d'int�gration d'automatisation fournit une garantie importante pour la reconstruction � l'�chelle divis�e et � petite �chelle du syst�me de commande ult�rieur. Faites la bravoure R&D et les �tapes peuvent �tre plus longues. Il sera tr�s actif d'utiliser cet outil, et vous avez go�t� beaucoup de douceur �vidente.

La deuxi�me chose est de construire des tests de performances.

Contexte:

Je me souviens que lorsque je suis entr� en contact avec la commande dans 15 ans, j'ai eu la chance de visiter le professeur XL qui avait faim. Mesure.

� cette �poque, il y avait des probl�mes, des performances et des capacit�s. Nous n'avions pas la capacit� de pr�dire � l'avance. Par exemple, avant de terminer la rupture, une entreprise a �t� lanc�e une fois une liste de listes de commandes, car l'interface universelle existante a �t� utilis�e (cette taille de particules d'interface �tait �paisse et la combinaison conditionnelle �tait forte), nous n'avons pas pu l'�valuer � l'avance. Query a pris un tr�s mauvais indice de performance. � cette �poque, le pic de midi �tait proche, et quelques interfaces de requ�te K KP ont �t� vaincues de Kuru (15 ans de notre syst�me de surveillance et d'alarme).% Sont venus, et l'ensemble de l'ensemble a dur� pr�s d'une demi-heure. Enfin, cela revient aux changements r�cents, et le marchand est revenu � ce changement pour vraiment r�cup�rer. Apr�s enqu�te, le lent SQL de l'accident a provoqu� environ des centaines de centaines de QP.

Les tests de performance de l'ensemble de l'entreprise �taient plus t�t que mon plan, mais le test de performance de l'entreprise � l'�poque �tait pour 517 festivals � emporter. Il y avait une vague de camarades de classe sp�ciaux. La pr�paration et la mise en uvre ont en fait pris beaucoup de temps.

Pendant le test de pression, vous devez r�soudre le probl�me en continu et appuyer � plusieurs reprises le test. Cet incident a fait voir de nombreux �tudiants de l'apparence de chaque heure � Kintera -Iron City Square � ce moment-l�. Je me souviens de ce moment. �taient d�j� � 5h30 du matin. Les r�verb�res des deux c�t�s � mon arriv�e � la maison �taient �teints.

Ci-dessus est un peu �tranger. Bien que le test de pression de liaison compl�te nous apportera certainement, nous avons �galement des endroits o� le lien complet ne peut pas �tre enfonc�, et il y a des interfaces ou une logique qui doivent �tre effectu�es s�par�ment et doivent �tre transport�es � tout moment.

Construction:

Locust est s�lectionn� dans la s�lection technique, car le cadre Python SOA et ses composants peuvent apporter une grande commodit�. Auparavant, lorsque le test de pression de liaison compl�te de niveau de l'entreprise, JMeter n'�tait pas facile � int�grer avec le cadre SOA de Java. Il est n�cessaire qu'il ait provoqu� un certain inconv�nient � l'�poque. Une autre raison est que le concept de conception du crique peut rapprocher certains cas d'utilisation du sc�nario commercial r�el. Seuls les indicateurs QPS sont observ�s, et parfois il y a une certaine distorsion.

Avec l'�quipe compl�te des tests de performances en lien, � l'avant de la fosse, en fait, l'�tablissement de ma propre capacit� de test de performance a �t� achev� rapidement. L'ensemble du processus de construction a pris plus d'un mois. Essence Les testeurs de performance comprennent l'apprentissage de la recherche et du d�veloppement, ce qui n�cessite un peu de processus. Bient�t, le test de performance de notre groupe a �t� sorti de l'ensemble du d�partement, y compris la fusion avec l'�quipe financi�re par la suite.

Cette construction nous permet d'avoir certaines attentes pour notre charge de service et notre limite sup�rieure de performance lors de la fourniture d'une interface � l'ext�rieur. Nous avons �vit� certaines interfaces avec des dangers cach�s pour aller en ligne, en particulier pour les conditions de requ�te complexes pour les marchands. . Certaines de nos �tapes de reconstruction ont trouv� � l'avance des verrous simultan�s et des d�pendances d'appel des liens.

La troisi�me chose est un exercice de d�faillance al�atoire.

Version 1.0:

Le prototype au d�but est en fait tr�s simple, l'id�e g�n�rale est:

1. Tirez un environnement sp�cial dans l'environnement de test, avec une surveillance et une base de donn�es distinctes.

2. Construisez un client pour simuler le nombre de comportements de l'utilisateur. (Notre exp�rience dans l'accumulation de test int�gr�e automatis�e a �t� utilis�e.

3. Fournissez un outil pour cr�er un service d�pendant du serveur simul� pour r�soudre le probl�me de la d�pendance du service � liaison longue. Mock Server peut renvoyer quelques sorties set en fonction de l'entr�e.

4. De plus, l'�quipe de cadre a aid� � faire des mains et des pieds et a envoy� une version sp�ciale, afin que nous puissions marquer le trafic. Selon le marquage du trafic par le client, le serveur simul� peut simuler certains comportements anormaux tels que l'obstruction, le d�lai d'expiration, etc., et les commentaires � notre serveur mesur�.

Il s'agit d'un prototype tr�s simple, et l'ordre a �t� r�gi par plusieurs fois, et la d�pendance �trang�re est tr�s faible, elle sera donc compl�tement form�e en moins de 2 ou 3 jours. Mais ce n'est qu'un jouet, et il n'a pas de signification de r�f�rence suffisante. Parce que la concurrence n'est pas tr�s �lev�e, le serveur simul� peut faire limit�.

Version 2.0:

JN a convoqu� certains camarades de classe et fait des roues en faisant r�f�rence au singe Choas de Netflix, et nous avons appel� le chenil.

Le dessin de conception du centre de contr�le est le suivant:

Avec l'aide de camarades de classe sp�ciaux et d'�tudiants d'exploitation et de maintenance, Kennel �tait initialement disponible vers octobre 2016. Cet outil fournit: la perte de paquets de r�seau de simulation; injection d'interface anormale; supprimer un nud dans le cluster; tuer violemment le processus de service, etc.

Tout le monde n'a jamais essay� cette chose auparavant, et nous ne savons pas quoi mesurer. Je voulais faire la premi�re vague de tentatives en novembre. J'ai essay� de faire 5 sc�nes qui doivent �tre accept�es:

1. Transactions distribu�es ultra-longues

2. Une interface anormale provoque toute l'avalanche

3. Un nud red�marrer dans le cluster ou le red�marrage de la machine, la r�action de l'appel est �vidente

4. La charge du processeur d'un cluster devient plus �lev�e et la charge est in�gale

5. Le service est un seul point, et le comportement du cluster est incoh�rent

Sur la base de ces sc�nes, choisissez une personne dans les camarades de classe de test pour prendre les devants de la mise en uvre. Les rapports de test de diff�rents services sont l�g�rement diff�rents, et les captures d'�cran de l'une d'entre elles sont les suivantes:

Apr�s une s�rie du test principal de service sur la transaction, nous avons trouv� des dangers cach�s:

Dans certains cas, le nombre de clusters et les centres d'enregistrement des services d�ploy�s peut �tre incoh�rent, c'est-�-dire, une fois le nud de service tu� par la violence, le centre d'enregistrement des services ne peut pas d�couvrir et expulser activement. Il s'agit d'un danger cach� relativement important.
Chaque cluster a une charge in�gale et les machines individuelles peuvent �tre �lev�es dans l'utilisation du processeur. (Li� � la strat�gie d'�quilibrage de la charge)
Lorsque la �destruction� r�cup�re, le taux d'utilisation du processeur de certains nuds sera nettement plus �lev� que les nuds, et il sera progressivement uniforme apr�s quelques heures. (Li� � la strat�gie d'�quilibrage de la charge)
Lorsque la charge du processeur � nuds unique est �lev�e, l'�quilibrage de charge ne roulera pas le routage de d�bit vers d'autres nuds. M�me si cette partie des performances de demande est bien pire que les autres nuds, m�me de nombreux d�lais apparaissent. (Il est li� au m�canisme de mise en uvre de l'�quilibrage de la charge et du fusible. Le SOA de Python est une fusion sur le serveur, et le client ne le fait pas)
Le r�glage au fil du temps d'un grand nombre de services est faux, le cadre prend en charge la configuration des heures suppl�mentaires et du temps difficiles, et les bulles ne sont que l'alarme sans bloc par des erreurs de niveau bas qui peuvent ne pas �viter certains avalanches.
Dans les sc�narios individuels, la configuration du d�lai d'expiration �choue. Attrapez ce temps mort.
Em

Plusieurs raisons de ce projet sont �videntes, Nous avons fait beaucoup de conception et de pr�cautions, et nous devons combiner des exercices de d�faut pour acceptation. Qu'il s'agisse d'erreurs de niveau bas ou de conception insuffisante, nous pouvons le trouver � l'avance dans une certaine mesure.

Bien s�r, nous avons �galement caus� quelques erreurs. Un lien de r�mun�ration (g�n�ralement pas de travail). Lorsqu'il a attaqu�, il �tait invalide. Plus tard, il a �t� d�couvert que c'�tait un danger cach� qui a �t� enterr� dans un certain changement. Le pot fait par moi-m�me, je dois me porter avec des larmes, mais je pense que l'exercice d'�chec est plus utile. Qui peut garantir que lorsque l'�chec r�el arrive, ce n'est pas un accident plus grave.

En plus du syst�me favorable, le personnel a �galement re�u de nombreux avantages, tels que le temps r�el des tests et les �tudiants de R&D � travers ce projet, et l'utilisation de nos syst�mes de trace et de journal dans l'utilisation. Dangers cach�s et racines Des causes ont �t� trouv�es en testant les �l�ves � creuser le fond des camarades de classe. Les camarades de classe QA de haut niveau sont importants et il est tout aussi important d'am�liorer le niveau des camarades de classe QA.

Bien s�r, � l'exception des travaux de l'�quipe de test, les tests unitaires n'ont pas �t� abandonn�s et maintient une couverture de ligne de code de 80% � 90% en 16 ans.

Une s�rie de probl�mes avec la hausse du volume

Am�lioration de Redis

Gouvernance de la posture:

Au d�but de 2016, le principal goulot d'�tranglement �tait dans la base de donn�es. En fait, il a �t� mentionn� au-dessus de la base de donn�es. Il peut respirer un peu. En juin, tout le monde �tait le plus inquiet qu'il soit devenu redis. � ce moment-l�, Zabbix ne pouvait surveiller que le fonctionnement de la machine. Zabbix �tait en fait progressivement hors ligne. L'�quipe SRE a mis en place un ensemble de syst�mes de collecte d'index de machine � temps sup�rieur et a lu quelques donn�es de Linux directement. Cependant, l'ensemble Reded Operation Situation C'est encore une bo�te compl�tement noire.

Avez-vous faim? Il y a aussi beaucoup de fosses sur Twemproxy et Codis. Redis-Cluster n'a pas �t� utilis� dans l'industrie. Il a donc �tudi� un ensemble de redis proxy: Corvus. Memory, liens, taux de succ�s, nombre de cl�s, transmission Volume de donn�es, etc. Il s'est av�r� �tre lanc� � ce stade pour remplacer Twemproxy, ce qui fait que la gouvernance de Redis a inaugur� un revirement.

Nous avons coop�r� avec cette migration.

� ce moment-l�, nous avions trois utilisations principales de Reids. L'une �tait du cache, similaire aux tables et � la latitude d'interface; l'autre �tait des serrures distribu�es, et certaines sc�nes ont �t� utilis�es pour pr�venir et �crire; Le code a �t� �crit par des pr�d�cesseurs il y a plusieurs ann�es.

The old posture, configure the table -level cache and interface cache in one cluster; the rest are configured in another cluster, but in terms of use, the framework is packaged with two clients, which have different fault tolerance mechanisms (that is, whether Il est fort en fonction ou peut �tre disponible ou disponible. V�rification).

Tout le monde sait que les transactions � emporter ont une caract�ristique, Dans un court laps de temps, une commande progressera plus rapidement pendant la phase de transaction, de sorte que la mise � jour du cache de commande est plus fr�quente Apr�s la disponibilit� de la v�rification grise courte du cluster Redis, nous avons effectu� une commutation compl�te (les d�tails du sch�ma de commutation sp�cifique � l'�poque n'�taient pas clairs, et maintenant je peux r�ellement avoir une solution plus s�curis�e).

Le cluster du cache d'origine est de 55 g et OPS pr�pare un cluster de 100 g. � environ 10 minutes apr�s la commutation, la m�moire du cluster est pleine.

Nous arrivons � une conclusion incroyable ... Le 55 g de l'ancien cluster a toujours �t� super (par co�ncidence, et les OP que nous avons migm�es sont �galement appel�s Super Brother).

Du point de vue des indicateurs de surveillance, les cl�s ont augment� rapidement et TTL a diminu� rapidement. Nous avons rapidement verrouill� les deux interfaces, Query_Order et Count_Order. � ce moment, il n'y a pas de probl�me sur le RT avant les deux interfaces, et la moyenne est de 10 ms.

� partir de notre sc�nario d'entreprise, le r�le principal de ces deux interfaces est de demander l'ordre d'un restaurant pendant un certain temps. Afin de s'assurer que le marchand peut voir les nouvelles commandes d�s que possible, le marchand a adopt� un m�canisme pour rafra�chissant. Et ce probl�me est principalement sur les param�tres de requ�te. Ces deux interfaces utilisent le cache de niveau d'interface. Le cache de niveau interface SO-So-called consiste � g�n�rer un hachage en tant que cl� et la valeur de retour sous forme de valeur. C'est normal de voir. Si le horodatage du param�tre de requ�te est la derni�re seconde de la journ�e, c'est en effet. Je crois que beaucoup de gens ont devin� que le horodatage est r�ellement pass� dans le moment actuel. C'est un temps de glissement, ce qui fait que le cache est proche de 100% Miss. Essence

(Parce que la strat�gie de recyclage de la m�moire des anciens et nouveaux clusters est diff�rente, dans ce cas, les GC fr�quents entra�neront des indicateurs de performance � secouer farouchement)

Ces deux caches ne sont en fait pas utiles ... apr�s avoir roul� un jour, apr�s niveaux de gris, le cache de ces deux interfaces a �t� compl�tement retir�. Divis� en deux grappes.

Ensuite, nous avons trouv� des choses int�ressantes ...

Jetons un coup d'il � la courbe rugueuse de notre valeur de pic de caract�ristique unique.

Vers 3 heures de l'apr�s-midi apr�s le changement, la m�moire �clate � nouveau ..., la courbe d'occupation de la m�moire est approximativement la figure suivante:

Apr�s l'expansion d'urgence, nous avons observ� le soir, et la courbe finale est devenue le chiffre suivant. Du point de vue du taux de succ�s, il y a �galement une certaine am�lioration (les donn�es sp�cifiques ne sont plus disponibles, entre 88% et 95% , puis il atteint plus de 98%) Essence

Pourquoi est-ce diff�rent de l'entreprise de pointe ...

En fait, il est toujours simple de combiner l'entreprise. C'est tr�s simple. � ce moment-l�, les demandes de rotation du marchand avaient plusieurs sc�narios. Le plus longtemps �tait de demander des commandes dans les 3 derniers jours, et il y avait une page pour interroger la commande le m�me jour s�par�ment.

Le backend v�rifie plus d'�l�ments requis que chaque page de l'avant pendant la rotation, et non, toutes les commandes du marchand ne sont pas sup�rieures � la journ�e. Par cons�quent, avec le temps de la journ�e, le ph�nom�ne ci-dessus appara�t.

Pourquoi les indicateurs de performance pr�c�dents n'ont-ils pas vu de probl�mes? Premi�rement, il est li� � la s�lection des strat�gies de recyclage de la m�moire de l'ancien cluster Redis. La seconde est que la quantit� de QPS est tr�s �lev�e. Si vous ne regardez que le temps de r�ponse moyen, les mauvais indicateurs sont moyens et le taux de r�ussite est �galement tir� en moyenne.

Eh bien, apr�s avoir r�solu ce probl�me, de nouveaux probl�mes ont �t� d�couverts.

Vers 1 et 2, lorsque la nuit �tait silencieuse, elle a �t� appel�e par OnCall, et la surveillance a r�v�l� que l'utilisation de la m�moire grimpait brusquement.

Nous verrouillons une interface qui n'est pas normale et query_order. Pendant la journ�e, le r�glement s'est install� juste r�nov�. C'est � ce moment que ce genre de nuit �tait silencieux. � ce moment-l�, notre p�riode de compte �tait relativement longue (cela est d� au probl�me que l'ordre peut �tre retourn�, et il y aura un lieu pour se d�velopper ci-dessous). � cette �poque, les commandes historiques ont provoqu� une grande quantit� de m�moire, et le moment de notre cache de surface est de 12 heures. S'il n'est pas nettoy�, il peut avoir un certain impact sur le pic pr�coce. Plus tard, nous avons fourni une interface qui n'a pas pris le cache le lendemain et l'avons donn�e pour effacer le r�glement seul.

Le probl�me central ici est que nous La serviceization est inf�rieure � un an. La gouvernance des services ne peut pas �tre tr�s fine. L'interface du service est ouverte, expos�e au r�seau int�rieur, et tout le monde peut appeler. Notre protocole d'interface est �galement ouvert. Il est facile pour quiconque de savoir � v�rifier l'interface, et le vieil homme de l'entreprise est relativement sauvage (pas besoin de faire, ce qui est n�cessaire, l'ajoutez simplement par lui-m�me). Les autorisations de fusion et de lib�ration du code GIT Warehouse ont �t� r�cup�r�es et contr�l�es d�s 15 ans, mais � ce moment, SOA n'avait pas encore termin�, et l'autorisation d'interface n'a �t� prise en charge qu'au plus tard.

L'utilisation de Redis doit encore �tre bas�e sur une compr�hension approfondie des sc�narios d'entreprise et faire attention � divers indicateurs.

Am�lioration du m�canisme de cache

Notre m�canisme de cache � l'�poque �tait comme ceci:

Avantages de cette conception d'architecture:

1. Il existe un lien ind�pendant pour mettre � jour le cache, qui a moins d'invasion du service d'origine

2. R�plication des composants �lev�s

3. Il y a des pics MQ, et en m�me temps, il y a un niveau de redis, qui globe pour r�duire davantage la concurrence

Dans de nombreux sc�narios, c'est une architecture bien-jacente.

D�corpation:

1. La file d'attente � deux niveaux a �t� utilis�e et le lien est long

2. Mauvais en temps r�el

La raison de la transformation de nous est �galement d�riv�e d'un petit accident.

La requ�te de la liste des commandes du marchand est en fait bas�e sur l'�tat de la commande et l'ordre obtenu doit �tre pay�. Cependant, une logique de jugement erron�e a �t� plac�e � l'arri�re du marchand � ce moment-l�. Cette logique d�terminera si le flux sur l'ordre est 0 (valeur par d�faut). Perdre.

Dans cet accident, le composant de mise � jour du cache �tait agenouill� (et personne ne sait ... bien que cette architecture ait �t� con�ue au d�but de certains �tudiants dans le cadre, il �tait trop stable et m�me oubli� ...). Parce que la mise � jour du cache n'est pas opportune, les donn�es obsol�tes sont obtenues. L'aspect est que les commer�ants ne peuvent pas voir de nouvelles commandes. Lorsqu'ils le voient, il a �t� annul� par la logique de la logique qui n'est pas disponible sans le d�lai. C'est vraiment une merveilleuse combinaison ...

Le dos est transform� en look ci-dessous:

En revanche, ce lien d'architecture a beaucoup �t� r�duit et la nature r�elle est garantie. Cependant, afin de ne pas bloquer le processus, une certaine tol�rance aux d�fauts est effectu�e, qui doit ajouter un lien de compensation de surveillance. Apr�s cette am�lioration, nous avons imm�diatement supprim� la d�pendance du code et de la configuration de Zeromq.

Am�lioration de l'utilisation des messages

Une fois la sous-biblioth�que termin�e, nous n'avons aucune confiance dans MQ. Au cours des prochains mois, MQ a sorti plusieurs anomalies successivement. C'�tait vraiment la loi de Murphy. Malheureusement, nous avons juste senti que cela allait se produire sans quelque chose. o� �a arrive.

Mauvaise pose

Dans le chapitre pr�c�dent, j'ai mentionn� que j'ai construit un ensemble de m�canismes de diffusion de messages de commande. Sur la base de cet ensemble de messages, le marchand a fait une optimisation technique pour les demandes de rotation � haute fr�quence. La pression de l'enqu�te. Permettez-moi de pr�senter bri�vement cette solution. Le marchand a un service de dos et la diffusion du message de la commande. S'il y a une nouvelle commande (c'est-�-dire la commande qui peut �tre vue pour terminer le marchand de paiement) sera sur le haut , il d�clenchera un rafra�chissement actif � la fin et fera une touche du son pour rappeler au marchand. Les demandes de rotation d'origine ont augment� l'intervalle de temps et r�duisant la fr�quence.

Alors, o� est le probl�me? Dans un certain temps, la ligne bleue, le temps de d�pense global est inf�rieur � la ligne rouge, c'est-�-dire que la demande d'une partie de la proportion est d'aller au r�seau ext�rieur. Rapidement.

Le marchand a propos� que la biblioth�que principale, les b�tes, �videmment, ne y pense pas, il est impossible d'�tre d'accord. Les consommateurs ne sont pas tr�s amicaux par les consommateurs pendant un certain temps. Apr�s tout, ce n'est parfois pas n�cessairement une bonne chose, alors pouvons-nous le laisser sortir lentement?

Ainsi, la topologie de Binding a �t� chang�e pour nous. La file d'attente rose rose a utilis� les caract�ristiques de RabbitMQ dans la file d'attente (c'est-�-dire un message d�finissant un temps d'expiration, et le temps d'expiration peut �tre abandonn� ou d�plac� de la file d'attente vers un autre endroit.), :

Le probl�me devant moi a �t� r�solu, mais il a �galement �t� enterr�. Les �tudiants qui ont �t� l�g�rement exp�riment�s dans le lapin et la conception d'architecture devraient bient�t se rendre compte des erreurs qui ont �t� commises ici. Chaque courtier de ces m�ta-informations tels que la relation de liaison est utilis� pour le routage. Cependant, la persistance de la nouvelle est dans la file d'attente. Et la file d'attente n'aura qu'un seul nud, qui est � l'origine un cluster. � l'heure actuelle, la partie sup�rieure de la topologie devient un seul point.

De retour � l'accident de cluster MQ que j'ai mentionn� au d�but, pour certaines raisons, certains nuds de notre cluster MQ �taient malheureusement � genoux, y compris cette file d'attente rose rose. En m�me temps, un autre probl�me a �t� expos�, Cette structure topologique ne peut pas �tre un fonctionnement et une maintenance automatis�s. , Reconstruire un nouveau nud, les m�ta-informations doivent �tre export�es de l'ancien nud, mais cela entra�nera un certain conflit. Et, t�t, nos d�clarations de sujet et de file d'attente n'ont aucune exp�rience, N'alloutez pas la file d'attente en fonction de la consommation r�elle de consommateurs, afin que certains nuds soient surchauff�s. Sous le fonctionnement automatique et la maintenance et l'�quilibre relatif, cette derni�re pratique s�lectionne en fait un nud pour d�clarer la file d'attente.

Apr�s cela, nous avons apport� deux am�liorations. L'une devait d�clarer la topologie dans le fichier de configuration du service, et automatiquement � MQ pour d�clarer dans le MQ lorsque le service a �t� d�marr�; demandez le nouveau single par un seul (cache, si Miss Routage vers la biblioth�que principale).

Ainsi, la topologie des nouvelles est devenue ci-dessous:

Splatement du cluster de messages

C'est toujours le contexte de l'histoire ci-dessus, et nous revenons � la cause de l'accident. Selon nos tests de performance du cluster RabbitMQ, ce d�bit devrait �tre capable de le r�sister. Cependant, la charge du processeur est tr�s �lev�e, ce qui affecte �galement le message d'envoi du producteur (d�clenchant le m�canisme d'auto-prot�ction de RabbitMQ) et m�me raccroche.

Avec les efforts de l'architecte, la raison a finalement retrac�. et mode r�cup�rer, param�tres pr�fetch_count, etc.), en fait, ce param�tre n�cessite une certaine quantit� de calculs pour obtenir une valeur raisonnable. Sinon, m�me si la machine a toujours un processeur disponible, la puissance de d�pense ne peut pas �tre en hausse.

Quelle est la relation avec l'ordre? La r�ponse est mitig�e. Ce cluster est s�par� par diff�rents messages commerciaux via VHOST, il a donc d�ploy� des informations sur les commandes, les commandes de transport et le transfert de marchand.

Le jour de l'accident, le patron du d�partement des op�rations et de la technologie a pass� une commande, peu importe comment il a fait la machine, Le jour, un cluster de diffusion de messages ind�pendants doit �tre mis en place pour les commandes. Le d�partement des technologies de l'op�ration et les �tats-Unis sont combin�s avec toute la f�te des consommateurs. La nuit, un cluster � 7 nuds a �t� configur� pour d�manteler l'ordre de la commande.

(Un an plus tard, ce cluster a �galement atteint le goulot d'�tranglement et n'a pas pu �tre r�solu par l'expansion. La raison principale �tait que le consommateur n'utilisait pas les caract�ristiques de RabbitMQ pour surveiller les nouvelles. L'augmentation de l'�chelle a atteint le goulot d'�tranglement. Ce dernier a envoy� Un message suppl�mentaire au cluster nouvellement construit du producteur, qui a �t� soulag�. La vraie solution a toujours faim? Apr�s avoir remplac� RabbitMQ en utilisant GO auto-d�velopp� MaxQ).

PS: Si le temps remonte � l'�l�ment d'am�lioration d'origine, un troisi�me point sera ajout� � l'avance. Pour l'utilisation du �*� pour s'abonner au message, l'abonn� doit changer en fonction des besoins r�els. Les raisons de la corruption ici ne sont pas suffisamment de contr�le et de gouvernance. Des suggestions standard et de meilleures pratiques sont disponibles dans les documents d'explication initiaux. � l'avenir, le vieil homme n'est pas compl�tement contr�l� par les op�rations techniques, et le fournisseur de services a besoin.

Transaction et innovation virtuelles

petit-d�jeuner:

De la fin de 2015 � d�but 2016, le petit-d�jeuner qui avait faim, bien que la proportion de volume unique n'ait pas �t� �lev�e, elle �tait relativement importante pour l'architecture technique � l'�poque.

L'interaction entre les plats � emporter et le petit d�jeuner est:

Je suppose qu'� ce moment, il y aura un tas de points d'interrogation ...

J'explique l'arri�re-plan:

1. Le petit d�jeuner est ind�pendant de la restauration et construit compl�tement un nouveau syst�me (utilisateur, magasins, commandes, distribution, etc.).

2. �tant donn� que le paiement ne peut pas �tre effectu� de mani�re ind�pendante, le paiement est coupl� dans le syst�me utilisateur avant 2016, et cet ensemble de paiement est purement personnalis� pour les plats � emporter.

En cons�quence, en tant que �activit� d'innovation� du d�partement �d'innovation�, afin d'essai et d'erreur rapidement, il a compl�tement construit un ensemble complet de prototypes de commerce �lectronique. lien de transaction. Cette solution a �t� d�termin�e et mise en uvre par les �tudiants en recherche et d�veloppement du petit-d�jeuner et des �tudiants en recherche et d�veloppement qui ont pay�. L'ordre est devenu un outil sans perception.

Quand je le savais, j'avais grandi comme �a. Quand ai-je su, quand je suis sorti du pot, c'�tait tr�s r�el. � ce moment-l�, l'EPI et le PRD n'ont pas �t� compl�tement isol�s. Une mauvaise op�ration a provoqu� la mise en uvre de la t�che asynchrone de ProD � l'EPI puis transf�r�e. � la fin, l'ordre a �t� annul� sans consommation de travailleurs.

Carte de membre de la livraison affam�e

D�but 2016, le parti en affaires a mentionn� une demande, en esp�rant que les ventes de la carte d'adh�sion � la livraison peuvent �tre en ligne, et cela a �t� fait auparavant de s'appuyer sur les ventes hors ligne d'une carte physique. Juste, apr�s la pr�c�dente revue d'architecture, nous avons �galement besoin d'un mod�le de petite entreprise pour pratiquer nos nouvelles id�es d'architecture, il existe donc un syst�me de commande � vendre de notre produit virtuel.

Nous abstracons un ensemble du mod�le d'�tat le plus simple:

Le point central:

1. Toutes les transactions dans le monde sont ins�parables de ses anc�tres. Les nuds principaux sont relativement stables.

2. Le comportement d'achat de C-Fend est relativement simple, tandis que la livraison de la fin B peut �tre en train de se chuter.

3. Plus les syst�mes de base, plus il faut �tre simples.

L'interaction en amont et en aval est comme ci-dessus. La gestion, le marketing, le guide d'achat, etc. sont tous remis � l'�quipe commerciale elles-m�mes, le syst�me commercial La responsabilit� principale est de fournir des donn�es pour les canaux et les transactions.

Dans la conception des donn�es, les acheteurs et les vendeurs, le sujet et la sc�ne, ces trois sont consid�r�s comme n�cessaires � l'�poque. Bien s�r, je peux maintenant donner un mod�le plus standard, mais � l'�poque, nous n'avons vraiment pas fait Je pense tellement.

Par cons�quent, la montre principale de la transaction est d�mont�e.

Un tableau de base, y compris l'ID principal de l'acheteur, l'ID de l'acheteur, le code d'�tat, le type d'entreprise, le montant du paiement. Le type d'entreprise est utilis� pour distinguer les diff�rents syst�mes d'acheteurs.

Un autre devient une extension, y compris la liste des sujets, la liste des informations marketing, la r�ception du num�ro de t�l�phone mobile, etc., qui appartient aux d�tails, permettant � la partie commerciale d'avoir un certain espace libre.

(PS: � l'avenir, le sujet, les informations marketing, etc. Bien que le amont puisse �tre contr�l� par lui-m�me, il est n�cessaire de restreindre le paradigme du niveau de code, sinon la gouvernance sera plus g�nante et le parti en affaires ose vraiment tout farcir))

D�montant deux tables, la raison derri�re elle est qu'une fois la commande g�n�r�e, les responsabilit�s de l'instantan� sont presque termin�es. La chose la plus importante est la maintenance de l'�tat, et le fonctionnement � haute fr�quence est �galement concentr� dans l'�tat. Il aide � Assurez-vous le processus de base; la seconde consiste � se r�f�rer � l'exp�rience des ordres de restauration. L'espace de stockage 2/3 est utilis� sur les d�tails, en particulier plusieurs champs JSON.

Une fois l'ensemble du syst�me de commandes virtuels configur�, de nombreuses plateformes vendant des activit�s via ce syst�me sont accessibles via ce syst�me. Pour nous, le d�veloppement des co�ts d'acc�s + ne prend que dans les 2 � 3 jours, et l'ensemble de l'entreprise est g�n�ralement en ligne dans un semaine en une semaine. D'accord, nous sommes tr�s heureux et l'�quipe commerciale de la r�ception est �galement tr�s heureuse. Parce qu'il n'y a pas de grandes sc�nes de requ�te � l'�chelle, pendant longtemps, il a stabilis� des centaines de milliers de commandes quotidiennes par jour, et les ressources de dizaines de curs sont plus que suffisantes.

Il s'agit en fait du prototype d'un syst�me de plate-forme simple.

autre

Autour de la transaction, nous avons en fait d�riv� certaines entreprises. Dans un sens large, l'�quipe de commande �tait responsable � l'�poque, et elle a �galement �t� caus�e par l'impact de la structure organisationnelle.

Par exemple, la propri�t� intellectuelle de la �poursuite�, le c�t� technique est la r�alisation de notre propri�taire d'�quipe � partir de z�ro, et en m�me temps, un �centre de r�mun�ration des transactions� est d�riv� pour percevoir toute la r�mun�ration en train de recevoir une transaction (y compris les enveloppes rouges, les bons de bons, les bons, les bons, les esp�ces, les points, etc.),;

Afin d'am�liorer l'exp�rience de transaction de l'utilisateur, nous avons lanc� un "Centre de touche de transaction" (a �volu� plus tard en Universal Touch Center d'une entreprise). Pendant la transaction, les messages texte de l'utilisateur, la pouss�e, le t�l�phone, etc. Le taux de cas extr�me r�duit le harc�lement r�p�t� aux utilisateurs.

Service et gouvernance des entreprises

La plupart d'entre eux mentionn�s ci-dessus sont quelques-uns des d�tails techniques. Les deux choses ci-dessous sont une �volution majeure de l'architecture d'application, qui jette �galement la direction de l'architecture d'application par la suite.

Ventes inverses et apr�s-vente

� la mi-2016, les ant�c�dents commerciaux, afin d'am�liorer l'exp�rience de l'utilisateur dans l'insatisfaction (des dizaines de cas sur notre tableau blanc), afin de raccourcir la p�riode du compte de r�glement (parce que le temps inverse est efficace pendant sept jours, le r�glement est fort Cela d�pend de cette �poque).

Dans le cadre de l'initiative de JN, nous avons d�mantel� l'inverse invers� de l'ordre d'origine et divis� le groupe d'ordre d'origine en deux �quipes. Je recommande l'un des �tudiants pour devenir le chef d'�quipe de la nouvelle �quipe.

Pour positif, la responsabilit� principale est d'assurer la douceur de la transaction, donc elle se concentre sur les cheveux �lev�s et les cheveux �lev�s et la stabilit�.

La concurrence inverse est inf�rieure � celle de l'avant, et seulement 1% des ordres doivent aller dans la direction inverse. Cependant, la complexit� de la branche et la relation hi�rarchique de la logique commerciale est bien sup�rieure � celle de l'avant, et une abstraction commerciale est requise. Bien que la stabilit� et les performances soient tout aussi importantes � inverser, elles ne sont pas si �lev�es.

Parce que les probl�mes de base sont diff�rents et que les exigences de service sont diff�rentes, la division est logique.

Le processus partag� r�el est encore tr�s douloureux. Tout le monde explore. Moi et mon patron, y compris le patron, avons fait une tourn�e d'innombrables fois.

Le formulaire final � l'�poque �tait le suivant (il y a encore des probl�mes, apr�s avoir �t� responsable de l'inverse au cours des prochaines ann�es, a fusionn� les ventes et apr�s les ventes):

La premi�re �tape consiste � ajouter un statut de commande Il est utilis� pour repr�senter l'ach�vement de la commande (sur la r�ception des marchandises, car il est g�n�ralement achev� imm�diatement apr�s la r�ception, mais il y a encore quelques diff�rences entre les deux). Augmentation de la lumi�re, poussant en amont et en aval, y compris la mise � niveau de l'application, il a fallu pr�s de 3 mois.

La deuxi�me �tape, configurez un ensemble de retraites Une fois l'�chelle de gris de l'ach�vement de la commande termin�e, cet �tat est utilis� comme fin du cycle de vie de la commande. De cette fa�on, le r�glement et la d�duction du r�glement et du r�glement sont ind�pendants les uns des autres.

Dans la troisi�me �tape, la logique impliqu�e dans la commande est �galement r�duite dans le service. Essence (� propos de l'�volution des ventes de milieu et apr�s les ventes, il y aura une chance de se d�velopper plus tard)

L'un des stands dans lesquels nous sommes intervenus � cette �poque n'a pas d�collet� le statut et les �v�nements sup�rieurs relativement proprement, et finalement refl�t� dans la fronti�re commerciale et les affaires distribu�es. Il y avait beaucoup de probl�mes.

Apr�s quelques querelles, la logique principale du syst�me de commande a en fait �t� supprim�e relativement simple. Le travail principal est de d�finir la relation entre l'�tat Par exemple, a- > C, b- > CALIFORNIE- > B, si A, B, C et peuvent �tre invers�s ici sont d�finis par les commandes. La signification commerciale de cette couche est tr�s l�g�re, et l'accent est mis sur * - > C Nous pensons que c'est une sc�ne, et le niveau sup�rieur est responsable.

Par exemple, le statut de C est une commande invalide. � l'exception des commandes qui ont �t� ouvertes, tout statut peut �tre chang� en invalide. Quel type de condition est d�termin� par le formulaire d'entreprise. Elle convient au service dans le service de vente. Voulez-vous d�clencher des commandes pour inverser. Il y a aussi des ordres � recevoir.

En ce moment, il y a d�j� le dieu de la machine d'�tat.

En particulier, il est expliqu� que la ligne rouge est en effet une conception pliante dans le sc�nario de trading avec une forte actualit�. La t�che principale de cette ligne est purement un marquage. Jouez une �tiquette sur l'ordre pour indiquer si Indiquez s'il y a des ventes apr�s. Nous nous r�f�rons � l'E-Commerce (Taobao, JD.com) � l'�poque, et le d�montage vertical a �t� achev� � partir de la page. Pour la conception du syst�me, c'�tait beaucoup plus simple, et nous ne pouvions pas le faire. Ceci est d�termin� par le forme d'entreprise. Ceci est d�termin� par le formulaire d'entreprise. Ceci est d�termin� par le formulaire d'entreprise. Les commer�ants doivent terminer la commande en tr�s peu de temps, et en m�me temps, ils doivent toujours pr�ter attention � l'affaire anormale. De nombreuses pages sont sous peser, et ils doivent s'occuper de l'exp�rience utilisateur. En d'autres termes, bien que le syst�me soit d�mont�, l'entreprise de niveau sup�rieur ne peut toujours pas �tre d�mantel�, et m�me il y a beaucoup de voix � l'int�rieur. Nous voulons simplement rembourser. Pourquoi est-ce que je dis-je, distingue et relier les deux syst�mes. Par cons�quent, une partie des donn�es est �crite sur la commande.

� ce stade, les deux mots les plus utiles:

1. Que ce soit non? : Peu importe � quel point tout le monde veut faire les choses mieux. Ne vous l�ve pas aux gens en fin de compte; (Il n'y a rien cet apr�s-midi, le th� ne peut �tre r�solu).

2. persistent � faire quelque chose de plus b�n�fique : Personne n'est un sage. Quelle que soit la d�cision initiale, il n'y a pas de persuasion absolue pour se persuader. . (En revanche, la perte d'arr�t en temps opportun, les deux ne sont pas en conflit, mais doivent �galement �tre d�cid�es).

Acosit� logistique

D�but ao�t, j'ai pr�vu de me transf�rer la logique commerciale MQ, car les concepts de conception sont diff�rents et la pile de langues est diff�rente. La premi�re chose est de commencer la reconstruction.

Parlons ici de deux conceptions d'architecture "obsol�tes".

TOC et TOB et TOD:

D�but 2016, il y avait un ancien mandat, et maintenant la plupart des gens ne savent pas les choses: le corps.

C'est la forme d'auto-distribution lorsque vous vous levez t�t. Cet ensemble d'entreprise refl�te le couplage complet des commandes, des magasins, de la distribution, du r�glement, etc. dans l'entreprise. Hungry? Mon grand syst�me de logistique a �t� construit � partir de la mi-2015. � l'heure actuelle, il est n�cessaire de faire un grand projet et un DBO d�coupl�.

Ce d�couplage est n� dans les forfaits de service, les ordres TOB et les ordres TOD.

Expliquez un peu les ant�c�dents commerciaux. � cette �poque, la plate-forme a vendu des services aux marchands et a sign� un contrat avec le marchand. Les services vendus ici incluent les services de distribution. Ensuite, l'utilisation de la livraison ou non, elle affecte la commission et la cr�ation du marchand. Cependant, l'innovation caract�ristique de cette industrie est de dire au marchand lorsque le marchand re�oit l'ordre. Que le marchand voir un projet de loi avec une probabilit� �lev�e ( Quelle que soit l'exception de la vente) � l'avance, et vous devez �galement dire au marchand que le projet de loi est soumis au projet de loi.

Il s'agit en fait d'une logique de division et de division. Les activit�s de nettoyage du domaine de r�glement sont pr�sent�es au lien commercial. Effacer le r�glement est une entreprise non r�el toute l'ann�e. Naturellement, il est tomb� dans l'�quipe de commande. Une autre exp�rience, il y avait de nombreux �tudiants CTRIP qui sont venus ici � l'�poque. et Tod a �t� introduit.

La t�che que je re�ois est de passer une commande TOB. � ce moment-l�, je sentais que cette forme �tait erron�e. Le trading des affam�s et les transactions de CTRIP �tait diff�rent. J'ai exprim� son opposition au superviseur, mais apr�s tout, je n'ai pas eu beaucoup de pr�cipitations pendant un demi-an. Je n'ai pas beaucoup de raisons claires et puissantes. Il y a aussi d'autres personnes en difficult�. En bref, L'�cale de gris a �t� officiellement lanc�e d�but mars.

Cette image peut voir quelques questions �videntes:

1. La transaction a �t� d�molie en plusieurs sections, et les utilisateurs et les commer�ants doivent r�ellement percevoir chaque paragraphe. Et chaque �tape a certaines exigences pour la rapidit� et la coh�rence.

2. La plate-forme et la logistique n'interagissent qu'� travers le rouge en premier. Ce canal est tr�s lourd

3. Formule Synchronisation hors ligne ...

Tod

Apr�s la mise en uvre de l'architecture ci-dessus, en juillet, la partie TOD est devenue le seul canal pour les plateformes et la logistique. Il �tait trop lourd. L'entreprise n'a pas encore d�velopp� � ce stade, et les inconv�nients sont sup�rieurs au profit. Les camarades de classe du marchand avec le groupe de livraison sont malheureux, les �tudiants en logistique sont malheureux et les camarades de classe de la commande ne sont pas satisfaits.

Il arrive que l'ordre augmente. Nous pensons que le cycle de vie qui doit �tre contr�l� et contr�l� doit �tre �tendu � la livraison, et que la livraison appartient au cycle de vie de l'enfant, qui fait partie de la transaction. Ainsi, fin juillet, Tod m'a �galement donn� et a atteint le lien de restructuration.

� en juger par le personnel externe du syst�me de technologie des affaires, la conception de Tod �tait tr�s anti-humaine � l'�poque.

Lorsque nous avons vraiment pris le relais, nous avons constat� que la structure d'application de l'entreprise � ce moment-l� �tait probablement comme ceci:

Avec un tel �tage public d'infrastructures, cette couche r�sume les op�rations publiques telles que DB et Redis. C'est-�-dire, La logique commerciale et les donn�es du m�me champ sont divis�es en services � diff�rents niveaux de services en fonction du principe de superposition de ce syst�me. La couche commerciale dans un domaine doit faire fonctionner ses propres donn�es, et elle doit �galement �tre effectu�e via l'interface . Essence Cela peut avoir un certain sens (y compris en 2020 lorsque j'ai d�couvert des candidats dans l'interview, et certaines entreprises sont �galement cette approche), mais quand elle est remise, c'est douloureux! Le couplage complexe �quivaut � peler une ligne relativement propre et ind�pendante � partir d'un syst�me complexe.

Plus tard, nous avons chang� pour le look suivant:

1. TOB et TOD sont fusionn�s dans la premi�re couche, plac�s dans le service OSC.Blink et �liminent ces deux concepts comme des donn�es �tendues pour les commandes, et non une section coup�e de la transaction.

2. Si la plate-forme et la logistique ont une interaction de donn�es, il n'a pas n�cessairement besoin de passer cette couche d'amarrage. Il est pr�f�rable de transporter les donn�es n�cessaires � la livraison r�elle du temps r�el. La logistique Apollo peut prendre les donn�es ailleurs ailleurs sur la plate-forme. (En fait, certains probl�mes n'ont pas �t� r�solus. Le positionnement d'Os.Blink et Apollo dans les deux parties n'est pas compl�tement coh�rent. Apollo rassemble toutes les donn�es connect�es � la plate-forme comme centre de la liste de transport).

3. L'interaction entre les nuds et les nuds est aussi simple que possible, et le nud lui-m�me garantit sa propre robustesse. L'ordre de pouss�e d'origine a �t� effectu� via le message. Maintenant, il est chang� en RPC. Le Push Party peut prendre l'initiative de re -push (il existe une puissance de garantie de bon, etc.).

(La figure 3.1 �tait due � la plate-forme � emporter et � la plate-forme logistique � l'�poque. La salle informatique a �t� d�ploy�e dans diff�rentes villes. Le nombre de demandes de salle de la machine crois�e a eu un impact �norme, donc ce service a �t� encapsul� par ce service sur le lien) .

Fin ao�t, la pi�ce d'appel a �t� achev�e. Les donn�es ont commenc� � reconstruire les donn�es en septembre.

sommaire

� la fin de 2016, notre syst�me de trading se d�veloppe dans son ensemble:

� cette �poque, certaines bonnes habitudes et consciences �taient tr�s importantes:

1. Clarifier la puissance et les responsabilit�s : Code d'entrep�t de code Recyclage, recyclage des autorisations de publication, base de donn�es et file d'attente de messages Connexion de gestion et de contr�le des cha�nes, etc.

2. Gardez la propret� La

a. Nettoyez la logique inutile dans le temps (par exemple, j'organiserai un lot d'interfaces sans trafic tous les un ou deux mois, et il v�rifiera �galement l'interface avec une croissance anormale du trafic. Comment le montant en aval peut-il parfois �tre pratique).

b. Nettoyez la configuration inutile dans le temps et n'a pas besoin de tuer imm�diatement, sinon personne n'ose se d�placer apr�s le transfert.

3. La poursuite id�ale de l'ultime mais en bas � terre.

4. Adh�rer aux normes et m�canismes de test.

a. adh�rer � la construction d'automatisation

b. Adhere to Performance Test

c. persister dans le foret de faille

5. Demandez, demandez et entrez constamment et entrent en collision.

6. Restez simple, restez facile.

7. Peu importe ce qui est bien.

L'�volution de l'architecture est pr�f�rable d'�tre motiv�e par des affaires, de l'am�lioration de l'avant, pas un moteur d'accident. Avec le recul, nous avons constat� que la moiti� de notre �volution �tait r�ellement accompagn�e de l'accident. Heureusement, � cette �poque, la technologie peut �tre librement contr�l�e � ce moment-l�.

Si vous lisez ici, il y a beaucoup de r�sonance et de sentiments, mais vous ne le dites pas, alors vous organisez votre exp�rience dans certains cerveaux.

Dans le stage de demi-ans, chaque mois, je me sens changer chaque jour qui passe. Au cours des premiers ans et demi de remise des dipl�mes, j'ai toujours senti que moi-m�me �tait faible il y a trois mois. L'un du temps.

C'est tout pour la partie pr�c�dente. S'il y a quelque chose, attendez la partie suivante.

Informations sur l'auteur:

Le fan de Yang, le nom du nom de la fleur, est Hungry, un architecte de haut niveau, est-il rejoint en 2014? En 2018, il avait faim avec Alibaba et a rejoint Alibaba ensemble. 4 ans d'exp�rience en gestion d'�quipe. La construction du syst�me a �galement �t� responsable du compte affam�, de l'�valuation, de la messagerie instantan�e, de la livraison des performances et d'autres syst�mes.

News Fei Smart Voice Pioneer: Lorsque l'interaction humaine-machine est aussi naturelle que la communication humaine, la v�ritable �re intelligente vient!

B Les d�veloppeurs de github chinois ont augment� de 37% d'ann�es sur un an, le plus rapide du monde

P de Nginx � Pandownload, comment les programmeurs �vitent-ils la programmation en prison?

Ne peut trouver que l'algorithme dans les op�rations de math�matiques du secondaire? Quelle est la puissance de l'open source de Google Automl-Zero

L'architecture micro-service de Lspring Cloud sous l'architecture cloud: Microservice Department (Dept)

C du Cloud de Spring au maillot de service, comment �volue le syst�me de gouvernance d'architecture micro-service?

Route de la soie

Apprenez � conna�tre la Chine

Hungry? Le syst�me de transaction a une histoire de 5 ans d'�volution �volutive