Comment analyser rapidement le goulot d'�tranglement du processeur du syst�me o�? (Vous ne connaissez pas les connaissances)

Auteur | Ni Pengfei (Microsoft, un ing�nieur senior, Kubernetes responsable du projet)

les performances du processeur tant, outil d'analyse des performances du processeur pour saisir beaucoup, et remplac� par les sc�narios de travail r�els, en observant ce que l'indice, quels outils choisir la performance?

Ne vous inqui�tez pas, l'exp�rience I aujourd'hui pour optimiser les performances pendant de nombreuses ann�es, a mis au point un � rapide et pr�cise � routine de positionnement de goulot d'�tranglement, pour vous dire dans diff�rents sc�narios, comment choisir l'outil d'index, comment trouver les goulots d'�tranglement.

�Les performances du processeur

Apr�s avoir examin� le cas, d�crit les performances du processeur de ce que sont. Vous pouvez trouver quelqu'un de votre propre morceau de papier, de la m�moire � �crire, ou ouvrir un pr�c�dent article, son r�sum�.

Tout d'abord, Il devrait �tre les plus susceptibles de penser � l'utilisation du processeur Il est �galement l'environnement r�el de la plupart des indicateurs de performance communs.

pourcentage d'utilisation du processeur de temps non-ralenti d�crit le temps CPU total, en fonction de la CPU pour ex�cuter la t�che, a �t� divis� en CPU utilisateur, la CPU syst�me, en attente pour CPU d'entr�e / sortie, interruption d'interruption dure et douce.

l'utilisation du processeur utilisateur, l'�tat d'utilisation du processeur, y compris l'utilisateur (l'utilisateur) et un mode faible utilisateur prioritaire l'utilisation du processeur (Nice), indique le pourcentage de temps CPU en fonctionnement en mode utilisateur. L'utilisateur taux d'utilisation du processeur, indique g�n�ralement il y a une application occup�e.
l'utilisation du processeur syst�me, repr�sente le pourcentage du temps CPU en mode noyau de fonctionnement (sans interruption). L'utilisation du processeur du syst�me est �lev�e, ce qui indique que le noyau est occup�.
En attendant d'E / S, l'utilisation du processeur, aussi commun�ment appel� iowait, il repr�sente l'attente / O est le pourcentage de temps I. iowait haute, les syst�mes d�crits de mani�re g�n�rale et le mat�riel d'E / S interaction temps.
Doux et l'utilisation de la rupture du processeur d'interruption dur, respectivement les gestionnaires d'interruption d'appel du noyau doux, le pourcentage de mat�riel de temps d'interruption gestionnaire. Leur utilisation est �lev�e, indique g�n�ralement l'apparition d'un grand nombre d'interruption du syst�me.
En plus de ce qui pr�c�de, ainsi que dans un environnement virtualis� sera utilis� pour voler l'utilisation du processeur (voler) et l'utilisation du processeur client (invit�), respectivement, sont occup�s par d'autres pourcentage de machines virtuelles de temps CPU, et ex�cuter la CPU de la machine virtuelle client pourcentage de temps.

Le second est plus facile de penser, il devrait �tre la charge moyenne (charge moyenne) , Quel est le nombre moyen de processus actifs du syst�me. Elle refl�te la charge globale du syst�me, y compris trois valeurs, reportez-vous � la derni�re minute, cinq minutes et la charge moyenne au cours des 15 derni�res minutes.

Id�alement, la charge moyenne est �gale au nombre de processeur logique, ce qui signifie que chaque CPU se trouve �tre pleinement utilis�e. Si la charge est sup�rieur au nombre moyen de CPU logique, cela signifie une charge lourde.

Le troisi�me, �galement dans la colonne avant d'�tudier des estimations moins susceptibles de remarquer, changement de contexte de processus Y compris:

Impossible d'obtenir des ressources r�sultant du changement de contexte volontaire;
contexte est Involontaire syst�mes pr�vu entra�nent la commutation forc�e.

la commutation de contexte, elle-m�me une caract�ristique essentielle de Linux est d'assurer un fonctionnement normal. Mais le changement de contexte excessif, le temps CPU ex�cutera le processus original, consomm� en sauvegarde et la restauration des registres, la pile du noyau et de la m�moire virtuelle et d'autres donn�es, raccourcir le temps de lancer un processus r�el, devenir un goulot d'�tranglement.

En plus de ce qui pr�c�de plusieurs, Un autre indicateur, le cache du processeur taux de succ�s . Comme la vitesse du d�veloppement du processeur beaucoup plus rapide que le d�veloppement de la m�moire, la vitesse de traitement du processeur beaucoup plus rapide que la vitesse d'acc�s � la m�moire. De cette fa�on, CPU lors de l'acc�s m�moire, la m�moire aura in�vitablement � attendre une r�ponse. Afin de coordonner les deux �normes �carts de performance, le cache du processeur (g�n�ralement un cache multi-niveaux) est apparu.

Comme l'affichage de l'image ci-dessus, la m�moire cache de la vitesse du CPU entre la CPU et la m�moire de donn�es de cache est chaud. Les donn�es chaud ascendant, qui est divis� en diff�rentes tailles en fonction de la m�moire cache L1, L2, L3 et trois autres cache, dans lequel L1 et L2 sont utilis�s dans un seul noyau, L3 sont utilis�s dans plusieurs curs.

De L1 � L3, successivement trois augmenter la taille du cache, correspondant, de la performance successivement inf�rieure (m�moire ou meilleure que, bien s�r). Et leur taux de succ�s, une mesure de la r�utilisation du cache du processeur, plus le taux de succ�s, meilleures sont les performances.

Ces indicateurs sont utiles, nous avons besoin de ma�tre, alors je suis devenu un tableau r�capitulatif pour vous aider � classer et de la m�moire.

�Outils de performance

Ma�tre performances du processeur, nous avons aussi besoin de savoir comment obtenir ces indicateurs, ce qui est l'utilisation d'outils.

Vous souvenez-vous tous les cas pr�c�dents avec quel outil? Ici, nous regardons �galement de retour avec des outils de performance du processeur.

Tout d'abord, la charge moyenne des cas. Nous avons d'abord avec une disponibilit�, voir la charge moyenne sur le syst�me, et l'augmentation de la charge moyenne, mais aussi avec mpstat et pidstat, observ� l'utilisation du processeur de chaque processus et chaque CPU, ce qui conduit � une charge moyenne accrue identifi�e le processus, qui est notre stress outil de mesure de la pression.

Le deuxi�me cas de changement de contexte. LET vmstat de l'utilisation, pour voir le nombre de changements de contexte et les interruptions du syst�me, puis pidstat, a observ� le processus de la situation de changement de contexte changement de contexte volontaire et involontaire, enfin pidstat, la situation de changement de contexte de fil observ� pour conna�tre le contexte commutation augmentation du nombre de causes profondes, ce qui est notre outil d'analyse comparative sysbench.

En troisi�me lieu, le processus augmente les cas d'utilisation du CPU. Nous avons d'abord avec haut, de voir l'utilisation du processeur des syst�mes et des processus, l'utilisation du processeur trouv� processus �lev� est php-FPM, puis perf haut, observer la cha�ne d'appel php-FPM, et, finalement, identifier les causes profondes de la CPU �lev�e, Autrement dit, la fonction de biblioth�que sqrt ().

L'utilisation quatri�me, CPU du syst�me augmente les cas. Nous avons observ� d'abord le syst�me avec la CPU sup�rieur a augment�, mais par le haut et pidstat, mais n'a pas pu trouver le processus d'utilisation �lev�e du processeur. Donc, nous r��valuons la sortie de haut, et de l'utilisation du processeur n'est pas �lev�, mais le processus est dans l'�tat en cours pour commencer � trouver le suspect, �ventuellement par perf enregistrer et perf rapport, a constat� que l'original est un processus court dans le mal.

En outre, un processus � court terme, j'ai �galement introduit un execsnoop outil sp�cial, il peut surveiller le processus en temps r�el appel de commande externe.

Cinqui�mement, ne pas interrompre le cas du processus et zombie. Nous avons d'abord observ� le probl�me avec haut iowait �lev�e, et on a trouv� un grand nombre de processus non interruptible et processus zombie, dstat nous trouvons que cela est caus� par le disque lu, il a donc trouv� des processus li�s par pidstat. Mais nous voyons les appels syst�me avec le processus strace a �chou�, et �ventuellement avec perf processus d'analyse appelle la cha�ne, pour trouver les mensonges de cause racine dans le disque directement I / O.

Le dernier, le cas d'interruption logicielle. Nous avons observ� par le haut, les interruptions douces l'utilisation du processeur du syst�me augmente, puis voir / proc / softirqs, a trouv� plusieurs taux de changement rapide de l'interruption logicielle, puis commande sar se trouve au probl�me du paquet de r�seau, puis la finale tcpdump, pour identifier le type et la source des trames r�seau pour d�terminer une cause d'attaque SYN FLOOD.

Ici, on estime que vous avez perdu connaissance, avait quelques cas, nous avons utilis� une douzaine d'outils de performance CPU, et chaque outil est �galement adapt� pour la sc�ne diff�rente elle! Autant d'outils comment le distinguer? Dans l'analyse de la performance r�elle, comment devriez-vous choisir?

Mon exp�rience est, de deux dimensions diff�rentes pour les comprendre, n'apprendre et � utiliser.

�Apprendre et utiliser, les indicateurs de performance et des outils de performance lien

La premi�re dimension, de la performance de la CPU. Autrement dit, si vous voulez voir un spectacle, d'�tre bien conscient de ce que les outils peuvent le faire.

En fonction des indicateurs de performance, les indicateurs de performance pour fournir des outils pour classer et comprendre. Ainsi, lorsque les probl�mes de performance de d�pannage r�els, vous pouvez savoir clairement quels outils peuvent fournir des mesures que vous voulez, au lieu d'un par un pour essayer sans fondement, la chance a frapp�.

En fait, je suis en face de l'affaire a �t� utilis�e � plusieurs reprises cette id�e. Par exemple, avec le haut trouv� la douce interruption du taux d'utilisation du processeur, l'�tape suivante a naturellement voulu conna�tre le type sp�cifique d'interruption logicielle. Nous pouvons observer le fonctionnement de diff�rents types de doux interruption o�? Bien s�r, le syst�me de fichiers proc / proc / softirqs ce document.

Ensuite, par exemple, nous trouvons le type d'interruption douce de r�seau pour recevoir, il faudrait continuer � r�fl�chir sur le r�seau pour recevoir des directives. R�seau re�oit le syst�me est quoi? Quels outils peuvent �tre trouv�s dans le r�seau re�oit la situation? Dans notre cas, il est dstat utilisation.

Bien que vous n'avez pas besoin de tous les outils pour reculer, mais si nous pouvons comprendre les caract�ristiques de chaque indicateur outils correspondant doit �tre plus efficace et une utilisation plus flexible. Ici, je vous propose des outils de performance CPU faire un tableau, vous permettant de trier les relations et la compr�hension de la m�moire, bien s�r, vous pouvez �galement travailler comme lignes directrices � outil indicateur � � utiliser.

Ci-dessous, nous examinons la deuxi�me dimension.

La deuxi�me dimension, � partir de l'outil. C'est quand vous avez d�j� un outil pour installer, vous savez ce que cet outil peut fournir des indicateurs . Il est �galement tr�s important dans l'environnement r�el, en particulier l'environnement de production, parce que dans de nombreux cas, vous n'�tes pas autoris� � installer un nouveau kit, ne peut maximiser l'utilisation des bons syst�mes d�j� install�s l'outil, ce qui vous oblige � les nous avons une compr�hension suffisante.

Sp�cifique � utiliser chaque outil, g�n�ralement soutenir une multitude d'options de configuration. Mais ne vous inqui�tez pas, avec ces options de configuration ne le font pas vers le bas. Vous avez juste besoin de savoir quels outils, ainsi que les fonctions de base de ces outils est ce qui est suffisant. Pour utiliser le temps r�el, gr�ce � la commande man, consultez leur manuel sur elle.

De m�me, j'ai aussi utilis� ces outils deviendront un tableau r�capitulatif, vous permettant d'identifier et de comprendre, naturellement, vous pouvez �galement la fonction comme � cibles d'outils � Guide d'utilisation, vous pouvez table de consultation en cas de besoin.

�Comment analyser rapidement les goulots d'�tranglement du CPU

Je crois que cette �tape, votre performance sur le CPU est d�j� tr�s familier avec chacun des indicateurs de performance ont �galement �t� clair quels outils peuvent �tre utilis�s pour obtenir.

Cela ne veut pas dire que chaque CPU probl�mes de performance de rencontre, vous devez mettre ces outils avant tout RAN � nouveau, puis mettre toutes les performances du processeur sur une analyse compl�te de celui-ci?

Vous estimez que cette fa�on simple de trouver, comme la recherche stupide. Cependant, ne riez pas, parce que la premi�re fois que je l'ai fait. Tous les indicateurs sont v�rifi�s � nouveau l'analyse unifi�e, bien s�r, il est �galement susceptible de trouver un goulets d'�tranglement potentiels.

Mais l'efficacit� de cette m�thode est vraiment trop faible! Beaucoup de temps et ne pas dire en face d'un syst�me indicateur �norme, vous pourriez accidentellement oubli� un d�tail, ce qui dans un blanc sec. J'ai mang� plusieurs fois si amer.

Par cons�quent, dans l'environnement de production r�el, nous voulons souvent de localiser les goulets d'�tranglement dans le syst�me le plus rapidement possible, puis d'optimiser les performances le plus rapidement possible, qui est, pour r�soudre rapidement et avec pr�cision les probl�mes de performance.

Y at-il une m�thode qui permet d'identifier rapidement et avec pr�cision les goulots d'�tranglement du syst�me il? La r�ponse est oui.

Bien que les performances plus de CPU, mais vous savez, puisque les performances du processeur du syst�me sont d�crits, ils ne seront pas compl�tement isol�s, il y a une certaine corr�lation entre les nombreux indicateurs. Essayer de comprendre la pertinence des indicateurs de performance, il est n�cessaire pour chaque indicateur de performance de principe comp�tents de travail . Voil� pourquoi je pr�sente chaque performance, le syst�me doit �tre intercal�s expliquer les principes li�s �, je l'esp�re, vous vous en souvenez.

Par exemple, le taux d'utilisation du processeur utilisateur, nous devrions aller � D�panner mode utilisateur plut�t que les processus en mode noyau. Parce que l'utilisation du processeur de l'utilisation du processeur utilisateur se refl�te en mode utilisateur et le mode noyau utilisation du processeur ne se traduira que sur l'utilisation du processeur du syst�me.

Vous voyez, il y a une compr�hension de base, nous pouvons limiter la gamme, un gain de temps et d'efforts.

Par cons�quent, Pour limiter la plage, je vais d'abord habituellement courir quelques indicateurs d'outils de soutien, tels que haut, vmstat et pidstat . Pourquoi ces trois outils? Un examen plus attentif cette image ci-dessous, vous sera clair.

Cette image, j'ai �num�r� indicateur important de la partie sup�rieure du processeur, vmstat et pidstat sont fournis, et est repr�sent� par une relation correspond � la ligne en pointill� � une analyse de la performance de la direction suivante.

Par cette image vous pouvez voir, ces trois commandes, comprend presque tous les principaux indicateurs de performance du processeur, telles que:

Vous pouvez obtenir toutes sortes d'informations, ainsi que l'utilisation du processeur et la charge moyenne, processus, etc. zombie � partir du haut de la sortie.
Peut �tre obtenu � partir de la sortie des commutateurs de contexte vmstat, les interruptions, l'�tat d'interruption et un �tat de non fonctionnement du nombre de processus.
Le processus peut �tre obtenu � partir de la pidstat de sortie utilisation du processeur utilisateur, syst�me d'utilisation du processeur, ainsi que la situation de changement de contexte changement de contexte volontaire et involontaire.

En outre, de nombreux indicateurs de la sortie de ces trois outils sont reli�s entre eux, donc, j'ai aussi dit leur relation avec des lignes en pointill�s, quelques exemples vous pouvez �tre plus facile � comprendre.

Le premier exemple, la sortie pidstat augment� l'utilisation du processeur du processus utilisateur, parce que l'utilisation du processeur de l'utilisateur en haut de sortie augmente. Ainsi, lorsque les utilisateurs d�couvrent sortie haut de probl�me d'utilisation du processeur, vous pouvez le faire par rapport � la pidstat de sortie, et observer si le probl�me est caus� par un processus.

Le processus pour trouver la cause des probl�mes de performance, nous devons analyser le comportement des outils pour analyser le processus avec le processus, tels que les appels de cas d'utilisation des syst�mes d'analyse de strace, et l'utilisation de la performance perf fonctions d'analyse de la cha�ne d'appel � tous les niveaux.

Le deuxi�me exemple, la sortie sup�rieure de charge moyenne augmente l'�tat de fonctionnement peut �tre sortie avec vmstat et le nombre de processus qui ne font pas �tat d'interruption de contraste, l'observation est le processus qui a conduit � l'augmentation de la charge.

Si le processus ne soit pas interrompue augmentation du nombre, alors vous devez faire l'analyse des E / S, qui est, avec une �gale dstat ou un outil sar, une analyse plus approfondie de de l'E / S.
Si vous utilisez l'Etat a augment� le nombre de processus, il faudrait revenir en haut et pidstat, afin d'identifier ceux-ci en service � la fin est ce processus, et ensuite utiliser des outils d'analyse de processus pour une analyse plus pouss�e.

Le dernier exemple, lors de la recherche de la sortie de capote d'interruption augmente l'utilisation du processeur, vous pouvez visualiser les modifications dans les diff�rents types de mou interruption / proc / fichier softirqs, � la fin de d�terminer quel type d'interruption logicielle de la question. Par exemple, il a �t� constat� que le r�seau re�oit des perturbations caus�es par, vous pouvez aller de l'avant avec un outil d'analyse de r�seau pour analyser sar et tcpdump.

Notez que j'ai �num�r� dans cette figure, seul le noyau de plusieurs outils de performance, et tous ne sont pas r�pertori�s. Pour ce faire, d'une part, vous ne voulez pas vous faire peur avec beaucoup de liste d'outils. Au d�but de l'�tude ou l'acc�s � tous les outils de niche de base, il est pas n�cessairement une bonne chose. D'autre part, est l'espoir que vous allez mettre l'accent sur l'outil de base, apr�s tout, familier avec eux, vous pouvez r�soudre la plupart des probl�mes.

Ainsi, vous pouvez enregistrer cette image, les sch�mas de pens�e que l'analyse des performances du processeur. � partir du noyau de ces outils, � travers ces cas, je me suis offert dans une pratique r�elle de l'environnement, ils gagnent.

En tant que programmeur, l'optimisation des performances est d'�viter pas les choses, le travail est aussi l'un des syst�me de logiciel est le plus difficile, mais tous les besoins d'ing�nieur � ma�triser les comp�tences de base. La colonne la plus caract�ristique exceptionnelle: Auteur de nombreuses ann�es d'exp�rience pratique, des id�es conduit cas, les indicateurs de base expliquent la performance Linux pour vous, les outils et l'observation correspondante, l'analyse et la m�thode de mise au point, apr�s l'�cole peut appliquer imm�diatement au travail dans leur propre optimisation dans.

Route de la soie

Apprenez � conna�tre la Chine

Comment analyser rapidement le goulot d'�tranglement du processeur du syst�me o�? (Vous ne connaissez pas les connaissances)