Jouer � la � r�duction des effectifs � du noyau, il vous suffit de faire

Auteur | Ali experts en d�veloppement de divertissement sans fil Springs City

Zebian | Tu Min

contour

Youku Youku Lecture noyau est d�velopp� dans une structure de pipeline SDK. Youku sur elle pour entreprendre une logique m�tier riche et flexible, sous la protection des diff�rences � chaque extr�mit� du syst�me, il est tr�s fiable, �volutive, SDK multi-plateforme joueur par excellence.

Cependant, la collaboration entre l'�quipe et l'it�ration du temps, mais aussi le noyau de bits en cours de lecture � pl�thorique. � empreinte m�moire est trop �lev�, l'utilisation de trop de threads, etc. En plus de ces questions aura une incidence sur l'exp�rience utilisateur en dehors, mais aussi limit� le nombre d'entreprises � atteindre un certain degr�, comme le programme multi-instance pour une courte vid�o. Par cons�quent, un besoin urgent de modules du noyau pour effectuer une transformation � l�g�re �. Les objectifs sont les suivants:

1) moins de threads

2) une plus petite m�moire

3) faible consommation d'�nergie

La transformation de l'ancien de p�che

Yoqoo la lecture bas� sur le noyau de pipelie met en uvre une structure de cadre est suit comme:

Comprend une couche d'interface, le processus indiqu� par les commandes du moteur et des messages, le message de mani�re transparente transmettre couche filtrante, la couche de corps du module de travail, et le module de module de rendu et le t�l�chargement de donn�es post-traitement.

Apr�s le peignage avec des tests, confirment nos fils du noyau vont jouer beaucoup plus que certains de l'open source jouent un noyau (comme ijkplayer), utilisation de la m�moire et la consommation d'�nergie des donn�es vid�o et d'autres �galement d�savantag�s par rapport aux produits concurrents. Nous devons donc jouer notre tour du noyau de mises � jour.

Processus de transformation en d�tail

La direction de notre transformation comprennent: des fils, la m�moire, la consommation d'�nergie de ces trois zones. L'espoir d'atteindre tout au long du processus de jeu avec un minimum de fil, avec une m�moire minimale rend le jeu encore lisse, occupant des ressources cpu minimales rend le jeu plus durable.

La strat�gie adopt�e consiste � faire � plus �. Selon le processus de lecture, conserver le fil n�cessaire, enlever fil redondant, le fil r�utilisation r�utilisable. Ensuite, chaque revue les sujets retenus, utilisation de la m�moire et le taux d'occupation de test cpu est conforme aux attentes, si anormale puis une par une enqu�te.

discussion Streamline

Le nombre de threads utilis�s par le noyau avant optimisation de pr�s de 30, par rapport � d'autres joueurs open source beaucoup plus. Certains d'entre eux sont essentiels, d'autres threads peuvent �tre multiplex�s, et certains sont redondants logique peut �tre retir� directement. En peignant les threads de quitter, nous consid�rons le fil � set minimum � un des besoins de lecture, certains threads doit inclure les modules suivants:

moteur: une interface pour recevoir une commande, et un message signalant le noyau;
source: pour les donn�es lues et les donn�es entra�n�es pipeline d'�coulement vers l'arri�re;
d�codeur: un audio et vid�o, des donn�es audio et vid�o respectif pour d�coder;
consommateur: une audio et vid�o respectives, la synchronisation et pour le rendu;
hal tampon: tampon pour d�multiplexer et surveillance de l'�tat;
ykstream: Module analyse syntaxique et d'interagir avec des tranches et pour commander le module de t�l�chargement;
rendre: pour le rendu de gestion.

On peut voir jouer avec le processus de fil doit en effet neuf. Alors que d'autres threads en plus de la gestion pr�-charge, surveillance de la qualit�, et le jeu sous-titrage et ainsi seront activ�s en cas de besoin, le reste peut �tre retir�.

Rationaliser les �tapes sont comme suit:

1) retirer le fil de filtre en exc�s

Seulement lorsque le module de filtre est utilis� pour cr�er, est le message derri�re le pass-through, redondant bits, il peut �tre retir� directement. Le module cr�e un flux se d�place logiques pour pr�parer le moteur, ouvrir le canal de messages entre le moteur et le module, et un message de commande �mis ci-dessus indiqu� ci-dessous sans subir de filtre.

2) la suppression de la messagerie et gestionnaire d'horloge

Rapport message de canal avant optimisation confusion, certains rapports directement au moteur, une messagerie est signal� comme un transfert, puis rapport� au moteur. Cette logique de la couche de messagerie est un peu redondant, de sorte que le fil est supprim�, tous les messages sont signal�s par le moteur.

temps de synchronisation d'horloge en tant que gestionnaire d'utilisation, n'a pas besoin de ce fil, le fil est pr�sent comme une minuterie. Actuellement, le noyau pour utiliser la minuterie sur un ou deux points par un autre multiplexage logique de threads, en plus de d�pendance � l'�gard de la minuterie, ce fil peut �tre retir�.

3) la suppression des commandes d'interface et des messages de rapports fil du fil

Couche d'interface, plus d'un fil d�livr� un ordre de transport, est con�u pour les temps d'interface quand il y a un noyau de m�canisme forcestop. Apr�s plusieurs tours d'optimisation, les d�clencheurs du noyau forcestop consid�rablement r�duit, de sorte que ce fil est redondant peu, m�me si la situation appara�t bloqu�e, il y aura Anr pour remplacer le crash d'origine, ce fil peut �tre retir�.

Rapport message au fil d'�me est un message multi-couches ainsi que les exemples rapport�s, en fait, par la r�utilisation de code, ce fil n'est pas essentiel, il peut �tre retir�.

4) retirer les fils de d�multiplexage et de deux fils de cache

acquisition de donn�es de base a �t� le lieu le plus logique bouffi, il y a cinq fils pour mettre en uvre cette partie de la fonction avant l'optimisation. 3 peut �tre optimis�e pour retenir les fils de d�multiplexage et deux fils de cache peut �tre retir�.

5) retirer le module de gestionnaire de pr�-charge, et le d�codeur de sous-titres

Pr�chargement Manager ex�cuter ou non pour ouvrir le cas de pr�chargement fonctionnera, le besoin d'ajouter un contr�le de commutation, que dans l'ouverture pr�-charge.

Les donn�es de sous-titres est lu principalement, analys�, et le rendu, ce qui est diff�rent de l'audio et la vid�o, les informations textuelles peuvent aller directement � analyser apr�s avoir lu, le module d�codeur de sous-titres peut �tre retir�.

Apr�s optimisation, le fil doit avoir neuf, ainsi que suivi de la qualit� de lecture, r�serv� un total de 12 fils. La vid�o Non seulement 10.

la m�moire des cultures

Il y a quatre endroits qui consomment la m�moire: les donn�es de t�l�chargement de cache tampon, la ligne de conduite dans la m�moire tampon, enregistrer les informations de structure msg, et la m�moire de chaque objet de classe. � moins que la classe d'objets ne sont pas, sinon il n'y a pas beaucoup de place pour la coupe, il coupe donc de la m�moire cache, les lignes de conduite et de la structure de stockage d'information � trois points de vue de mettre en uvre.

1) enqu�te et utilisation de la m�moire ne r�pond pas aux attentes des collectivit�s locales

Fil analyse de d�couverte de donn�es de m�moire, la consommation de m�moire tampon de lecture enfiler beaucoup plus �lev�e que la valeur de consigne. Es exemples de donn�es pour chaque analyse, il a �t� constat�, en plus de la partie de donn�es, mais aussi sauv� contexte d'un codec, chaque paquet doit exister un. Chaque paquet de contexte codec doit �tre le m�me, il suffit de garder une bo�te. Le noyau a �t� fix�e pour cette partie de la logique irrationnelle, utilisation de la m�moire r�duite de pr�s d'un tiers.

2) la r�duction du tampon d'ant�m�moire

Ant�m�moire par rapport aux produits concurrents mis une grande, en prenant en compte le module de t�l�chargement a aussi un grand tampon, de sorte que le tampon du noyau peut rogner, l'�quilibre m�moire tampon de donn�es Caton peut �tre fix� � un niveau inf�rieur.

3) r�duire la ligne de tuyau utilisation de la m�moire

tuyau m�moire du noyau, plus la quantit� de tron�ons de ligne d'ant�m�moire secondaire 3,5M, en plus de la reconstruction de source � la m�moire cache secondaire, associ�e � l'optimisation de la conduite pool de m�moire tampon, cette m�moire peut �tre r�duite � 0,5.

4) la partie de structure de donn�es d'optimisation

Telles que les informations de configuration stock�es unMessage, chaque unMessage consomme 4k octets. Pour la sc�ne HLS fichiers de renseignement, chaque enregistrement va cr�er un unMessage, de sorte que le dossier ajoutera � plus de 6 Mo, sans compter d'autres parties de l'utilisation de unMessage. Par cons�quent, nous r��crivons une structure fonctionnelle similaire � remplacer, en gardant la unMessage d'interface, ce qui r�duit l'ouverture de la m�moire inutile de dissipation interne.

Apr�s l'optimisation, la m�moire de pic de joueur de base a chut� � 1/3 de l'original, ce qui r�duit consid�rablement le nombre de m�moire une seule instance.

Optimisation puissance

Les principaux facteurs qui influent sur la consommation sont les suivants: taux d'occupation cpu, la dur�e des demandes de r�seau, telles que l'�cran de la consommation d'�nergie et de l'�quipement audio. volume de luminosit� de l'�cran, etc. Ces facteurs sont fixes, la consommation d'�nergie est r�duite lorsque les principales demandes d'utilisation de cpu et r�seau des longues deux aspects � prendre en compte.

1) r�duire les proc�dures inutiles, r�duisant l'exc�s de fil

Cette partie a �t� achev�e en coupe de fil, pas d�crit en d�tail ici.

2) demander � la fente de commande de r�seau, �vitant longtemps connexion r�seau

Lorsqu'une demande de dispositif mobile � partir du r�seau, le dispositif de r�seau wifi / 4G sous tension rapidement, une grande partie de cette consommation. Par cons�quent, lire un morceau de morceaux de donn�es, puis attendre une meilleure fr�quence de petits morceaux de donn�es de demande. Caton compte d'autres facteurs, les param�tres par d�faut dans le cache du noyau consomment seulement apr�s moins de deux tiers pour relancer le t�l�chargement.

3) la structure de stockage de donn�es de remplacement, suppression de la logique d'acc�s redondant

L'enqu�te a constat� que chaque fois que des donn�es sont �crites en m�moire tampon, UCT occup� anormale, ce qui est incompatible avec les attentes. examiner le code pour trouver les valeurs aberrantes: Nous utilisons les donn�es vectorielles stock�es dans la structure de donn�es, chaque fois que les donn�es doivent pousser vers l'avant, lorsque le vecteur atteignent la taille de l'ordre de dizaines de milliers, cette op�ration sera cpu de consommation tr�s push_front. L'approche consiste � modifier le vecteur dans une liste, les donn�es d'�criture � la queue, lire l'en-t�te, le probl�me ne se reproduit pas.

4) Omx appels synchrones en asynchrone, ce qui r�duit cpu d�codage de temps

plate-forme Android, le module de solutions mat�rielles en utilisant un mode par d�faut d'appel synchrone. android9.0 la couche native que ce mod�le, le cycle sera op�ration file d'attente / dequeue, l'effort cpu. android9.0 et au-dessus, la couche native fournit des motifs d'appel asynchrone Omx, il ne consomme donc cpu travailler dans le d�codage appel de rappel de module apr�s la file d'attente / dequeue termin�e, moins synchrone. Comme indiqu� ci-dessous, asynchrone nettement clairsem�e que le nombre synchrone.

5) algorithme pour r�duire la vitesse de calcul redondants

examen a r�v�l� cpu fil audioconsumer consomment beaucoup plus que le d�codeur audio, ne r�pondent pas aux attentes, l'inspection a constat� que l'affaire ne tourne pas sur la vitesse, la vitesse passera la logique arithm�tique de corr�lation, ce qui entra�ne la consommation cpu anormale, avant et apr�s comparaison de restauration ci-dessous:

6) la couche noyau logique barrage implements

Atteindre barrage a �t� mis en uvre par la vue de la couche d'application, sous le d�luge de donn�es est grande, tr�s influer sur la consommation d'�nergie, m�me barrage de situation ambigu� appara�t. Par cons�quent consid�r� � mettre en uvre la couche de noyau d�plac� de barrage, des donn�es du noyau mis en uvre barrage re�ues rendent. Apr�s v�rification, la consommation d'�nergie est optimis�e rideau �lastique diminue 2/3.

Apr�s l'optimisation, l'op�ration de lecture moyenne a un taux d'occupation du processeur est inf�rieure � 7% (applications de test de milieu de gamme), 1080p / 90 minutes de la consommation vid�o r�duit de 12%, avec une am�lioration de 30% par rapport � avant l'optimisation.

r�sum�

� ce stade, jouer le noyau avant l'optimisation a �t� consid�rablement par rapport � la � r�duction des effectifs �. Apr�s la logique mince de code du noyau devient plus clair, concis et transfert de donn�es plus efficace, ce qui permet aux �tudiants de participer au d�veloppement du noyau peuvent �tre plus pr�occup�s par leur propre entreprise. Utilisation de la m�moire r�duit de mani�re significative parler uniquement du point de vue de la m�moire, deux instances du noyau avant l'optimisation, vous pouvez maintenant cr�er six, �largit consid�rablement la limite sup�rieure de la logique m�tier. la consommation d'�nergie devient plus faible, d'am�liorer grandement l'exp�rience de lecture de l'utilisateur.

Notez que: Notre entreprise complexe, impliqu� dans le d�veloppement de l'�quipe, il y a beaucoup, un certain temps apr�s l'it�ration de lib�ration, va in�vitablement faire le noyau devient de plus en plus pl�thorique. Nous devons donc surveiller la m�moire une plus grande latitude, la consommation d'�nergie pour chacun la version officielle, identifier les probl�mes modifi�s imm�diatement afin qu'il ne continuera d'accumuler ces probl�mes. Kernel �galement la reconstruction r�guli�re � petite �chelle, la suppression d'un code d�raisonnable, l'unit� de traitement logique commun et unifi�, de mani�re � faire de haute qualit� et le noyau maintenu.

groupe am�ricain d'une d�cennie, le plus grand plats � emporter du monde comment soutenir la fourniture de la plate-forme d'apprentissage automatique unique est de faire?

Bill Gates quitte Microsoft Conseil d'administration, WWDC d'Apple, Microsoft Assembl�e Build sont tenues en ligne � la place, la rouille 1.42.0 lib�ration | Geeks titres

Tencent combin� Acnet mention classification � grains fins, l'effet est � la derni�re SOTA | CVPR 2020

Ma recommandation IDE nuage pr�f�r�!

Solidit� des fonctionnalit�s avanc�es de l'�criture contrat intelligent

E retour de retour du personnel readme au travail: retour de travail � Wuhan, Hefei voler, puis revenir en arri�re et de choisir sa charte par la soci�t�

Route de la soie

Apprenez � conna�tre la Chine

Jouer � la � r�duction des effectifs � du noyau, il vous suffit de faire