137% d'acc�l�ration YOLOv3, 10 fois l'am�lioration des performances de recherche! Baidu Flying Paddle lance un artefact de compression de mod�le

Yunzhong depuis le temple d'Aofei Qubit Edit | Num�ro public QbitAI

Le mod�le d'apprentissage en profondeur est compress� et l'arme est lib�r�e.

Les derni�res nouvelles, apr�s quatre ans de polissage, Baidu a lanc� le dernier outil de compression de mod�le d'apprentissage en profondeur PaddleSlim1.0 .

Il comprend non seulement la quantification, la personnalisation, la distillation, la recherche de structure de mod�le, la recherche de mat�riel de mod�le et d'autres m�thodes couramment utilis�es dans la compression de mod�le d'apprentissage en profondeur.

Il est �galement appliqu� au SDK pour le visage de Baidu, qui peut �tre impl�ment� sur des appareils int�gr�s pour terminer le processus complet de d�tection, de suivi, de d�tection de corps vivant et de reconnaissance du visage en 0,3 seconde.

Figure 1 Terminal de reconnaissance faciale Baidu Gecko

Pour le d�ploiement de puissants r�seaux de neurones profonds sur des appareils mobiles embarqu�s, ainsi que divers sc�narios industriels, de telles fonctionnalit�s ont fourni de grands avantages, et sont �galement les exigences essentielles des applications industrielles actuelles des algorithmes d'apprentissage en profondeur.

Mais pour PaddleSlim1.0, ce n'est qu'une de ses derni�res fonctionnalit�s.

Par rapport � la version initiale du premier trimestre de 2019, PaddleSlim s'est consid�rablement am�lior� en termes de facilit� d'utilisation, d'adaptation des mod�les, de d�ploiement c�t� extr�mit� et d'am�lioration des performances.

La manifestation principale r�side dans les dix caract�ristiques suivantes.

Adresse du projet PaddleSlimV1.0: https://github.com/PaddlePaddle/PaddleSlim

1. Personnalisez le sch�ma de distillation YOLO, actualisez la pr�cision de la t�che de d�tection COCO

La distillation de mod�le consiste � extraire des informations utiles d'un r�seau complexe et � les d�placer vers un r�seau plus petit, de mani�re � �conomiser les ressources informatiques. PaddleSlim 1.0 prend en charge la m�thode de distillation traditionnelle et la m�thode de distillation bas�e sur FSP (Flow of Solution Procedure), et prend �galement en charge la strat�gie de distillation � perte personnalis�e pour diff�rentes t�ches.

Dans la t�che de classification d'ImageNet, la pr�cision de MobileNetV2 a encore �t� am�lior�e de 2,1%. De plus, PaddleSlim1.0 a �galement combin� avec Paddle Detection pour d�velopper un sch�ma de distillation pour les mod�les de la s�rie YOLO, qui a am�lior� la pr�cision des donn�es de d�tection de cible COCO de plus de 2%.

Tableau 1 Quelques r�sultats exp�rimentaux de la strat�gie de distillation

2. Bas� sur le mod�le de d�tection de cible de coupe sans perte de sensibilit�, la pr�cision ne diminue pas mais augmente apr�s la coupe

Afin de maximiser l'effet d'�lagage du mod�le, PaddleSlim a impl�ment� la solution d'�lagage bas�e sur la sensibilit� de la structure du r�seau dans la version pr�c�dente. PaddleSlim 1.0 prend en charge le calcul acc�l�r� parall�le multi-machine et multi-thread de la sensibilit� du mod�le. L'utilisateur peut dessiner le graphique de ligne de sensibilit� du mod�le � couper en fonction du r�sultat du calcul, puis s�lectionner un ensemble appropri� de taux de coupe � partir de celui-ci, ou appeler directement l'interface fournie par PaddleSlim pour g�n�rer automatiquement un ensemble appropri� de taux de coupe.

Figure 2 Graphique en courbes de sensibilit� de la couche de convolution

Le plus gros probl�me du recadrage de mod�le est de trouver avec pr�cision tous les nuds du r�seau qui sont li�s � la convolution en cours de d�coupage. L'approche habituelle est de traverser dans une perspective globale, mais l'�volutivit� n'est pas forte. PaddleSlim1.0 parcourt du point de vue des nuds de r�seau pour trouver tous les nuds li�s � la convolution cisaill�e, ce qui �quivaut � allouer la t�che de travers�e de r�seaux complexes � diff�rents types de nuds de r�seau, am�liorant ainsi l'�volutivit� Il peut prendre en charge n'importe quel r�seau complexe.

Dans les t�ches de d�tection de cible, une grande partie de l'�lagage peut �tre effectu�e sans r�duire la pr�cision du mod�le, mais la pr�cision des t�ches individuelles est am�lior�e apr�s l'�lagage.

Tableau 2 Quelques r�sultats exp�rimentaux de la m�thode de couture bas�e sur la sensibilit�

3. Prend en charge la quantification configurable en r�seau, ajoute une quantification hors ligne et augmente la vitesse de pr�diction du mod�le par multiples

Le but de la quantification � virgule fixe est de quantifier l'op�ration de nombre � virgule flottante (float32) dans le processus direct du r�seau neuronal en une op�ration enti�re (int8), afin d'atteindre l'objectif d'acc�l�rer le calcul. PaddleSlim1.0 prend �galement en charge la quantification configurable en r�seau en quantification � virgule fixe, qui peut quantifier le r�seau local sp�cifi� par l'utilisateur, c'est-�-dire que la couche sensible continue d'utiliser des calculs en virgule flottante pour r�duire la perte de pr�cision.

Afin de r�duire les frais g�n�raux de la formation de quantification, PaddleSlim1.0 a �galement ajout� une fonction de quantification hors ligne, et la plupart des t�ches peuvent atteindre une pr�cision de quantification �lev�e sans formation suppl�mentaire.

PaddleSlim 1.0 prend en charge la quantification des couches convolutives, des couches enti�rement connect�es, des couches d'activation, des couches BIAS et d'autres couches non pond�r�es. Les exp�riences montrent que la quantification � virgule fixe peut r�duire le mod�le � environ 1/4 de l'original. Sur la base du cadre de d�ploiement pr�dictif Paddle Lite, diff�rents mod�les peuvent atteindre une acc�l�ration de 1,7 � 2,2 fois.

Tableau 3 R�sultats de l'exp�rience de formation quantitative � point fixe partiel Int8

4. Nouvelle architecture NAS, recherche plus rapide et structure plus flexible

PaddleSlim 1.0 ouvre une API NAS plus flexible, pr�d�finie une strat�gie de recherche et un espace de recherche plus riches. L'espace de recherche et la strat�gie de recherche sont compl�tement d�coupl�s, ce qui est pratique pour les utilisateurs pour �tendre la strat�gie de recherche et l'espace de recherche.

Au niveau de la strat�gie de recherche, la version pr�c�dente prend d�j� en charge l'algorithme de recuit simul� (SA), qui a une convergence plus rapide et moins d'�tapes d'it�ration que l'algorithme RL traditionnel. Prend en charge la strat�gie de recherche distribu�e SA pour assurer une acc�l�ration lin�aire de la vitesse de recherche dans la carte 40GPU.

Cette mise � niveau ajoute la m�thode de recherche automatique One-Shot NAS actuellement populaire bas�e sur HyperNet. Le NAS One-Shot dissocie compl�tement la formation et la recherche en supernet et peut �tre appliqu� de mani�re flexible � diff�rentes contraintes. Au cours du processus de formation, la consommation de m�moire est faible, toutes les structures partagent le poids du super r�seau et le temps de recherche est consid�rablement acc�l�r�. En m�me temps, un algorithme de coh�rence de classement auto-supervis� est �galement d�velopp� pour garantir la coh�rence des performances du super r�seau et les performances finales du mod�le.

Au niveau de l'espace de recherche, de nouveaux types d'espaces de recherche tels que MobileNet, ResNet, Inception, etc. sont ajout�s. En m�me temps, plusieurs types diff�rents de piles d'espace de recherche sont pris en charge pour la recherche. Les utilisateurs peuvent �galement personnaliser l'espace de recherche.

Figure 3 Principe de recherche de structure de r�seau One-Shot

Tableau 4 Avantages de l'acc�l�ration de la recherche One-Shot sur les t�ches ImageNet

Les r�sultats exp�rimentaux montrent que, par rapport � la strat�gie de recherche SA � une seule carte, la strat�gie One-Shot � une seule carte atteint une vitesse de recherche qui est plus de 10 fois plus rapide.

5. La technologie de recherche de mat�riel innovante correspond automatiquement au mod�le optimal pour diff�rents mat�riels

En raison des diff�rences entre les diff�rentes architectures mat�rielles, un lourd travail d'adaptation mat�rielle est n�cessaire manuellement. La recherche mat�rielle consiste � r�soudre le probl�me de personnalisation de la structure de mod�le optimale pour un mat�riel sp�cifique pendant le processus d'adaptation mat�rielle.

Dans le processus de recherche de la structure de mod�le optimale, la fa�on d'obtenir rapidement les performances r�elles du mod�le sur le mat�riel est le premier probl�me � r�soudre. Les FLOP traditionnels ne peuvent pas repr�senter avec pr�cision les performances du mod�le sur l'environnement mat�riel r�el. PaddleSlim1.0 prend en charge la recherche de table d'op�rateur Une m�thode d'estimation du retard du r�seau.

Les utilisateurs doivent uniquement �tablir la table des retards de l'op�rateur sur le mat�riel, et sur la base de la table des retards de l'op�rateur, de l'�valuateur de retards du r�seau et de la structure du r�seau une fois le r�seau g�n�r�, vous pouvez obtenir rapidement le retard du r�seau sur le mat�riel.

Figure 4 Principe et processus de recherche de mat�riel SANAS

Tableau 5 Chiffre d'affaires apr�s l'acc�l�ration de la recherche mat�rielle pour chaque plate-forme mat�rielle (par rapport � MobileNetV2 sur la t�che ImageNet)

Six, nouveau cadre �volutif de distillation des connaissances � grande �chelle Panth�on

Prise en charge de la distillation distribu�e, pour obtenir une distillation des enseignants et des �tudiants sur diff�rents GPU ou diff�rentes machines. �vitez lorsque l'enseignant et l'�l�ve sont trop grands, il ne fonctionnera pas. Sur la t�che de distillation de classification d'image autonome, cette m�thode peut r�duire le temps de distillation d'environ 50%.

Figure 5 Sch�ma de principe de la distillation � grande �chelle

Sept, prise en charge de la classification, de la d�tection, de la segmentation de plusieurs sc�nes, combinaison gratuite de plusieurs strat�gies

PaddleSlim 1.0 prend en charge la combinaison de plusieurs strat�gies de compression pour atteindre le taux de compression le plus �lev�. Dans la t�che de classification, la taille du mod�le est r�duite de 70% et la pr�cision est augment�e de 1%.

Tableau 6 Effets de compression du mod�le partiel des t�ches de classification ImageNet

Dans la t�che de d�tection de cible, la t�che COCO a �t� augment�e de 0,6% et les FLOP ont �t� r�duits de 43%.

Tableau 7 Effet de compression du mod�le partiel du mod�le de d�tection de cible

8. Mise en uvre de la "formation mod�le > Compression du mod�le > Application de processus complet "D�ploiement pr�dictif", le mod�le compress� peut �tre d�ploy� de mani�re transparente sur divers sc�narios mat�riels

PaddleSlim est bas� sur l'�cologie technique parfaite des pagaies volantes, et r�alise la formation de "model- > Compression du mod�le > L'application compl�te du processus de �d�ploiement pr�dictif�, le mod�le compress� peut atterrir en toute transparence sur divers environnements mat�riels.

Figure 6 Processus de compression et de d�ploiement

Tableau 8 Donn�es chronophages du mod�le de d�tection cible d�ploy� sur le serveur et le mobile

Les donn�es de test montrent que MobileNetv1-YOLOv3 acc�l�re d'environ 127% � 137% sur diff�rents appareils mobiles.

Tableau 9 Performances des composants du mod�le de classification ImageNet d�ploy�s sur le serveur et le mobile

Neuf, conception d'interface l�g�re, pour r�aliser le d�couplage de diverses strat�gies, r�duisant consid�rablement le temps de codage

PaddleSlim1.0 impl�mente une toute nouvelle conception d'interface et impl�mente ind�pendamment le d�couplage de code entre diff�rentes m�thodes de compression via des algorithmes. Chaque m�thode peut �tre utilis�e ind�pendamment ou m�lang�e, ce qui r�duit consid�rablement le temps d'encodage. De plus, la conception de l'interface est plus simple: les utilisateurs n'ont qu'� ajouter les lignes de code suivantes au projet d'origine pour obtenir rapidement la compression du mod�le.

Ensuite, nous construisons un mod�le de classification d'images MobileNetV1 et d�coupons deux des couches convolutionnelles. Observez les FLOP d�coup�s. Le code est le suivant:

# Construire un r�seau pagaie d'importation importer paddle.fluid comme fluide importer paddleslim aussi mince exe, train_program, val_program, entr�es, sorties = slim.models.image_classification ("MobileNet", 10, use_gpu = False) print ("FLOPs avant �lagage: {}". format (slim.analysis.flops (train_program))) # Coupeur de d�claration pruner = slim.prune.Pruner () # Recadrer le r�seau pruned_program, _, _ = pruner.prune (train_program fluid.global_scope (), params =, rapports = * 2, place = fluide.CPUPlace ()) # Voir les FLOP print ("FLOPs avant �lagage: {}". format (paddleslim.analysis.flops (train_program)))

Si vous souhaitez comprendre et utiliser le code complet, veuillez ouvrir le lien ci-dessous pour afficher l'exemple de code complet de la coupe du canal du mod�le de classification d'image: https://aistudio.baidu.com/aistudio/projectdetail/309947

Si vous souhaitez en savoir plus sur les exemples de code de d�coupe, veuillez ouvrir le lien ci-dessous pour afficher le didacticiel de d�coupe avanc�: https://aistudio.baidu.com/aistudio/projectdetail/308077

Le code complet comme ci-dessus peut �tre ex�cut� en ligne sur la plate-forme de formation au d�veloppement Baidu AI Studio. Apr�s avoir entr� l'adresse du lien, s�lectionnez > �Cliquez sur Fork- > Lancer le projet ".

10. Des documents parfaits en chinois et en anglais offrent un support plus convivial aux d�veloppeurs et partenaires du monde entier

Les suggestions des d�veloppeurs synchrones ont am�lior� les documents chinois et ajout� des documents anglais pour fournir un support plus convivial aux d�veloppeurs et partenaires PaddleSlim du monde entier.

� l'heure actuelle, PaddleSlim a �t� commercialis� avec succ�s dans le premier kit de reconnaissance faciale gecko du secteur, la mesure de la temp�rature de l'IA et d'autres produits. Dans le 15e concours Baidu Star Developer Contest, PaddleSlim a �t� utilis� comme un outil important dans la comp�tition de miniaturisation de mod�les, et a �t� utilis� par plus de 1800 �quipes de 90% des universit�s � double rang du pays et de la recherche connexe.

(Pour plus de contenu du concours Baidu Star Developer Contest, ouvrez le lien ci-dessous:

� l'avenir, PaddleSlim est dispos� � s'associer aux d�veloppeurs, aux passionn�s et aux partenaires de l'IA pour explorer conjointement la technologie de pointe de la miniaturisation des mod�les et continuer � contribuer � l'application g�n�ralis�e de l'IA dans le domaine industriel.

Si vous souhaitez en savoir plus sur les h�lices volantes, veuillez vous r�f�rer aux documents suivants:

Adresse officielle du site Web: https://www.paddlepaddle.org.cn Adresse du projet PaddleSlim: https://github.com/PaddlePaddle/PaddleSlim

- Terminer -

Qubit QbitAI � Signature du titre

Suivez-nous et obtenez les derni�res mises � jour technologiques

Route de la soie

Apprenez � conna�tre la Chine