Am�lioration de la performance des r�seaux de neurones

Lei Note du r�seau Feng: Cet article est une compilation du blog de la technologie de groupe de Lei Feng, le titre original Am�liorer la performance d'un r�seau de neurones, auteur Rohith Gandhi.

Traduction | Jia Yi Ping Zhao Xingyu si la finition | Jiang Fan

Un r�seau de neurones est un algorithme d'apprentissage automatique, la pr�cision de l'�tat de fournir un grand nombre des exemples. Cependant, de nombreuses fois, la pr�cision de notre r�seau construit peut ne pas �tre satisfaisant ou non peuvent nous conduire dans le haut du classement de la comp�tition des donn�es scientifiques. Nous sommes donc toujours � la recherche de meilleures fa�ons d'am�liorer la performance du mod�le. Il existe de nombreuses techniques qui peuvent nous aider � atteindre cet objectif. Suivez ces technologies pour les comprendre, et d'�tablir leur r�seau de neurones exact.

raccord v�rifi�

Assurez-vous que le r�seau de neurones pour fonctionner correctement sur les donn�es de test premi�re �tape consiste � v�rifier le r�seau de neurones est pas trop bonne forme. Bon, arr�t, ce qui est surajustement? valeur surapprentissage se produit au d�but du mod�le de donn�es de formation de m�moire plut�t que d'apprendre d'eux. Par cons�quent, lorsqu'une rencontre de mod�le de donn�es jamais vu avant, il peut ne pas fonctionner correctement. Pour vous donner une meilleure compr�hension, penchons-nous sur une analogie: nous aurons une bonne r�citation des �tudiants, et d'assumer sur le point d'avoir un test de math�matiques. Les bons souvenirs pour vous et vos amis commencent � apprendre d'un manuel. Vos amis se souviendront toutes les formules manuels, questions et r�ponses, mais d'autre part, vous �tes plus intelligent que lui, alors vous d�cidez bas�e sur l'intuition pour r�soudre les probl�mes, et de comprendre comment ces formules jouent un r�le. Jour de l'examen �. Si les documents de la question directement � partir du manuel, alors vous pouvez vous attendre � vos amis de faire mieux la m�moire forte, mais si la question porte sur les nouveaux aspects du probl�me de l'intuition, alors vous faire mieux aux examens, forte m�moire amis �chouent lamentablement.

Comment d�terminer si le mod�le surajustement? Vous pouvez recouper l'exactitude de la pr�cision du test et de la formation. Si la pr�cision de la formation est beaucoup plus �lev� que la pr�cision du test, vous pouvez supposer que le mod�le a �t� �quip�. Vous pouvez �galement dessiner point de pr�vision sur la carte pour v�rifier. Il y a quelques trucs pour �viter surajustement:

Les donn�es de r�gularisation (L1 ou L2)
Abandons - connexions interrompues au hasard entre les neurones, ce qui oblige le r�seau � trouver un nouveau chemin et conclut
Arr�t pr�coce - r�duire la formation du r�seau de neurones, ce qui r�duit les erreurs dans le jeu de test.

ajustement de param�tre Ultra

Super param�tres doivent �tre initialis�es � la valeur du r�seau, ces valeurs ne peuvent pas �tre apprises par le r�seau au cours de la formation. Par exemple, dans les r�seaux de neurones convolutionnels, un param�tre ultra est la taille du noyau, les couches du r�seau de neurones, la fonction d'activation, fonction de perte, optimis� pour une utilisation (descente de gradient, RMSprop), la taille du lot, le nombre de fois de la formation et ainsi de suite.

Chacun aura son r�seau de neurones pour optimiser l'ensemble hyper, ce jeux de param�tres auront la plus grande pr�cision. Vous pourriez demander, � il y a tellement de hyper-param�tres d'un r�seau de neurones Comment puis-je choisir de l'utiliser? � Malheureusement, il n'y a pas de fa�on claire pour sp�cifier un ensemble optimal de param�tres pour chaque super-r�seau de neurones, de sorte que le jeu optimal de param�tres est habituellement obtenue par essais et erreurs (essai et erreur). Ensuite, nous citerons une convention g�n�rale sur les param�tres super:

le taux d'apprentissage (Learning Rate) - s�lectionner un taux d'apprentissage optimal est tr�s important, car il d�termine si votre r�seau converge au minimum global. Choisissez un taux d'apprentissage �lev� est d'obtenir presque pas le minimum global, parce que vous avez une grande probabilit� directement au-dessus du minimum. Par cons�quent, il a �t� en vol stationnaire � proximit� du minimum global mais jamais convergent sur ce point. S�lectionnez un faible taux d'apprentissage peut aider un r�seau de neurones converge au minimum global, mais il en co�terait beaucoup de temps. Par cons�quent, nous devons utiliser beaucoup de temps pour former le r�seau. Un taux d'apprentissage petits peuvent tomber dans le r�seau d'optimum local. En d'autres termes, en raison du faible taux d'apprentissage, le r�seau convergent vers un minimum local et ne peut sauter. Par cons�quent, lors du r�glage du taux d'apprentissage, vous devez �tre prudent.
Architecture de r�seau (Network Architecture) - Maintenant n'est pas une architecture standard generera � un degr� �lev� de pr�cision dans tous les cas de test. Vous avez besoin d'exp�rimenter, essayer diff�rentes architectures, obtenir des conclusions � partir des r�sultats et essayer � nouveau. Une m�thode que je recommande est: utiliser une architecture �prouv�e pour remplacer votre propre cr�ation. Par exemple: pour les t�ches de reconnaissance d'image, vous avez r�seau VGG, Resnet (r�seau r�siduel), Google (Google) des r�seaux Inception. Ceux-ci sont open source, et a �t� d�montr� un haut degr� de pr�cision, de sorte que vous pouvez r�utiliser leur architecture pour affiner les selon vos besoins.
m�thodes d'optimisation et la perte de fonction (optimiseurs et la fonction de perte) - Pour une mani�re optimis�e et la perte de fonction, nous avons beaucoup d'options � choisir. En fait, le cas �ch�ant, vous pouvez m�me personnaliser la fonction de perte. Mais la m�thode la plus commune est l'algorithme d'optimisation RMSprop, descente de gradient stochastique (Stochastic gradient descente) algorithme Algorithme et Adam. Ces m�thodes d'optimisation peuvent �tre appliqu�es � la plupart des situations. Pour la fonction g�n�rale de la perte, si elle est utilis�e dans la t�che de classification, vous pouvez utiliser la classification de l'entropie crois�e (croix entropie cat�gorique). Si la t�che est dans la r�gression, la fonction de perte est couramment utilis�e dans l'erreur quadratique moyenne (MSE). Multi-param�tres pour d�boguer ces m�thodes ultra-optimisation, mais aussi essayer une combinaison de diff�rentes m�thodes d'optimisation et la perte de fonction.
Le nombre de la taille des lots (lots de taille) et l'int�grit� des donn�es de formation (Nombre de �poques) - Encore une fois, la taille des lots et des temps de formation ne sont pas efficaces pour tous les cas de valeurs communes. Vous avez besoin d'exp�rimenter et d'essayer diff�rentes valeurs. Dans des circonstances normales, la valeur de la taille des lots sont mis � 8,16,32. temps de formation pour laquelle des donn�es compl�tes sont d�termin�es par les pr�f�rences du d�veloppeur et la puissance de calcul lui-m�me.

fonction d'activation RELU

Fonction d'activation (activation de la fonction) - peut �tre ajout�e � la fonction de mappage non-lin�aire par l'activation de la sortie. la fonction d'activation est tr�s important de choisir une fonction d'activation appropri�e peut vous aider � mieux mod�le d'apprentissage. Maintenant, la fonction d'activation Relu est le plus largement utilis�, car il r�sout le probl�me de la disparition du gradient. Les premi�res ann�es, la fonction sigmo�de et Tanh est la plus fonction d'activation commune. Cependant, ils sont d�grad�s probl�matiques dispara�t. Autrement dit, dans le proc�d� de r�tropropagation, lorsqu'il est multipli� � la couche initiale, un gradient dispara�t en valeur. Cela emp�che r�seau de neurones est �tendu � un plus grand plusieurs couches d'Etat. Relu surmonter efficacement ce probl�me et donc le r�seau de neurones peut avoir une plus grande �chelle.

algorithmes int�gr�s

Si la pr�cision d'un seul r�seau de neurones est pas ce que vous voulez, vous pouvez �galement cr�er et int�grer un r�seau de neurones pour pr�dire leur performance ensemble. Vous pouvez s�lectionner des architectures de r�seaux de neurones, diff�rentes parties des donn�es pour les former, apr�s quoi ils � assembl�s � ainsi que la performance pr�dite de son acquisition en commun avec une grande pr�cision sur l'ensemble de test. Supposons que vous construisez un chats et les chiens, les chats classificateur 0 pour 1 pour les chiens. Lorsque les chats diff�rents classificateurs combinent algorithme d'int�gration de pr�cision conform�ment � la corr�lation de Pearson, il sera le classificateur unique respectif (corr�lation de Pearson) ascenseur. look Let un exemple, le test trois mod�les et d'�valuer leur exactitude.

Pearson corr�lation est �lev�e entre les trois mod�les. , Ils ne sont donc pas int�gr�s pour am�liorer la pr�cision. Si nous int�grons ces trois mod�les par vote � la majorit�, nous obtenons les r�sultats suivants.

Maintenant, regardons les trois autres mod�les, qui permettent de pr�voir la corr�lation de Pearson entre les r�sultats est tr�s faible.

Lorsque nous avons des r�sultats combin�s de ces trois � Les �l�ves du secondaire sont les suivants.

Vous pouvez voir les trois m�mes � moyenne - � l'int�gration, la performance du parti de corr�lation de Pearson � �tre plus bas que le c�t� �lev�.

Le manque de donn�es

Apr�s avoir utilis� toutes les techniques d�crites ci-dessus, si votre mod�le n'a toujours pas de meilleurs r�sultats sur votre jeu de test, il peut �tre attribu� � un manque de donn�es de formation. Lorsque le nombre de donn�es de formation disponibles est limit�, il y a beaucoup de cas d'utilisation. Si vous ne pouvez pas recueillir plus de donn�es, vous pouvez avoir recours � des donn�es am�lior�es (augmentation des donn�es) technologie.

La technologie d'am�lioration des donn�es

Si vous �tudiez les ensembles de donn�es d'image, vous pouvez couper � travers les images, en feuilletant, le recadrage et si al�atoire pour ajouter de nouvelles images pour l'ensemble de la formation. Cela peut fournir diff�rents exemples de formation du r�seau de neurones.

conclusion

Ces technologies sont consid�r�es comme les meilleures pratiques, et ont tendance � regarder tr�s efficace sur les caract�ristiques du mod�le pour am�liorer les performances d'apprentissage. Cet article peut sembler long, je vous remercie d'avoir lu tout au long, si l'une de ces techniques pour vous aider, je suis tr�s heureux de partager avec vous.

Blog site: https: //towardsdatascience.com/how-to-increase-the-accuracy-of-a-neural-network-9f5d1c6f407d

Ajouter des l�gendes Lei signaux micro-groupe Feng (leiphonefansub) comme ami

Remarques � Je veux rejoindre �, Pour une IA b�n�vole! Lei Feng r�seau (num�ro public: Lei Feng r�seau) Lei Feng r�seau

Lei Feng Lei Feng net net

Route de la soie

Apprenez � conna�tre la Chine

Am�lioration de la performance des r�seaux de neurones